腾讯开放天籁AI降噪技术,助力听障人群“听得清”

南方都市报APP • 深圳资讯
原创2020-09-27 21:45
报料有奖

南都深圳报料电话:0755-82121212

南都讯 记者程洋 今年99公益日上,腾讯公益慈善基金会正式推出“科技公益互助计划”,旨在凝聚社会各界科研和技术志愿者,共同探索公益慈善的数字化创新,推动实现社会的可持续发展。

WechatIMG49.png

作为“科技公益互助计划”的首个落地场景,在9月27日国际聋人日之际,腾讯多媒体实验室联合腾讯公益慈善基金会、深圳市信息无障碍研究会等机构召开发布会,宣布发起“天籁行动”,通过面向公益开发者、设备厂商、NGO及行业免费开放腾讯天籁AI音频技术,帮助听障人群解决“听不清”难题,并邀请歌手周深作为公益大使,呼吁全社会关注听障人士身心康复,构建信息无障碍环境。 

本次“天籁行动”发起,也是腾讯继AI寻人、守护者计划等项目实践后,又一个“科技向善”落地的典型案例。发布会现场,深圳市残联党组书记、理事长侯伊莎在开场致辞中表示,期望“天籁行动”可以成为爱的载体,融入千家百户,助力减少城市角落里的无形障碍,普惠更多听障人士。

 

将AI降噪应用至人工耳蜗

环境噪音中声音识别率达94.24% 

作为腾讯旗下顶尖的音视频通信和处理研发团队,腾讯多媒体实验室致力于实时音视频通信、音视频编解码前沿算法研究、音视频国际标准、计算机视觉图像处理、端到端音视频质量评测,天籁技术是其经验和技术能力积累重要成果之一。 

发布会现场,腾讯多媒体实验室高级总监商世东介绍了腾讯天籁技术的技术研发背景。他表示,腾讯天籁是新一代实时音频技术,也是腾讯会议背后的关键技术,致力于让用户在实时音视频会议中可以“听得见、听得清、听得真”。腾讯会议通过嵌入腾讯天籁技术,解决了实时音视频会议场景下的各种挑战。 

现场,商世东还与参会嘉宾分享了当初将天籁音频技术与人工耳蜗产品结合的契机。他表示,在与听障人群的多次接触中,他了解到一些听障人群花费高昂的费用安装了人工耳蜗,但在机场、商场等比较嘈杂的公共环境中,依然面临着“听不清”的困扰。 

基于此,商世东和团队萌生了通过AI算法改善听障人群听觉体验的想法,并找到了国内最大的人工耳蜗厂商之一——诺尔康(Nurotron),双方一起讨论在当前人工耳蜗软硬件局限条件下的解决方案,经过长达半年的技术验证,从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。 

据诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,语音识别性能大幅提升,平均识别率达到96.28%,其中带噪语音识别率为93.38%,环境噪音中声音识别率达到94.24%;在手机App中植入天籁技术,手机双麦阵列降噪的信噪比提升 20dB,MOS分提升了0.3-0.5,对于改善听障人群听觉体验有着积极效果。

 

“天籁行动”正式发布 ,积极推动信息无障碍建设 

腾讯天籁技术正致力在无障碍沟通方面创造价值,帮助听障人群构建无障碍沟通环境。腾讯公司高级执行副总裁、云与智慧产业事业群总裁汤道生表示,科技在无障碍领域,有着强大的生命力。腾讯也将秉持“科技向善”的愿景,与各界公益组织和合作伙伴一道,以科技与平台的力量,助力无障碍社会的实现。 

汤道生称,互联网、智能手机、云计算、人工智能、大数据等新技术,增强了人类理解世界的能力,让我们看到、听到、想到更多。但还有一些特殊的群体,例如残障人士,常常被忽视,没能充分享受科技带来的便利。“如何利用科技手段帮助残障人士打破’障碍’,是包括腾讯在内的科技企业关注的方向。” 

为了提升腾讯天籁技术的普惠度,会上,腾讯多媒体实验室联合腾讯公益慈善基金会发起了“天籁行动”,面向听障人群社会责任领域的开发者、厂商及伙伴免费开放腾讯天籁技术,支持开展关注听障人群的社会责任公益实践,呼吁构建信息无障碍社会。深圳信息无障碍研究会、诺尔康、腾讯医典、腾讯会议等品牌及机构成为“天籁行动”首批成员。 

商世东表示,未来,腾讯多媒体实验室将携手腾讯公益慈善基金会等团队,凝聚社会各界的技术志愿者,共同探索听障公益的数字化创新,与各方共同努力,推动实现社会的可持续发展。

编辑:向丽宇

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626
2