阿里通义听悟上新,转写时长免费送!AI+教育成破圈发力点

南方都市报APP • AI前哨站
原创2024-03-19 21:37

3月19日,阿里大模型产品“通义听悟”上线多项新功能,包括音视频问答助手“小悟”、超长音视频自由提问、支持一键AI改写提炼、思维导图生成等。此外,针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”,向所有中国大陆高校师生直接赠送价值数千元的500小时音视频转写时长。

从阿里内部使用到全网发布,通义听悟相比通义家族的其他应用,上线更早也更高调。目前,通义听悟暂无toC收费的计划,未来通义听悟会嵌入通义千问App。

教育福利上线

教育邮箱认证即可得500小时免费时长

学生和科研群体对AI新工具有普遍需求,但目前音视频AI转写工具普遍收费,大部分是采用会员制的付费模式,或仅提供如每月1小时的少量免费时长。

南都记者登录通义听悟试用账号体验发现,用户目前可以通过登录、分享等方式获取转写时长。根据通义听悟用户分享的案例,用户大多通过PC使用通义听悟。目前,通义听悟支持Chrome、Edge浏览器插件、钉钉、微信小程序。

阿里通义听悟产品负责人杨帆在会上透露,作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计在各平台已有超500万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。

图片

在19日的上新发布会上,通义听悟重磅推出“高校公益计划”,推动AI算力普惠。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。按目前市面上语音厂商9.9元每小时的折扣价,这一教育福利价值数千元。

通义听悟能听、能看、能读,还能实现速览加精听,正成为学霸们的全新学习方式。杨帆介绍,调研中发现约一半用户是学生,他们活跃度相当高,有用通义听悟两倍速上网课的,还有在“发现”栏目中一天速览和精听数十档播客节目,“后台每天收到大量私信求时长”。用户分享中,一位来自大湾区的高校工作者Austin,自述其生活和教学培训中经常混杂中英粤语,在记录培训素材时,对通义听悟的多语种识别效果赞不绝口。

AI+教育,是否将成为通义听悟在通义家族内部实现差异化竞争优势的破圈发力点?

对此,阿里云智能公关总监朱迅垚现场回应称,听悟是其通义系列的拳头产品,团队目前主要还是立足服务好垂类教育群体的需求。杨帆也在会后与南都记者的交流中表示,目前通义听悟的“高校公益计划”已面向多家科研院所、高校陆续铺开视频公开课等方面合作,未来听悟也将借助阿里云平台的整体运营力量,向覆盖院校范围更广、服务教研人数更多的“AI+教育”场景迈进。

关键信息直接“问”出来

目前暂无用户收费计划,商业模式立足B端 

音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。

杨帆在上新发布会现场表示,通义听悟正为这一需求而生。据他介绍,本次上新最重磅的功能,音视频问答助手“小悟”,能实现关键信息直接“问”出来,支持对单个最长6小时、一次性上百条音视频的内容理解问答,一键将口语转为书面表达。用户可对超长音视频随心提问,并让AI 总结任意知识点,“甚至可以花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。”

图片

杨帆介绍通义听悟历程

杨帆介绍,“小悟”通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,可实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。

整体上看,通义听悟则保持了原有的产品设置,首页突出三个功能:开启实时记录、上传音视频、播客链接转写。这和2023年6月通义听悟启动公测时的定位一致。“作为一款工作学习AI助手,通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。”杨帆说。

上线以来,toC(用户)不收费的特点也被保留下来。对此,杨帆在现场回答媒体提问时表示,“目前我们没有任何对C端收费的计划,C端的应用承载的使命,更多是向所有用户展现阿里技术的研究方向。通过API(应用程序编程接口)的方式在B(企业)端实现商业化,是我们的产品策略”。

采写:南都记者 吕虹

编辑:黄莉玲

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626
3