通义千问中文性能追平GPT-4?大模型开源与闭源争论升级

南方都市报APP • 政商数据
原创2024-05-10 17:43

在通义大模型发布一周年之际,阿里云再度公布新进展。5月9日,阿里云举行了阿里云AI峰会—北京站,正式发布通义千问2.5,据悉,该模型中文性能全面赶超GPT-4 Turbo。同时阿里云还公布,通义千问1100亿参数开源模型在多个基准测评收获最佳成绩,超越Llama-3-70B(meta的模型),成为开源领域最强大模型。

据介绍,北京站只是阿里云举办相关峰会的其中一个地点,接下来还会巡回在多个城市举行,并在每个城市邀请多个已应用阿里云相关模型的企业做分享。此次在北京站现场,小米、新浪微博等负责人出席分享。

南都记者关注到,在本次峰会中阿里云多番强调近期备受业界关注的大模型开源问题。阿里云方面认为,开源能把生态做强。目前国内的大模型头部厂商中,除了阿里云外,还有商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。

不过,据公开报道,百度创始人、董事长兼首席执行官李彦宏此前在一次内部谈话时表示,模型开源并不是一个“众人拾柴火焰高”的情况,这跟传统的软件开源不一样,闭源才有真正的商业模式,才能持续领先,才能聚集人才和算力。


最新版本通义千问中文性能追平GPT-4?

5月9日,阿里云方面透露,2023年4月问世以来,通义千问从初代模型升级至2.5版本。相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威测评结果,通义千问2.5得分追平GPT-4 Turbo。

图片

不过,南都记者关注到,4月25日OpenAI联合创始人兼首席执行官萨姆·奥尔特曼在斯坦福大学发表演讲时表示,GPT-5将比GPT-4智能很多,不过OpenAI仍保持闭源决策。

除此以外,大会当日阿里云还宣布,原通义千问APP更名为“通义APP”。据悉在这一年间,通义已发展出了业界领先的文生图、智能编码、文档解析、音视频理解等能力,企业客户和开发者可以通过API调用、模型下载等方式接入通义,个人用户可从APP、官网和小程序免费使用通义。

阿里云透露,目前通义大模型通过阿里云服务企业超9万,通义开源模型累计下载量突破700万。通义落地应用进程加速,现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域。

大会上,阿里云还宣布通义灵码推出企业版。通义灵码是国内用户规模第一的智能编码助手,2023年10月发布至今,通义灵码的插件下载量已超350万,每日推荐代码超3000万次,被开发者采纳的代码超亿行,是国内最受欢迎的智能编程助手。

在阿里云当天的大会上,通义还发布了1100亿参数开源模型Qwen1.5-110B。据透露,通义多模态模型和专有能力模型也具备业界顶尖影响力。在多个多模态标准测试中,通义千问视觉理解模型得分超越Gemini Ultra和GPT-4V,这款模型已在多家企业落地;代码大模型CodeQwen1.5-7B则是HuggingFace代码模型榜单Big Code的榜首模型。


阿里云反复强调开源能做强“生态”

目前,大模型的开源与非开源正在成为业界讨论的焦点。南都记者了解获悉,开源后模型的源代码、模型数据和模型训练的过程等内容都是公开可用的,这些模型可以供使用者下载、使用、修改、分享和重构。大模型极高的训练和迭代成本,让目前绝大部分的AI开发者和中小企业都无法负担,而开源则可以降低模型的二次开发门槛,有助于加速大模型应用的落地。

目前,大模型行业也正在形成两派。最先让AI走入普通人生活的OpenAI,经历了GPT-2开源、GPT-3仅公开论文、GPT-3只发布技术报告的时段,已越来越有非开源倾向。据悉,5月初在麻省理工学院与校长科恩布鲁斯探讨相关问题被问及OpenAI的闭源决策时,OpenAI联合创始人兼首席执行官萨姆·奥尔特曼对“闭源之问”选择了含糊回答的政策,并表示OpenAI已经提供了免费的AI工具——GPT-3.5了。

另一方面,以Meta为代表的大模型厂商也推动了一股大模型开源风潮。去年8月,通义也宣布加入开源行列,并沿着“全模态、全尺寸”开源路线陆续推出十多款模型。据阿里云方面透露,目前通义开源模型下载量已经超过700万。南都记者关注到,目前在多家国内大模型头部厂商中,商汤、智谱AI、零一万物等厂商发布的大模型都选择了开源。

在大会中,阿里云首席技术官周靖人反复提到了“生态”二字,这个“生态”就由模型开源来造就。他表示,阿里云认识到今天这样一个时代“生态”的重要性,“大模型的发展离不开整个生态,不单单是通义本身的发展,我们更希望今天能够把AI技术发展的能力,赋能给企业和开发者,能够让大家更快地推进AI技术一系列的创新和发展。”由此通义一直在坚持开源。

在接受媒体群访时周靖人也表示,模型之上的应用和创新非常多,不能仅仅局限于使用某一款闭源的框架或者说只能对接某一个形式。在他看来,不管在PC端还是手机端,大模型可以适配各种各样的场景,能够快速搭建更加复杂的业务,而这需要一个非常开放的开源生态去对接。

大模型的开源除了能加快模型落地应用,也可以反哺到模型本身的迭代升级中。模型开源后,在开发者社区的驱动和改进下,模型确实有可能获得更好的迭代。目前阿里云就有一个名为魔搭的开发者社区,据悉魔搭社区的开发者用户数已超过了500万。


“在大模型场景下开源是最贵的”

不过,在一些坚持闭源逻辑的厂商看来,开源大模型后开发者的参与对大模型迭代帮助不大。据公开报道,百度创始人、董事长兼首席执行官李彦宏就在2024百度AI开发者大会上发表主题演讲时表示,“在大模型场景下开源是最贵的。”李彦宏在现场结合文心大模型的实践给出解释:“开发者通过文心4.0降维裁剪出来的更小尺寸模型,比直接拿开源模型调出来的模型,在同等尺寸下的效果明显更好;同等效果下,成本明显更低。” 

根据公开报道,此前李彦宏还在一次内部谈话时表示,模型开源也不是一个“众人拾柴火焰高”的情况,这跟传统的软件开源,比如Linux、安卓等很不一样。而百度要开源还得自己去维护一套开源的版本,这并不划算;闭源才有真正的商业模式,才能持续领先,才能聚集人才和算力。

月之暗面创始人杨植麟也认为“开源追不上闭源”,在接受媒体采访时杨植麟曾表示,闭源是一个对市场的整合,会有人才聚集和资本聚集,最后一定是闭源更好。“如果我今天有一个领先的模型,开源出来,大概率不合理。反而是落后者可能会这么做,或者开源小模型,搅局嘛,反正不开源也没价值。”

不过,与李彦宏、杨植麟不同,周鸿祎在第二十七届哈佛中国论坛上就表示自己“相信开源的力量”,“一句话,今天没有开源就没有Linux,没有Linux就没有互联网,就连说这话的公司自己都借助了开源的力量才成长到今天。” 周鸿祎还表示,开源社区聚集的工程师和科学家的数量是闭源的数百倍。所以今年开源大模型只做了一年就已经超过了GPT-3.5的能力。他认为,未来一两年内,开源的力量很有可能会达到或者超过闭源的水平。 

值得一提的是,阿里云除了在布局开源模型,也在布局自己的闭源模型。在大会结束后接受媒体群访时,周靖人表示,“实际上(我们)形成的是一个开源和闭源的整体体系,我们希望把这些选择能够让我们的企业、开发者来做自主的、没有担忧的选择。”

杨植麟对此也曾表示,其认为开源和闭源接下来在大模型领域里会是互补的关系。“开源可以支持开发者去尝试各种创新的应用,而且在开发过程中可以对数据、训练过程、环境部署等合规性有更高的要求,场景也会更灵活。而闭源的话也会有自己的价值,比如说像未来的很多超级应用的入口,不管是生产力端还是娱乐消费端,都会有以闭源为核心的超级应用出现。这两种不同的模型其实是一定程度的互补,而不是冲突的关系,如何取舍其实是看每个公司不同的策略。我们(月之暗面)的策略是希望去打造超级应用,这是我们目前专注的地方,所以会把时间都花在上面。”


采写:南都记者 林文琪

编辑:田爱丽

对这篇文章有想法?跟我聊聊吧
南都新闻,未经授权不得转载。授权联系方式:
banquan@nandu.cc,020-87006626。