面壁智能免费开放被斯坦福AI团队抄袭的模型!称系回报活动

南方都市报APP • 南都即时
原创2024-06-05 15:37

因被斯坦福AI团队抄袭引发关注后,6月5日,面壁智能官宣“小钢炮”MiniCPM免费商用,即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放。同日,面壁智能有关负责人向南都记者表示,这是公司针对模型和技术的开源社区的回报活动,目的是为了进一步鼓励和参与开源社区技术协同创新。

图片

面壁小钢炮MiniCPM免费商用。

面壁智能发布公告指出,面壁智能、OpenBMB和清华大学NLP实验室经讨论决定,将“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,企业和个人在填写问卷登记后亦允许商业使用。

公告称,多模态模型MiniCPM-Llama3-V 2.5可以实现难图长图长文本精准识别,量化后仅8G显存,4070显卡轻松推理,还支持30多种语言。该模型一经发布火遍全球,登顶开源交流平台GitHub、HuggingFace、Papers With Code Trending三榜首,当前MiniCPM-V系列下载总量已超24万。

5日,面壁智能有关负责人向南都记者表示,这是公司针对模型和技术的开源社区的回报活动,目的是为了进一步鼓励和参与开源社区技术协同创新。

值得注意的是,连日来,斯坦福大学AI团队发布的开源多模态模型Llama3-V,被指抄袭面壁智能研发的MiniCPM-Llama3-V 2.5,此事持续引发舆论关注。

南都此前报道,6月3日,面壁智能联合创始人刘知远就此事回应称,已经比较确信Llama3-V是对MiniCPM-Llama3-V 2.5套壳,有意思的证据是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋,就是对清华简的识别能力。这是团队从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。

刘知远表示,开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点,他们在受到质疑后已在Huggingface删库。

南都记者检索获悉,OpenBMB是由清华大学自然语言处理实验室和面壁智能共同支持发起的开源社区,旨在打造大规模预训练语言模型库与相关工具,降低大模型使用门槛。

公开资料显示,面壁智能是一家人工智能大模型技术创新与应用落地赋能公司,创始团队均来自于清华大学NLP实验室。早在2020年底,面壁智能团队就发布了国内首个中文大语言模型CPM-1。2022年8月,公司获近千万种子轮融资,并于去年3月完成数千万天使轮融资。

采写:南都记者 冯奕然

编辑:张亚莉

更多报道请看专题:人工智能前沿话题

南都新闻,未经授权不得转载。授权联系方式
banquan@nandu.cc. 020-87006626