近日,国内大模型公司面壁智能研发的开源模型“小钢炮”被斯坦福大学AI团队套壳抄袭一事,持续引发关注。6月5日,南都记者从面壁智能方面获悉,面壁团队在研发时内置了一个彩蛋,就是对清华简的识别能力。而斯坦福AI团队的开源模型展现出了一模一样的清华简识别能力,连做错的样例都一样,目前斯坦福团队已撤下相关模型。
Llama3-V展现出与“小钢炮”一样的清华简识别能力。
据了解,斯坦福大学一AI团队近日发布了一个名为Llama3-V的开源多模态模型,爆火之后就被网友扒出其模型结构、配置文件、代码等都与面壁智能开发的“小钢炮”MiniCPM-Llama3-V 2.5高度相似。一时间质疑声四起,当地时间6月3日,该团队公开致歉,称自己没有做好尽职调查以验证原创性。
6月5日,南都记者从面壁智能方面获悉,面壁智能联合创始人刘知远此前回应此事称,已经比较确信Llama3-V是对MiniCPM-Llama3-V 2.5套壳,有意思的证据是MiniCPM-Llama3-V2.5研发时内置了一个彩蛋,就是对清华简的识别能力。这是团队从清华简逐字扫描并标注的数据集,并未公开,而Llama3-V展现出了一模一样的清华简识别能力,连做错的样例都一样。
刘知远表示,开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点,他们在受到质疑后已在Huggingface删库。
此外,面壁智能CEO李大海也作出回应,称对这件事深表遗憾,一方面感慨这也是一种受到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、有信任的社区环境。
值得注意的是,此事也引发了关于开源社区共享代码的讨论。6月5日,面壁智能有关负责人向南都记者表示,当天上午公司举行了一场针对模型和技术的开源社区回报活动,目的是进一步鼓励和参与开源社区技术协同创新。
公开资料显示,面壁智能是一家人工智能大模型技术创新与应用落地赋能公司,创始团队均来自于清华大学NLP实验室,清华大学计算机系长聘副教授刘知远担任首席科学家。面壁智能联合创始人兼CTO曾国洋于1998年出生在成都,今年仅26岁。他8岁学习编程,后保送清华,大二期间加入清华大学NLP实验室。
早在2020年底,面壁智能团队就发布了国内首个中文大语言模型CPM-1。2022年8月,公司获近千万种子轮融资,并于去年3月完成数千万天使轮融资。
采写:南都记者 冯奕然
编辑:张亚莉
更多报道请看专题:人工智能前沿话题