再谈斯坦福学生团队抄袭，面壁智能李大海：坚持为开源做贡献

南方都市报APP • AI前哨站

综合2024-06-14 14:35

南都讯记者李玲见习记者杨柳 6月14日，第六届“北京智源大会”在北京中关村展示中心开幕。在开幕式及全体大会上，面壁智能CEO李大海再度回应近期斯坦福学生抄袭自家大模型事件。他表示，这只是个别学生组成的小团队所实施的行为，不关乎斯坦福大学。通过此事更加相信开源的力量，持续为开源做贡献将给公司带来正向收益。

南都此前报道，今年5月29日，斯坦福大学的一个AI团队发布Llama3-V开源模型，称这比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%，不仅尺寸比GPT-4V小近100倍，性能比肩GPT-4V、Gemini Ultra与Claude Opus，而且该大模型的训练成本仅不到500美元。

不过这一看似惊艳的成果，很快就引起开源社区工作者质疑。有网友发现，Llama3-V项目中有大量涉嫌抄袭面壁智能5月20日推出的MiniCPM-Llama3-V 2.5的内容——比如在模型结构和配置文件、代码等方面，二者高度雷同。率先揭露抄袭现象的网友告诉南都记者，Llama3-V团队的这种行为，“相当于把可口可乐换成可日可乐就说是自己的项目”。

6月2日，面壁智能团队表示，经核实，除了社区网友列出的证据外，还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样，可以识别出“清华简”战国古文字，“不仅对的一模一样，连错的都一模一样”。李大海也发文回应：技术创新不易，呼吁共建开放、合作、有信任的社区环境。

对于这一学术不端行为，6月4日凌晨，Llama3-V团队的两名成员—斯坦福大学计算机科学专业本科生Siddharth Sharma和Aksh Garg在社交媒体X上公开致歉，并表示会将Llama3-V模型悉数撤下。

6月14日，李大海现身北京智源大会，参与“通往AGI之路”的主题对话。期间被问及此事时，他再度作出回应，“完全没想到我们的工作，会以这种形式出圈，挺惶恐的。”

李大海强调，这其实是个别学生组成的小团队的个人行为，不代表校方。事发后，包括斯坦福大学人工智能实验室主任等人，都公开发文谴责。

他还表示，如果不是热心的开源社区工作者曝光，公司也无法及时纠正这一抄袭行为。在开源生态里，既有做原创工作的人，也有贡献需求和提供反馈的参与者，“因为这件事，我们更加坚定相信开源的力量……持续地做开源贡献，能够给公司带来正向的收益。”

值得一提的是，在Llama3-V团队抄袭事件后，面壁智能于6月5日官宣，将“小钢炮”MiniCPM免费商用。即日起，MiniCPM和MiniCPM-V权重将对学术研究完全开放，企业和个人在填写问卷登记后亦允许商业使用。

南都记者从面壁智能方面获悉，这是公司针对模型和技术的开源社区的回报活动，目的是为了进一步鼓励和参与开源社区技术协同创新。

【延伸阅读】

斯坦福两学生抄袭清华系大模型，是如何被发现的？对话打假者

编辑：李玲

更多报道请看专题：2024北京智源大会