南都讯 记者李玲 见习记者杨柳 6月14日,第六届“北京智源大会”在北京中关村展示中心开幕。在开幕式及全体大会上,面壁智能CEO李大海再度回应近期斯坦福学生抄袭自家大模型事件。他表示,这只是个别学生组成的小团队所实施的行为,不关乎斯坦福大学。通过此事更加相信开源的力量,持续为开源做贡献将给公司带来正向收益。
南都此前报道,今年5月29日,斯坦福大学的一个AI团队发布Llama3-V开源模型,称这比当前开源SOTA视觉语言模型LLaVA的性能提高了10%-20%,不仅尺寸比GPT-4V小近100倍,性能比肩GPT-4V、Gemini Ultra与Claude Opus,而且该大模型的训练成本仅不到500美元。
不过这一看似惊艳的成果,很快就引起开源社区工作者质疑。有网友发现,Llama3-V项目中有大量涉嫌抄袭面壁智能5月20日推出的MiniCPM-Llama3-V 2.5的内容——比如在模型结构和配置文件、代码等方面,二者高度雷同。率先揭露抄袭现象的网友告诉南都记者,Llama3-V团队的这种行为,“相当于把可口可乐换成可日可乐就说是自己的项目”。
6月2日,面壁智能团队表示,经核实,除了社区网友列出的证据外,还发现Llama3-V项目与MiniCP-Llama3-V 2.5一样,可以识别出“清华简”战国古文字,“不仅对的一模一样,连错的都一模一样”。李大海也发文回应:技术创新不易,呼吁共建开放、合作、有信任的社区环境。
对于这一学术不端行为,6月4日凌晨,Llama3-V团队的两名成员—斯坦福大学计算机科学专业本科生Siddharth Sharma和Aksh Garg在社交媒体X上公开致歉,并表示会将Llama3-V模型悉数撤下。
6月14日,李大海现身北京智源大会,参与“通往AGI之路”的主题对话。期间被问及此事时,他再度作出回应,“完全没想到我们的工作,会以这种形式出圈,挺惶恐的。”
李大海强调,这其实是个别学生组成的小团队的个人行为,不代表校方。事发后,包括斯坦福大学人工智能实验室主任等人,都公开发文谴责。
他还表示,如果不是热心的开源社区工作者曝光,公司也无法及时纠正这一抄袭行为。在开源生态里,既有做原创工作的人,也有贡献需求和提供反馈的参与者,“因为这件事,我们更加坚定相信开源的力量……持续地做开源贡献,能够给公司带来正向的收益。”
值得一提的是,在Llama3-V团队抄袭事件后,面壁智能于6月5日官宣,将“小钢炮”MiniCPM免费商用。即日起,MiniCPM和MiniCPM-V权重将对学术研究完全开放,企业和个人在填写问卷登记后亦允许商业使用。
南都记者从面壁智能方面获悉,这是公司针对模型和技术的开源社区的回报活动,目的是为了进一步鼓励和参与开源社区技术协同创新。
【延伸阅读】
编辑:李玲
更多报道请看专题:2024北京智源大会