近日斯坦福大学的 AI 研究团队的 Llama3-V 开源模型被指控抄袭了清华系明星创业公司面壁智能开发的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,在网上引起热议。
图源 Pexels
5 月 29 日一个斯坦福 AI 团队在网上宣称只需 500 美元就可训练出一个超越 GPT-4V 的 SOTA 多模态大模型,但很快网友就发现该项目使用的模型结构和代码与“小钢炮”高度相似,仅有部分变量名被更改。
面壁智能团队在 6 月 2 日深夜确认,斯坦福的模型不仅能识别出“清华简”中的战国古文字,而且连错误的识别结果都与 MiniCPM 模型完全一致。这些古文字数据是面壁智能团队花费数月时间从清华简上逐字扫描并人工标注的,且从未公开过,从而证实了抄袭的事实。
北京时间今早 1 点 27 分,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上对面壁 MiniCPM 团队就这一学术不端行为进行了正式道歉,并承诺将撤下所有 Llama3-V 模型。IT之家注意到,此前几小时,他们曾发布过一封类似内容的道歉信,但很快被删除。