【e公司观察】斯坦福团队抄袭国产大模型风波后 AI“打假”靠什么？

来源：证券时报网

2024-06-05 22:13:00

（原标题：【e公司观察】斯坦福团队抄袭国产大模型风波后 AI“打假”靠什么？）

在全球人工智能竞技日趋激烈的背景下，大模型抄袭事件并不罕见，国产大模型通常是被指责抄袭的一方；但近期斯坦福大学生AI团队爆出抄袭国产面壁大模型，整体事件反转速度之快、接力证伪力度之大，引发了中美双边“破圈”级关注。

5月29日，斯坦福大学两位本科生和一位工程师组成的AI团队，发布了Llama3-V开源模型，声称该模型只用了500美元成本，就能实现比肩头部开源多模态模型的性能效果；随后Llama3-V一度冲上了著名开源大模型排行榜HuggingFace首页。

但是HuggingFace用户们迅速发现该模型涉嫌“套壳”清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5，证伪参与群体后续扩大到其他开发者社区和X等社交平台，网友们罗列出两个模型结构、代码、实现效果高度相似等特征，还指出Llama3-V技术博客漏洞百出。作为回应，斯坦福团队声称他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer（词元生成器），并宣称自己在 MiniCPM发布前就开始了这项工作。

最后原创团队亲自下场举证，指出MiniCPM-Llama3-V 2.5能够识别特殊且罕见的战国时期古文字清华简，相关训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成，相关数据尚未对外公开，然而Llama3-V却具有相同能力，而且犯错情形都相同。

层层重压之下，6月4日斯坦福Llama3-V团队的两位作者在社交平台上向面壁MiniCPM团队正式道歉，也“甩锅”另一位失联的团队成员；斯坦福人工智能实验室主任Christopher David Manning发文谴责，并对MiniCPM这一中国开源模型表示赞扬。

对于本次“破圈”认可，面壁CEO李大海发表了感慨，对事件本身深表遗憾，同时呼吁共建开放、合作、有信任的社区环境；联合创始人刘知远也发文回应， Llama3-V团队未能遵守开源协议对前人成果尊重和致敬，严重破坏了开源共享的基石，表示三位作者还很年轻，“如果知错能改，善莫大焉”；同时客观指出中美AI领域的纵、横差距。

这场抄袭风波暂告段落，也让中美科技圈进入双向反思：有国内IT界从业人员感叹，此事是不是可以给国产大模型多一点信心？也有美国工程师感慨忽视中国机器学习生态系统的工作，感慨如果不是硅谷、常青藤这些光环加持，非美国的大模型能否会赢得这么多关注？

无论如何，在人工智能时代，即便谎言被再精致地包装，也无法成为真相；另一方面，与人类命运息息相关的人工智能，却抬高了认知门槛，客观上也制约了民众知情与参与，专业、开放、透明的开源社区已日渐成为AI时代信息重要的“去伪存真”渠道，但客观来讲，并不一定每个“套壳”都能被层层审视、最终落槌定论；开源社区“打假”的自发性、偶发性，恐怕很难兼顾到AI行业长期发展需要；AI行业的关键商业主体如何平衡技术发展与公开透明度，成为越发关键的命题。

日前，7名OpenAI前员工、4名现任匿名员工和谷歌DeepMind前任与现任员工就发布公开信，警告商业公司竞相开发人工智能产品存在风险，该行业缺乏足够的监管，并可能对吹哨人打击报复，呼吁对AI行业进行全面改革，包括提高透明度和保护吹哨人。信中指出，人工智能公司掌握着大量非公开信息，包括其系统的能力和局限性、保护措施的充分性以及不同类型伤害的风险水平。然而，公司目前只有很弱的义务向政府分享部分信息，而对民间社会则没有任何义务。

提升人工智能行业透明度与民众知情度，不仅是打假的需求，也是对行业安全发展的呼吁。人工智能行业的透明度，不能也不应该成为稀缺品。

特别推荐

A股强势反弹，三大指数齐涨

证券之星资讯

2024-06-28

沪市半年报即将开启，康欣新材领衔揭幕

证券之星资讯

2024-06-28

6月28日证券之星早间消息汇总：二十届三中全会7月15日至18日在北京召开

证券之星资讯

2024-06-28

首页股票财经基金导航

举报专区联系我们

【e公司观察】斯坦福团队抄袭国产大模型风波后 AI“打假”靠什么？

相关个股

相关阅读

特别推荐