斯坦福团队抄袭清华大模型！

中国半导体论坛 2024-06-03 21:26

【TI资料】专为高压系统设计的新型MCU 如何提升高压系统的实时性能?

国芯网[原:中国半导体论坛] 振兴国产半导体产业！

不拘中国、放眼世界！关注世界半导体论坛↓↓↓

6月3日消息，近日，美国斯坦福大学某AI团队发布了一个名为Llama3V的SOTA开源多模态模型，号称效果比肩GPT-4V、Gemini Ultra、Claude Opus，尺寸比GPT4-V小100倍，但训练成本仅需500美元。

网友质疑，该模型抄袭、套壳清华系AI公司面壁智能于5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5，两个模型在模型架构与代码上完全相同。

面对质疑，Llama3V团队称，他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer（分词器），并宣称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。

不过，面壁智能现已下场实锤。面壁智能团队测试发现，Llama3-V大模型能识别清华简，其训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成，相关数据尚未对外公开。

而Llama3-V在识别清华简的文字时，结果和MiniCPM-Llama3-V 2.5不仅在正确的地方一模一样，在犯错的地方也雷同。

同时，两个模型在清华简上的高斯噪声也同样高度相似。此外，与MiniCPM-Llama3-V 2.5类似，Llama3-V也显示出了很强的OCR能力，甚至包括中文。

目前，该斯坦福团队成员已删除他们在X上官宣模型的推文，并将该项目在Github和HuggingFace上的库一并删除。

***************END***************

半导体公众号推荐

半导体论坛百万微信群

加群步骤：

第一步：扫描下方二维码，关注国芯网微信公众号。

第二步：在公众号里面回复“加群”，按照提示操作即可。

爆料｜投稿｜合作｜社群

文章内容整理自网络，如有侵权请联系沟通

投稿或商务合作请联系iccountry

有偿新闻爆料请添加微信
iccountry

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

中国半导体论坛半导体行业网站，主要有芯片设计半导体制造芯片封装测试，中国半导体论坛是一个以电子技术交流为主的电子工程师论坛

进入专栏

中国半导体论坛半导体行业网站，主要有芯片设计半导体制造芯片封装测试，中国半导体论坛是一个以电子技术交流为主的电子工程师论坛

文章：4360篇粉丝：37人

最近文章