国芯网[原:中国半导体论坛] 振兴国产半导体产业!
不拘中国、放眼世界!关注世界半导体论坛↓↓↓
6月3日消息,近日,美国斯坦福大学某AI团队发布了一个名为Llama3V的SOTA开源多模态模型,号称效果比肩GPT-4V、Gemini Ultra、Claude Opus,尺寸比GPT4-V小100倍,但训练成本仅需500美元。
网友质疑,该模型抄袭、套壳清华系AI公司面壁智能于5月中旬发布的8B多模态小模型MiniCPM-Llama3-V 2.5,两个模型在模型架构与代码上完全相同。
面对质疑,Llama3V团队称,他们只是使用了 MiniCPM-Llama3-V 2.5的tokenizer(分词器),并宣称在 MiniCPM-Llama3-V 2.5 发布前就开始了这项工作。
不过,面壁智能现已下场实锤。面壁智能团队测试发现,Llama3-V大模型能识别清华简,其训练数据的采集和标注均由清华NLP实验室和面壁智能团队完成,相关数据尚未对外公开。
而Llama3-V在识别清华简的文字时,结果和MiniCPM-Llama3-V 2.5不仅在正确的地方一模一样,在犯错的地方也雷同。
同时,两个模型在清华简上的高斯噪声也同样高度相似。此外,与MiniCPM-Llama3-V 2.5类似,Llama3-V也显示出了很强的OCR能力,甚至包括中文。
目前,该斯坦福团队成员已删除他们在X上官宣模型的推文,并将该项目在Github和HuggingFace上的库一并删除。
***************END***************
半导体公众号推荐
加群步骤:
第一步:扫描下方二维码,关注国芯网微信公众号。
第二步:在公众号里面回复“加群”,按照提示操作即可。
爆料|投稿|合作|社群
文章内容整理自网络,如有侵权请联系沟通
投稿或商务合作请联系iccountry
有偿新闻爆料请添加微信
iccountry