美国当地时间 6 月 4 日凌晨,涉嫌抄袭中国大模型的美国斯坦福Aksh Garg 和 Siddharth Sharma,在 X 上公开承认此前发布的大模型是抄袭了中国大模型初创公司面壁智能的开源大模型,但表示真正写代码的是来自南加利福利亚大学的 Mustafa Aljadery,不过,此人已经联系不上了。
针对两人的这种言论,斯坦福人工智能实验室主任 Christopher Manning 也在 X 上发文谴责了上述团队的抄袭行为,并且表示“how not to own your mistakes”,为何不承认自己的错误,认为两人的言论是避重就轻、寻找借口、拒不承认。
至此,从 5 月 29 日开始的斯坦福 AI 团队,涉嫌抄袭中国大模型初创公司开源模型一事,应该是实锤了。接下来就看斯坦福会如何处置Aksh Garg 和 Siddharth Sharma,以及Mustafa Aljadery又会被南加利福利亚大学处罚了,这可谓是抄袭丢人丢出国了,国内的学生和企业也要引以为戒。
值得一提的是,此番被抄袭开源大模型的面壁智能,被媒体报道称,在今年 4 月,获得由华为哈勃领投、春华创投、北京人工智能产业投资基金等跟投的新一轮数亿元的融资。
01
实锤后仍狡辩
5 月 29 日,一个背景为斯坦福的 AI 团队,在网络上宣传,称只需要 500 美元,就可以训练出超越 GPT-4 的 SOTA 多模态大模型。
但,随后,这一届啥都能发现的网友,发现该团队发布的 Llama3-V 模型,使用的模型结构和代码,均与面壁智能在不久前发布的 MiniCPM-Llama3-V2.5类似,两者具备了相同的分词器,还包括了面壁智能新定义的特殊符号。
在 6 月 2 日,面壁智能团队证实,上述斯坦福背景的团队发布的大模型 Llama3-V 与 MiniCPM 一样,可以识别出战国古文字“清华简”,“不仅对得一模一样,连错得都一模一样”,据介绍,这一古文字是面壁智能团队从“清华简”上扫描并人工标注而来,尚未对外公布,这可以证实了抄袭行为。
面对这一实锤,到了美国当地时间 6 月 4 日凌晨,当事团队的两名成员发声了,承认了抄袭行为,但表示虽然是三人团队发起的 Llama3-V,但斯坦福的两名团队成员负责推广,而来自南加利福尼亚大学的 Mustafa Aljadery 则是负责写代码,但,从昨天起就联系不上了。
署名是看不到背锅的Mustafa Aljadery
对于两人这种拒不承认错误的行为,身为斯坦福人工智能实验室主任的Christopher Manning坐不住了,在Aksh Garg在 X 上发声的两个小时后,也发帖表示,“how not to own your mistakes”。
这里让人好奇的是,这位来自南加利福尼亚大学的Mustafa Aljadery ,到底又会如何发声呢?这个三人的团队到底会如何互相指责,还是Mustafa Aljadery就此沉默以对。两所大学又会如何处理这起抄袭行为呢?
也有网友人肉出来这个团队的三名成员,此前也属于抄袭的惯犯了。
额,抄袭也能上斯坦福、南加州这样的世界名校?
02
华为投资入场大模型之战
抄袭一事,除了是一场国际性的社死外(这也是值得中国公司和团队引以为鉴的),还侧面反映了中国大模型的能力,还算是跟得上国际步伐,尤其是美国步伐的。
可能抄袭团队也万万没想到,抄了万里之外的中国开源大模型,也能在短短几天内就被发现,并且连错的地方都一模一样,可能是,老外看不懂中国古汉字吧。也幸好有中国古汉字,要不,要实锤被抄袭可能还要多费一番功夫。
这一跨国抄袭行为,也让美国的 AI 研究人员,对中国的开源大模型产生了浓厚的兴趣,这也是一个好事,加强双边大模型更多的开源和交流,促进技术发展,虽然科学家有国界,科学是没有国界的。
实际上,在中国,大模型的之战,除了阿里全面下场,投资了六大大模型独角兽中的五家外,此番被抄袭的大模型初创公司面壁智能,也在今年 4 月份,获得了华为哈勃的投资,而且,在这一轮数亿元的投资中,华为哈勃还是领投,这意味着,华为也正式入场了。除了自研,也在投资。
值得一提的是,4 月刚获得华为哈勃投资,5 月底自家的开源大模型就被美国斯坦福的团队抄袭,这可能也是冥冥中的一种指示,过于玄学,这里就不说了。
反正,就是要不卑不亢、埋头科研。
在很多领域,中国的发展都是值得被肯定的。这不,在新能源领域,特斯拉被卷得不敢打价格战了,华为更是高举卷价值而不是卷价格的大旗。特斯拉和华为,都是向技术要高回报,所以,双方肯定是要大战智能驾驶的。
在大模型领域,虽然中国的算力能力暂时还是落后的,但是,数据和场景方面都不弱,这可能也更会鞭策中国大模型团队,在利用有限的算力下,去努力做出体验相当、能力相当的大模型,这也是更难的一条路。