AI人才有多火?据大陆媒体报导,小米创办人雷军亲自出马挖角,以年薪人民币千万元聘用「95后」AI「天才少女」罗福莉。证券时报指出,小雷军高薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一的罗福莉,领导小米AI大模型团队。
公开资料显示,罗福莉大学就读于北京师范大学计算机系,研究所毕业于北京大学计算语言学所。2019年,在北大读硕士的她在人工智能领域顶尖国际会议ACL发表八篇论文,登上了《知乎》热搜。罗福莉用本人知乎账号回应称,「这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。」
硕士毕业后,罗福莉先进入阿里达摩院,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模与算法研究,后来跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。
今年5月,在DeepSeek-V2发布后,罗福莉在《知乎》撰文,发表对DeepSeek-V2的看法。她表示,「单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队」,「外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王」。
事实上,罗福莉被重金招入小米,是小米全面发力AI大模型的其中一项措施。 2023年4月,小米正式组建了AI实验室大模型团队,并表示将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。
今年11月,小米成立了专门的AI平台部,小米的元老级技术工程师张铎为负责人。张铎本硕毕业于北京清华计算机系,曾被雷军公开称赞是「小米的大神」,送以「铎神」的称号。
小米集团总裁卢伟冰透露,预计2024年小米研发费用将达人民币240亿元,2025年更是将攀升至300亿元(约合新台币1,350亿元)。预计自2022年至2026年的五年内,小米的研发投入将超过人民币1,000亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
雷军曾在公开演讲中表示,小米做大模型的想法和许多公司不太一样,选择主力突破的是轻量化和本地部署。对于小米这样无论在手机或造车上都讲究「性价比」的公司而言,如何在烧钱的大模型业务中平衡成本,无疑是雷军考虑的核心问题。而这,或许也是拥有DeepSeek-V2研发背景的罗福莉被雷军看中的原因。