电动知家消息,近日,据多家媒体报道,小米创始人雷军以千万年薪招揽DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉,领导小米AI大模型团队。知情人士透露,雷军对小米在大模型领域发力太晚感到担忧,于是亲自下场挖人,罗福莉的薪酬水平或在千万元级别。
公开资料显示,罗福莉,女,95后,出生在四川省,罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学专业。2019年,还在北大读硕士的她在人工智能领域顶级国际会议ACL上发表8篇论文(其中2篇一作),登上了知乎热搜。罗福莉用本人知乎账号回应称,“这次投稿ACL是我近一年的产出,所以我认为自己是付出了足够的努力的,当然也可能也有运气成分加持。”
硕士毕业后,罗福莉先是进入阿里达摩院做人工智能研究,从事预训练语言模型相关的工作,负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。2022年,罗福莉加入幻方量化从事深度学习相关策略建模和算法研究,后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。今年5月,在DeepSeek-V2发布以后,罗福莉在知乎撰文,发表了对于DeepSeek-V2的看法。她表示,“单论DeepSeek-V2模型的中文水平,是真实处在国内外闭源模型的第一梯队”,“外加1元/百万输入Tokens的价格,只有GPT4价格的1/100,性价比之王”。
12月26日,据界面新闻等报道,小米正着手搭建自己的GPU万卡集群,将对AI大模型大力投入。小米大模型团队在成立时已有6500张GPU资源。
科技大厂正竞相投入万卡集群的建设。国际上,OpenAI、Meta等科技巨头,都争相部署万卡集群;在国内,运营商、头部互联网大厂、大型AI研发企业等先后入局,一些巨头甚至已开始迈向“十万卡集群”。
万卡集群是指由一万张及以上的加速卡(如GPU、TPU或其他专用AI加速芯片)组成的高性能计算系统,用以训练基础大模型。建设万卡集群是个“百亿元”成本的投入,其中单是GPU采购成本就高达几十亿元。
对于小米对大模型和AIGC看法的问题,雷军表示,小米在AI领域已经耕耘多年,有AI实验室、小爱同学、自动驾驶等团队。“对于大模型,我们当然会全力以赴,坚决拥抱。我们正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”雷军说。
值得一提的是,今年5月,小米宣布小米大语言模型MiLM正式通过大模型备案。通过备案后,小米大模型将逐步应用于小米公司的汽车、手机、智能家居等产品中,通过端云结合,既带来单个设备的智能提升,也实现场景内和场景间多设备的协同,为人车家全生态战略赋能。
近日精彩阅读:
首次!特斯拉进入政府采购目录 刚刚官宣!合肥新能源车重大突破!
突发!大众中国首席营销官被驱逐出境
人均146万,比亚迪重大员工激励!
某车企被曝“强制”加班! 往死里卷!某新势力:错过补贴,全额赔付电动知家,一个有价值的微信公众号!更多新能源电动汽车、无人驾驶最新行业资讯和专业知识,请关注“电动知家”微信公众号(微信号ev_home)。