近日,小米被曝正在积极布局AI领域,计划搭建GPU万卡集群,以加速AI大模型的研发和应用。
小米自2016年起全面布局AI技术,其智能语音助理“小爱同学”月活跃量已达1.2亿台,AI技术已广泛应用于手机、智能家居、汽车等多个业务板块。2023年4月,小米正式组建了AI实验室大模型团队,由栾剑担任负责人,团队规模已扩展至3000多人。小米的大模型团队在成立之初便拥有6500张GPU资源,这不仅显示了小米在硬件资源上的雄厚实力,也预示着其在AI技术研发上的深厚积累。
小米计划通过搭建GPU万卡集群,进一步加大对AI大模型的投入。目前,小米的AI大模型技术已经取得了一些突破,例如在手机端实现了端侧AI大模型应用,部分场景效果接近云端60亿参数级别的大模型。
此外,小米的大语言模型“MiLM”已经通过大模型备案,并计划应用于小米的汽车、手机、智能家居等产品中,实现设备间的协同,推动人车家全生态战略。
在小米计划加强其在AI大模型领域布局的背景下,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉正式加入小米,担任小米AI实验室的领导角色,负责大模型团队的建设与研发工作。
罗福莉拥有丰富的AI研发经验,曾在北京大学获得硕士学位,并在阿里巴巴达摩院机器智能实验室工作期间主导开发了多语言预训练模型VECO。2022年,她加入DeepSeek,深度参与了MoE大模型DeepSeek-V2的开发,为该模型的成功奠定了基础。DeepSeek-V2是一种高效的多模态模型,在处理复杂自然语言任务时表现出色,支持128K上下文长度,并在多个基准测试中表现优异。
小米创始人雷军对公司在AI大模型领域的起步较晚表示担忧,因此决定以高薪挖角罗福莉,她的薪酬水平甚至达到了千万元级别。小米AI实验室早在2023年就成立了专门的大模型团队,并任命栾剑为负责人,罗福莉的加入将与栾剑的技术经验形成有力互补,共同推动小米在大模型技术的研发和应用。