最近,DeepSeek V3凭借其卓越的性能、低成本的优势以及广泛的应用潜力,在AI领域树立了新的标杆。在DeepSeek V3圈内爆火的同时,其核心研发成员也成为各大科技企业争相招揽的对象。
图源:罗福莉个人公众号
近日,雷军以千万年薪挖角95后AI天才少女罗福莉,这一消息在科技圈引起了广泛关注。据称,DeepSeek核心研究员罗福莉成为了此次的重要人选。而小米更是直接开出了千万级薪酬,期望她能领军小米AI大模型团队的发展。
千万年薪挖角95后AI天才少女
据悉,罗福莉曾是DeepSeek开源大模型DeepSeek-V2的关键开发者之一,其本科就读于北京师范大学计算机专业,后保研到北京大学计算语言学研究所。
在学术领域,罗福莉表现突出,2019年在国际顶级会议ACL上发表了8篇论文,其中两篇为第一作者,迅速成为AI界的焦点。她的研究成果包括词义消歧方法和文本风格转换框架,这些成果在业界引起了轰动,使她赢得了“AI新星”的美誉。从她的谷歌学术主页可以看到,截至目前,被引数2160,今年被引次数最多。
罗福莉的职业经历同样令人瞩目。在加入DeepSeek之前,罗福莉曾在阿里巴巴达摩院机器智能实验室工作,主导开发了多语言预训练模型VECO。这一模型为机器提供了强大的数据和语言理解能力,使其在不同语言间自如转换。这些经验为她在DeepSeek-V2的开发中提供了坚实的基础。
罗福莉在DeepSeek-V2的开发中,深度参与了混合专家模型(Mixture of Experts, MoE)架构的设计与实现。这种架构通过在不同任务中动态选择专家,显著提升了模型的效率和性能。
罗福莉在国际顶级人工智能会议ACL上发表了多篇论文,并在知乎上撰文讨论了DeepSeek-V2的性能和优势。她表示,DeepSeek-V2在中文水平上处于国内外闭源模型的第一梯队,并且具有极高的性价比。最近,她因在DeepSeek-V2和DeepSeek-V3大模型中的关键贡献而声名鹊起,这些模型以其高性价比和卓越性能在全球范围内引起了广泛关注。
近日消息,小米创始人雷军以千万年薪成功挖角罗福莉。她将加入小米AI实验室,领导大模型团队。
DeepSeek-V3大模型为何受关注?
顺便介绍一下DeepSeek-V3大模型。这是一款由国内AI初创公司DeepSeek推出的开源大语言模型,其性能和性价比在业界引起了广泛关注。
DeepSeek V3在多项基准测试中表现出色,尤其是在代码生成、数学推理和长文本处理等领域。它在MMLU(多主题多选题)基准测试中取得了88.5%的准确率,超越了其他所有开源模型,并与GPT-4o和Claude-3.5 Sonnet等顶尖闭源模型相当。
在编程能力方面,DeepSeek V3在LiveCodeBench测试中的通过率达到了37.6%,领先于Llama 3.1的30.1%和Claude 3.5 Sonnet的32.8%。
在数学推理任务中,DeepSeek V3的表现也非常突出,例如在GSM8K测试中得分为90.2%。
更关键的是,DeepSeek V3的训练成本极低,仅为GPT-4o的二十分之一,售价也低,输入+输出价格约为GPT-4o的十分之一。
DeepSeek V3在教育、内容创作、科研探索、产品开发等多个领域都有广泛的应用前景。例如,它可以作为个性化学习助手、智能文档处理工具或自动化编程平台。
此外,DeepSeek V3还支持多语言编程和实时翻译功能,能够处理20种语言的文本。
小米的AI生态战略
实际上,小米早在2016年就开始布局AI,2017年成立AI实验室,并推出了语音助手“小爱同学”。不过,在大模型领域,小米相对低调,于2023年4月在小米AI实验室下设大模型团队,目标是从轻量级模型入手,逐步向通用语言大模型发展。目前,小米AI实验室,已壮大至1200余人,仅北京就开放了59个大模型相关职位。
目前,小米的“人车家”战略为其AI大模型提供了丰富的应用场景。其中,小米的智能驾驶系统通过接入多模态大模型技术,实现了从语音交互到复杂道路环境识别的全链路场景。该系统已经展现出“类人”的驾驶能力,能够应对多种复杂场景。此外,小米还宣布将视觉语言大模型(VLM)接入其SU7车型,可以识别复杂道路环境和特殊交通规则,并通过语音和文字给予实时提示。
在智能家居领域,小米的AIoT平台已连接超过8.61亿的IoT设备。小米的大模型技术深入渗透到AIoT生态中,从家电控制到安防监控,从语音助手到健康管理,大模型技术正赋能每一个AIoT设备。小米希望通过统一的AI框架和大模型算法,实现设备之间的数据共享和协同工作,为用户带来更加流畅和智能的体验。
此外,智能助手“小爱同学”、智能座舱和智能客服等场景也可以与AI大模型深度结合,形成强大的生态圈。不过,小米多模态交互与跨App联动等方面仍需改进。
而罗福莉的加入将有助于推动“人车家”这一战略的落地,提升小米在智能科技领域的竞争力。