电影《放牛班春天剧照》
汽车「智能化」的下半场, AI 既是核心的竞争变量,也是关键赛场。
2025 年 1 月,国产开源大模型 DeepSeek 凭借其低成本、高性能的优势,为车企提供本地化部署大模型的机会,20 余家车企在短短几日内集体「倒戈」——吉利、奇瑞、比亚迪等车企纷纷官宣合作,将 DeepSeek 技术赋能智能座舱和智能驾驶等领域。
比亚迪率先打响「技术普惠战」。
2 月 10 日,比亚迪董事长王传福在深圳发表「智驾平权宣言」,宣布全系车型标配天神之眼高阶智驾系统,首次将智驾下探到十万元以下车型。
随着比亚迪宣布开启「全民智驾时代」,汽车种智能化的热度被推上了新的高潮。大众都在翘首以盼,其他车企如何接招、出招。
吉利宣布,将在 3 月初召开 AI 智能化战略发布会。这期它也没闲着,在三个月内完成三次关键落子:
从坚持全栈自研 AI 大模型,到深入融合开源大模型 DeepSeek,再到主动开源多模态大模型,吉利始终走在行业前列。
吉利 CEO 淦家阅也谈到,「2025 年,吉利将全面拥抱 AI,成为智能汽车 AI 科技的普及者」。
值得注意的是,同样是「普及者」,比亚迪和吉利的立足点是不同的。
前者聚焦智驾功能的平权,强调「智驾技术」的普惠,后者则是强调「AI 科技的普及」,试图以 AI 为纽带,编织一张覆盖全域的智能网络。
成为首个与 DeepSeek 融合的基础,是吉利拥有全栈自研的 AI 大模型——星睿 AI 大模型。
这得益于早在 2021 年,吉利便敏锐感知到 AI 技术对汽车产业的重塑潜力,率先启动AI战略布局。
回头看,吉利的每一步都稳扎稳打,且带有前瞻性。
从自研 AI 到形成「全场景 AI 大模型」再是「全域 AI」,既展现了吉利在 AI 领域的实力,也展现了其 AI 智能战略的野心。
「全场景」,展现了星睿 AI 大模型的强大能力。
星睿 AI 大模型涵盖语言大模型、多模态大模型、数字孪生大模型三大基础模型。
其中,多模态大模型能够将视觉、听觉等多元信息转化为可理解的数字语言,实现跨模态语义解析,同时具备强大的内容生成能力,从文字到图像、视频的转换游刃有余。
而语言大模型凭借超 10 万亿 Tokens 的训练量,展现出媲美人脑的逻辑推理能力,其独特的全栈自研情感模块更是实现了拟人化的情感交互。
数字孪生大模型则构建了一个虚实交融的平行世界,通过高精度的 3D 生成技术和 AI DRIVE 模型,大幅提升了研发效率和安全性。
通过三大基础模型的有机整合,吉利真正实现了从现实世界到虚拟世界的「全场景」覆盖。
「全域」,则深刻体现了吉利对AI技术应用的深度。
吉利,不止于造车。
对于用户而言,吉利能够融合车辆与手机、平板以及智能家居等智能设备,以提供全方位的智能享受。
同时,它也着眼于 B 端生态的数字化转型,助理上下游企业提升效率。最后,通过空天地协同网络的构建,实现智能服务的立体化延伸。
值得玩味的是,当行业仍陷于「重应用轻技术」的泥沼时,吉利选择全栈自研基础模型架构。
这不仅是打破 AI 卡脖子的「技术宣言」,更暗含对未来的预判——在智能化战役中,唯有掌握核心算法的车企,才能定义战场规则。
2 月 16 日,央视报道了这样一幅画面:工程师对银河 E8 说出一句「我有点累了,一会叫我」,车辆自动关闭车窗、调整座椅仰角、开启空调智能模式、还开启了氛围灯——整个过程无需任何唤醒词。
这一系列流畅且自然的操作,背后依靠的是吉利星睿大模型与 DeepSeek-R1 的深度耦合。
长期以来,车载 AI 始终被两大难题所困扰,即模糊意图理解与主动服务能力。
当用户发出的指令不够明确、较为模糊时,智能汽车的车机系统往往难以准确理解用户的真实意图,导致无法提供有效的服务。
这也是吉利与 DeepSeeK 融合后,首要改善的问题。
根据其融合后的技术图解,能看到吉利将意识和对应的处理模型进行了调整。
基础意图交给星睿 AI 大模型系统 1 处理;复杂意图则由星睿 VLM 感知大模型与 DeepSeek 推理大模型组成的系统 2 处理。
两个系统决策后,指令传至执行系统,控制智能驾驶、智能座舱、生成式交互和 UI Agent 交互等功能,同时决策过程会参考信号库、功能库和外部信源。
与 DeepSeek 融合后的模型,意图理解有了质的飞跃,不仅是「回答聪明」,更是「行动聪明」。
在功能调用方面,深度融合后的系统更是展现出了惊人的实力。它能够精准操控约 2000 个车载接口,实现 「一句话联动 15 个功能」的极致效率。
无论是调节车内温度、开启导航、播放音乐,还是控制车窗、座椅等,用户只需说出一句话,系统便能在 0.23 秒的极短时间内迅速响应并执行多个指令。
吉利还将利用 DeepSeek,对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行深度蒸馏训练,推动智能汽车从「被动响应」向「主动服务」转变。
DeepSeeK 不是「万能药」。
纯语言模型专注于文本数据的处理和生成,而现实物理世界还有图像、视频和音频等多模态。
纯语言模型对物理世界的理解能力不如多模态模型,其应用场景受到一定限制。
因此,吉利联合阶跃星辰开源两款多模态大模型:
在实测数据上,两款多模态大模型已经表现出其卓越实力,智能座舱的语音触发率从 2.1% 降至 0.3%,智驾训练的虚拟场景生成效率提升了 5 倍。
它们的开源,不仅为开源社区带来目前性能最强的多模态大模型,而且直击行业数据闭源垄断、开发周期长的问题。
以往,新势力车企通过多模态大模型构建了自己的技术优势,形成技术壁垒,部分车企只好转向采纳供应商的方案,如此一来,数据迭代受制于人。
开源这两款多模态大模型后,车企能够以低成本获取模型的源代码,打破以往闭源的垄断,真正掌握技术发展的主动权。
借助开源模型,车企可以大幅降低开发周期,不仅提高了开发效率,还降低了开发成本,加速技术普惠。
此外,Step-Video-T2V 视频生成模型在图像识别和场景模拟方面的强大性能,为 L3 级自动驾驶的传感器数据处理和决策算法优化提供了有力支持,使得 L3 级自动驾驶能够更快地从实验室走向现实。
写在最后
开源的本质是「以技术换生态」。
吉利通过释放模型「种子」,吸引开发者共建多模态技术标准,而星睿 AI 大模型则化身「生态接口」,高效对接产业链资源。
当技术标准由自己定义时,生态扩张便水到渠成。
当比亚迪以「智驾普及」点燃战火,吉利选择了一条更隐秘的路径——不做技术布道者,而做生态编织者。
从全栈自研到开源共建,从单点突破到全域智能,可以窥见,吉利的 AI 智能化战略的重要一环,是建立「技术+渠道+生态」三位一体的优势。