吉利给「AI大模型应用」撒下一颗种子

原创焉知新能源汽车 2025-02-24 19:34 296浏览 0评论 0点赞

示波器里的故事，分享赢好礼！ 一站式登记香港贸易发展局各个商贸展览

电影《放牛班春天剧照》

汽车「智能化」的下半场， AI 既是核心的竞争变量，也是关键赛场。

2025 年 1 月，国产开源大模型 DeepSeek 凭借其低成本、高性能的优势，为车企提供本地化部署大模型的机会，20 余家车企在短短几日内集体「倒戈」——吉利、奇瑞、比亚迪等车企纷纷官宣合作，将 DeepSeek 技术赋能智能座舱和智能驾驶等领域。

比亚迪率先打响「技术普惠战」。

2 月 10 日，比亚迪董事长王传福在深圳发表「智驾平权宣言」，宣布全系车型标配天神之眼高阶智驾系统，首次将智驾下探到十万元以下车型。

随着比亚迪宣布开启「全民智驾时代」，汽车种智能化的热度被推上了新的高潮。大众都在翘首以盼，其他车企如何接招、出招。

吉利宣布，将在 3 月初召开 AI 智能化战略发布会。这期它也没闲着，在三个月内完成三次关键落子：

2025 CES 期间，发布世界首个「智能汽车全域 AI 」技术体系，将依靠其自研的星睿 AI 大模型实现智驾、语音、整车控制、整车研发的多方位「端到端」；
2 月 6 日，首个宣布将 DeepSeeK-R1 与自研的星睿 AI 大模型深度融合，对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行深度蒸馏训练；
2 月 18 日，联合阶跃星辰宣布开源两款多模态大模型 — Step-Video-T2V 和 Step-Auto ，为行业带来最强的多模态大模型能力。

从坚持全栈自研 AI 大模型，到深入融合开源大模型 DeepSeek，再到主动开源多模态大模型，吉利始终走在行业前列。

吉利 CEO 淦家阅也谈到，「2025 年，吉利将全面拥抱 AI，成为智能汽车 AI 科技的普及者」。

值得注意的是，同样是「普及者」，比亚迪和吉利的立足点是不同的。

前者聚焦智驾功能的平权，强调「智驾技术」的普惠，后者则是强调「AI 科技的普及」，试图以 AI 为纽带，编织一张覆盖全域的智能网络。

01 自研大模型，技术向深

成为首个与 DeepSeek 融合的基础，是吉利拥有全栈自研的 AI 大模型——星睿 AI 大模型。

这得益于早在 2021 年，吉利便敏锐感知到 AI 技术对汽车产业的重塑潜力，率先启动AI战略布局。

回头看，吉利的每一步都稳扎稳打，且带有前瞻性。

2022 年：基于百亿级对话语料开发汽车行业首个专属对话大模型，初步实现自然语言交互能力；
2023 年：投入建设星睿智算中心，以每秒 81 亿亿次的算力为底座，构建 AI 研发的「超级引擎」；
2024 年：发布全栈自研的星睿 AI 大模型，覆盖智能座舱、自动驾驶、车路协同等全场景；
2025 年，发布行业首个「智能汽车全域 AI 」技术体系，实现算力中心、大模型、智能架构、智驾、智能座舱、芯片、手机、卫星、飞行器等全域 AI 智能化。

从自研 AI 到形成「全场景 AI 大模型」再是「全域 AI」，既展现了吉利在 AI 领域的实力，也展现了其 AI 智能战略的野心。

「全场景」，展现了星睿 AI 大模型的强大能力。

星睿 AI 大模型涵盖语言大模型、多模态大模型、数字孪生大模型三大基础模型。

其中，多模态大模型能够将视觉、听觉等多元信息转化为可理解的数字语言，实现跨模态语义解析，同时具备强大的内容生成能力，从文字到图像、视频的转换游刃有余。

而语言大模型凭借超 10 万亿 Tokens 的训练量，展现出媲美人脑的逻辑推理能力，其独特的全栈自研情感模块更是实现了拟人化的情感交互。

数字孪生大模型则构建了一个虚实交融的平行世界，通过高精度的 3D 生成技术和 AI DRIVE 模型，大幅提升了研发效率和安全性。

通过三大基础模型的有机整合，吉利真正实现了从现实世界到虚拟世界的「全场景」覆盖。

「全域」，则深刻体现了吉利对AI技术应用的深度。

吉利，不止于造车。

对于用户而言，吉利能够融合车辆与手机、平板以及智能家居等智能设备，以提供全方位的智能享受。

同时，它也着眼于 B 端生态的数字化转型，助理上下游企业提升效率。最后，通过空天地协同网络的构建，实现智能服务的立体化延伸。

值得玩味的是，当行业仍陷于「重应用轻技术」的泥沼时，吉利选择全栈自研基础模型架构。

这不仅是打破 AI 卡脖子的「技术宣言」，更暗含对未来的预判——在智能化战役中，唯有掌握核心算法的车企，才能定义战场规则。

02 与 DeepSeeK 的强强联合

2 月 16 日，央视报道了这样一幅画面：工程师对银河 E8 说出一句「我有点累了，一会叫我」，车辆自动关闭车窗、调整座椅仰角、开启空调智能模式、还开启了氛围灯——整个过程无需任何唤醒词。

这一系列流畅且自然的操作，背后依靠的是吉利星睿大模型与 DeepSeek-R1 的深度耦合。

长期以来，车载 AI 始终被两大难题所困扰，即模糊意图理解与主动服务能力。

当用户发出的指令不够明确、较为模糊时，智能汽车的车机系统往往难以准确理解用户的真实意图，导致无法提供有效的服务。

这也是吉利与 DeepSeeK 融合后，首要改善的问题。

根据其融合后的技术图解，能看到吉利将意识和对应的处理模型进行了调整。

基础意图交给星睿 AI 大模型系统 1 处理；复杂意图则由星睿 VLM 感知大模型与 DeepSeek 推理大模型组成的系统 2 处理。

两个系统决策后，指令传至执行系统，控制智能驾驶、智能座舱、生成式交互和 UI Agent 交互等功能，同时决策过程会参考信号库、功能库和外部信源。

与 DeepSeek 融合后的模型，意图理解有了质的飞跃，不仅是「回答聪明」，更是「行动聪明」。

在功能调用方面，深度融合后的系统更是展现出了惊人的实力。它能够精准操控约 2000 个车载接口，实现「一句话联动 15 个功能」的极致效率。

无论是调节车内温度、开启导航、播放音乐，还是控制车窗、座椅等，用户只需说出一句话，系统便能在 0.23 秒的极短时间内迅速响应并执行多个指令。

吉利还将利用 DeepSeek，对星睿车控 FunctionCall 大模型、汽车主动交互端侧大模型等进行深度蒸馏训练，推动智能汽车从「被动响应」向「主动服务」转变。

03 开源多模态大模型

DeepSeeK 不是「万能药」。

纯语言模型专注于文本数据的处理和生成，而现实物理世界还有图像、视频和音频等多模态。

纯语言模型对物理世界的理解能力不如多模态模型，其应用场景受到一定限制。

因此，吉利联合阶跃星辰开源两款多模态大模型：

Step-Video-T2V ，当前全球参数量最大的视频开源生成模型，具有长时序生成能力和无力合理性优化能力，可以帮助生成大量接近真实物理世界的真实场景；
Step-Audio，行业后款产品级开源语音交互模型，不仅支持方言及多种外语，还能识别8种情绪，更好地实现人机交互。

在实测数据上，两款多模态大模型已经表现出其卓越实力，智能座舱的语音触发率从 2.1% 降至 0.3%，智驾训练的虚拟场景生成效率提升了 5 倍。

它们的开源，不仅为开源社区带来目前性能最强的多模态大模型，而且直击行业数据闭源垄断、开发周期长的问题。

以往，新势力车企通过多模态大模型构建了自己的技术优势，形成技术壁垒，部分车企只好转向采纳供应商的方案，如此一来，数据迭代受制于人。

开源这两款多模态大模型后，车企能够以低成本获取模型的源代码，打破以往闭源的垄断，真正掌握技术发展的主动权。

借助开源模型，车企可以大幅降低开发周期，不仅提高了开发效率，还降低了开发成本，加速技术普惠。

此外，Step-Video-T2V 视频生成模型在图像识别和场景模拟方面的强大性能，为 L3 级自动驾驶的传感器数据处理和决策算法优化提供了有力支持，使得 L3 级自动驾驶能够更快地从实验室走向现实。

写在最后

开源的本质是「以技术换生态」。

吉利通过释放模型「种子」，吸引开发者共建多模态技术标准，而星睿 AI 大模型则化身「生态接口」，高效对接产业链资源。

当技术标准由自己定义时，生态扩张便水到渠成。

当比亚迪以「智驾普及」点燃战火，吉利选择了一条更隐秘的路径——不做技术布道者，而做生态编织者。

从全栈自研到开源共建，从单点突破到全域智能，可以窥见，吉利的 AI 智能化战略的重要一环，是建立「技术+渠道+生态」三位一体的优势。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

焉知新能源汽车新能源科技、智车科技

进入专栏

焉知新能源汽车新能源科技、智车科技

文章：235篇粉丝：9人

关注  私信

吉利给「AI大模型应用」撒下一颗种子

01

自研大模型，技术向深

02

与 DeepSeeK 的强强联合

03

开源多模态大模型

最近文章

热门文章

推荐

最新资讯