2023年12月,特斯拉推出FSD V12,首次搭载端到端智驾大模型。
2024年至今,小鹏、华为、理想、蔚来等主机厂相继升级至端到端智能驾驶架构。
端到端方案主要可以分为以下四种类型:
感知层端到端:仅对感知模块进行端到端处理,通常是指通过神经网络直接从传感器输入中提取信息,减少人工规则的干预。
感知层端到端 + 决策规划层端到端:不仅对感知模块进行端到端处理,还将决策与规划模块纳入端到端架构。这种方案能够从感知到决策一体化地优化系统性能。
模块化端到端:将各个子模块进行优化,但仍保留一定的模块化处理。每个模块的输入输出更加流畅和直接。
One Model生成式一体化端到端 (世界模型):采用单一神经网络模型,将传统自动驾驶系统中的感知、预测、决策、规划等多模块整合为一体。此类模型采用更高效的训练方式,通过海量数据进行优化,减少对规则编写的依赖,实现全流程自动化。
这四种方案的共同特点是人工编写规则代码的依赖程度逐步降低。
其中,One Model端到端方案通过一个统一的神经网络将各个模块的功能合并,极大地提升了系统的灵活性与适应性。
当前,国内头部智驾主机厂普遍采用“感知层端到端 + 决策规划层端到端”方案,这与特斯拉的路径有所不同。
我们推测,特斯拉的FSD V12.1(2023年12月发布)可能采用了感知层端到端方案,而FSD V12.3(预计2024年3月发布)将过渡至One Model生成式一体化端到端方案。
1
端到端特点一:下限不稳定,但上限较高
端到端方案的一个关键特性是性能下限不稳定,特别是在应用初期,可能会遇到功能退步或性能波动等问题。
这是因为端到端方案在早期往往依赖于大量数据进行训练,可能会在特定场景下出现不确定性或功能不完善。
因此,短期内,国内一些车企仍可能会保留部分规则算法,以确保端到端智驾系统的基本稳定性。
然而,与传统模块化智驾方案相比,端到端方案具有明显优势。
由于端到端系统能够基于大量数据进行训练,并在实际道路场景中不断优化,其在不同场景下的适应性更强,系统误差和延时更小。
因此,端到端方案的性能上限更高,有潜力接近甚至超越人类驾驶水平。
2
端到端特点二:加速智驾算法迭代与性能提升
端到端架构的数据驱动特性使得智驾算法的迭代与优化过程大幅加速。
例如,小鹏汽车作为国内首家实现端到端大模型量产的车企,应用端到端大模型后,其版本迭代速度明显加快,推送周期由此前的约4个月缩短至约2个月。
同时,新增功能的落地速度和覆盖的场景也在加速。
我们认为,端到端的数据驱动升级模式大大降低了人工规则编写的需求,使得版本迭代与性能提升更加迅速。
随着模型不断优化,智能驾驶系统的稳定性与智能水平将持续提升。
3
端到端特点三:智驾系统与组织架构精简,推动降本
端到端智驾方案能够显著提高系统的集成度。
例如,通过将感知、预测、决策、规划等多个子系统合并为一个大模型,主机厂可以减少开发和维护的复杂度,进而降低整体研发成本。
具体来说,端到端方案的降本效果体现在以下两个方面:
智驾系统精简:传统的自动驾驶系统通常由多个独立的模块组成,每个模块需要单独开发、测试与维护。而端到端方案通过将多个模块整合为一个大模型,减少了系统的复杂性和冗余,优化了资源配置。
组织架构精简:端到端架构不再需要多个独立的团队来分别开发感知和决策模块。传统的规则编写人员和AI算法开发人员的角色逐渐趋于合并,团队协作变得更加高效。这种精简不仅能降低人力成本,还能提高研发效率。
长期来看,端到端架构的普及将推动智能驾驶领域的研发投入呈下降趋势,使得车企能够以更低的成本实现智驾技术的持续进步。