蔚小理端到端:形式不同,悲欢相通

原创 远川汽车评论 2024-08-19 21:53


在中文互联网,马斯克日常被调侃为“源神”,用以嘲讽“特斯拉不开源,中国就造不出纯电车”的恨国党。

不过在智驾领域,特斯拉确实在相当长的时间里,通过举办AI Day分享技术细节的方式,扮演着引领行业前景方向的灯塔(注:灯塔可能不止一座)。

可从去年开始,特斯拉取消AI Day举办,只宣告技术进展,不再讲技术实现,留给外界的,只有采用端到端技术方案的FSD频传的捷报。今年,各家智驾企业翻开特斯拉给出的端到端习题,赫然在答案一栏处发现一行小字:解题过程略。

没有参考答案的端到端,究竟要怎么做?端到端智驾的研发,有没有合理商业模式的支撑?

问题率先给到造车新势力代表蔚小理。


01 

 打开黑箱



去年到今年上半年,国内智驾头部玩家的竞争主旋律,是在传统的模块化技术架构下,以人海战术比拼开城速度。

在此过程中,蔚小理的智驾团队都扩充到千人(或以上),星夜兼程地训练、测试、验证,攻克Corner Case。

特斯拉FSD验证了端到端的效果,让大家有机会从重复劳动中解放出来。但代价则是,智驾传统技术栈的各个模块可以被测试、验证,而端到端的智驾系统,是一整个只知结果不知过程的黑箱。蔚小理们走向端到端,面临的共同问题是:

在智驾这种强安全需求的功能下,完全的黑箱是不可接受的,势必要想办法打开这个黑箱,了解系统“为什么会想这么干”,或者至少让它的输出相对可控。

小鹏的选择是分段式端到端的渐进式路线,其技术方案是感知神经网络XNet+规划神经网络XPlanner+侧重场景理解的视觉语言模型XBrain。

小鹏分段式端到端


在端到端的技术鄙视链中,分段式端到端目前处于下游。

激进派认为分段式端到端仍然没有摆脱传统方案的范畴,尽管感知与规划都实现了神经网络化,但一个关键点没有改变——连接两个神经网络的依然是人类定义的接口,这意味着信息损失,以及大量人工标注,整个流程不利于全局最优,也不利于自动化。

但分段式端到端的优点也同样在此:有人类定义的接口,意味着会输出人类能看懂的中间结果,便于检查、定位问题,不至于牵一发而动全身,比如感知出问题了不用把整张网络都重新训练一遍。训练两个较小的模型拼起来,也比训练一个大端到端模型难度更低、消耗的算力资源更少。

更重要的是,这种方式理论上更容易保住智驾表现的下限。

7月30日,小鹏XNGP智驾全国全量开放的发布会后,何小鹏说,“楼要一层一层搭,想跳跃式发展或许有可能,但风险会极高“。

这句话被解读为对友商的劝诫。

7月初,理想在夏季发布会上介绍了正在开发中的一段式端到端方案:4D One Model 端到端。在一段式端到端中,感知与规划被打包到一张参数量数亿的神经网络中,老司机的驾驶视频成为最主要的训练数据。这一方案支持信息无损传递,数据流转的自动化程度更高,比小鹏、华为的端到端方案更加激进。

不过这一端到端方案存在泛化性不强、可解释性差、下限不稳定等问题,为此理想给端到端模型并联了一个22亿参数规模的VLM(Vision-Language Model,视觉语言模型)大模型。这个模型对复杂交通场景、交通文字标识有更强的理解力,能够为端到端模型的驾驶决策提供参考,提升智驾系统的表现。

理想端到端+VLM快慢系统智驾方案

8月,理想这套端到端+VLM快慢双系统智驾方案面向专业用户开启千人内测,官方预计今年底或明年初面向普通用户推送。

在此之前,理想在用户认知中智驾并不领先,给销售带来了不利影响(尤其对战问界时)。端到端+VLM被理想定义为智驾能力弯道超车、跻身第一梯队的关键战役。

相比之下,蔚来对端到端则采取了一种保守且激进的态度。

蔚来的保守在于,目前对端到端的使用非常局限,并未将其用于城市NoA,仅用于主动安全功能。7月11日,蔚来开始推送采用端到端方案的AEB,来解决传统方案AEB覆盖场景不足的问题。

蔚来激进的一面则是,今年晚些时候将推送的智驾,似乎准备跳过目前流行的端到端上车潮,直接前往下一个阶段:世界模型上车。

世界模型是智驾行业找到的最新方法论。2023年人工智能顶级会议CVPR上,特斯拉展示了世界模型的研发成果,以自动驾驶世界模型GAIA-1闻名业界的初创Wayve.ai,则在今年5月融资10亿美元。

世界模型通过学习海量真实驾驶场景视频,可以预测并生成未来一定时间内的驾驶场景视频,做出正确的驾驶决策。它的本质是时空推演。这与人类的驾驶行为相仿,老司机会在脑海中预判、推演其他交通参与者行为和交通流的变化,在此基础上规划驾驶操作。

世界模型比目前的端到端更进一步的是,它的核心任务不仅仅是给出规划路径,更有“预测驾驶场景的像素变化”。这个难度极高的任务,会逼迫模型不仅仅学习优秀驾驶员的行为,还必须广泛地学习交通知识与物理常识。

而蔚来在NIO IN上提出来的是一个难上加难的“世界模型PLUS”,它的复杂度更高、输出维度更多,这意味着可以和真值比对形成的监督信号更多,加速神经网络的训练,同时也可降低系统运行的黑箱程度。但代价是更高的开发难度。

蔚来世界模型,有大量的预测任务输出


作为参考,为了训练仅仅是用于demo、只输出规划路径和视频的世界模型GAIA-1,Wayve.ai就使用了4700小时的视频数据,以160块A100训练了15天。蔚来要训练的世界模型,需要的是高不止一个数量级的数据和算力资源。

而在训练完成之后,如何在保证精度和运行速度的前提下,将一个复杂而巨大的世界模型压缩、塞进算力和带宽都十分有限的Orin-X中,又是另一堆复杂的问题。

而在眼下,初试端到端(即使是谨慎采用)的蔚小理不同程度感受到了端到端“提高上限,降低下限”的效果。

比如小鹏的最新版本XNGP获得了前所未有的掉头能力,但被反馈称高速上智驾表现出现了回退。

理想正在内测中的端到端+VLM方案呈现出了上限高、下限飘的情况。

而蔚来已经推送的端到端AEB,既有在弯道盲区这种非标准场景极限规避鬼探头的表现,也被用户批评出现误刹增多。


02 

L4的研发,L2的前景?



在下限不好把握的情况下,车企还不约而同地转向端到端,很大程度上是因为端到端的上限,将带来足够大的用户体验提升和相应的商业机会。

但随着车企对端到端的涉入越深,一个问号在脑中经久不散:智驾的投入产出比,到底能不能算过账?

为了卖出更多的FSD,特斯拉今年3月将其订阅价格从199美元/月降至99美元/月(买断价格从1.2万美元降至8000美元)。然而今年5月国外数据咨询机构通过对3500名用户信用卡付费信息的分析,判断FSD的转化率仅有2%,引来马斯克在X上辟谣“转化率远超2%,拜托”。


不过远超2%也还远远不够。特斯拉正在德州工厂建设一个预计规模达到10万张H100/H200的超算集群,以每张H100 2.5万美元的优惠价格计算,仅购买计算卡的资本支出就会超过25亿美元(将其建设为数据中心并持续运营的成本更高),抵得上208万辆特斯拉一整年的FSD订阅费

国内车企的智驾商业模型更不乐观。

小鹏今年为AI准备的研发费用为35亿元,理想这个月则将智驾的资金门槛设定为10亿美元,但无论是小鹏的XNGP还是理想的NOA,都随高配车型标配,无需付费购买。蔚来未采用免费策略,高阶智驾功能NOP+定价每月380元,曾经短暂地取得过收入,但目前新车随车附赠1-2年NOP+免费使用期。

包括特斯拉在内,国内外高阶智驾仍处在赔本赚吆喝的阶段。

矛盾在于,在进入城市NOA的比拼、转向端到端范式后,这些企业的智驾研发强度实际已经面向L3乃至L4级自动驾驶,但主流市场对其的价值认定仍然是“不值得为软件额外付费的L2级辅助驾驶”。

要解决这个“期望价值与实际价值的落差“,看起来最有前景的方式是进入最大的L4自动驾驶市场,Robotaxi。

2018年,大摩为Waymo的Robotaxi开出了800亿美元估值。而马斯克的铁粉,方舟投资的木头姐今年6月给出一份预测,2029年特斯拉Robotaxi的收入“保守估计”会达到6030亿美元,助推特斯拉市值届时达到7万亿美元。

在此之前,马斯克在推上宣布将在8月推出Robotaxi车型(已经推迟到10月10日)。


03

商业回报还没大力出奇迹


要不要做Robotaxi,今年成为摆在蔚小理面前的热门问题。

对特斯拉跟得最近的小鹏,答案是YES。7月,何小鹏公开透露,小鹏汽车将在2026年推出Robotaxi。

何小鹏认为Robotaxi的硬件需求远比想象中复杂,但能力可以快速成长的端到端+大模型的软件算法组合,足以解决L4自动驾驶。何小鹏为团队定下的目标是2025年下半年,XNGP的体验对标谷歌Waymo的Robotaxi。

不过,造车本身已经是一项重资产生意,造出大批Robotaxi并经营一个无人驾驶打车平台,将无限拉长商业链条和投资回报周期。谷歌今年向Waymo注资50亿美元,小鹏不可能如此财大气粗。

6-7月,何小鹏先后拜访了滴滴CEO程维与Uber CEO达拉·科斯罗萨西。他说,小鹏并不想运营Robotaxi,而是希望向全球合作伙伴输出车型和自动驾驶技术。

Uber的Robotaxi,目前与现代合作


车企携端到端向Robotaxi的迫近,引来了不少L4自动驾驶从业者的反弹,包括前图森未来CEO侯晓迪、小马智行CTO楼天城、轻舟智航总裁侯聪。他们有的怒喷车企神话端到端,有的说车企相关能力体系不健全,但核心论点保持一致:

车企的高阶智驾虽然进步神速,但本质上还是在辅助驾驶的框架内设计,关注的核心目标是可用范围与成本,而Robotaxi最重要的是可靠性与安全性。目标的不同决定了两者难以使用相同的软硬件,车企的高阶智驾很难平滑过渡到Robotaxi[1][2][3]。

这正中李斌下怀。在7月27日的采访中,他明确表态,”不认为Robotaxi是让人兴奋的建树和商业模式“,并怒斥:

“智能驾驶的价值,不是把今天那么辛苦的专车司机、出租车司机的工作搞没了”。

他不看好robotaxi的另一个理由是,因为道路资源有限、政府部门管制,robotaxi不可能无限制投放,这让其很难拥有像软件云服务一样高边际收益的生意模式。

李斌一直坚持人们会想要拥有一部自己的车,因此蔚来智驾的目标是帮助驾驶员解放精力、减少事故,商业路线的关键词则是规模效应——面向普通用户多卖车,向足额用户收取高阶智驾的订阅费用,摊薄成本、获取收益。

不过,在成本高昂的智驾面前,蔚来不到60万的累积用户规模仍然不够,对外输出智驾能力成为一种选择。蔚来智驾负责人任少卿,最近首次表达了蔚来向其他车企开放智驾方案的意愿,就像蔚来开放换电那样。

相比之下,李想对智驾是“技术判断激进,商业策略保守”。

李想今年在重庆汽车论坛上立下Flag,端到端+VLM的组合,会在三年内实现L4级别自动驾驶。但不同之处在于,理想完全没有想过Robotaxi这门生意。甚至于,理想到目前为止仍没有表露出对智驾软件收费的兴趣,其官网挂着的LOGO仍然是“全场景智能驾驶,终身零订阅费”。

这与理想所处的竞争态势相关。过去一年,理想直面鸿蒙智行,销量承受了显著压力。而鸿蒙智行最锋利的矛,是华为的ADS智驾能力。

在鸿蒙智行众界携华为ADS 3.0(买断落地价约1万元)汹涌而来,进一步给理想上压力的时刻,理想比之前好用但又免费的AD MAX智驾,可以帮助抢下更多订单。与小鹏、蔚来不同,理想的智驾KPI并不是取得经营收入,而是为销量服务。

然而,在国内汽车行业进入淘汰赛的阶段,蔚小理的智驾业务不可能再长期处于交个朋友的状态。

一张训练卡的成本10万元起跳,一个千人团队的人力成本每年10亿起步,作为蔚小理本就最烧钱的业务之一,智驾迈上了更消耗资源的大力出奇迹道路,但能不能同样收获大力出奇迹的回报,还写满了不确定。



参考资料:

[1] 慎勇者侯晓迪,甲子光年

[2] 和楼天城谈Robotaxi:“L2越厉害,就离L4越远”, 腾讯汽车

[3] 特斯拉把 Robotaxi 想简单了 | 对话轻舟智航联合创始人侯聪,云见insight

评论
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 474浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 103浏览
  • 在不断发展的电子元件领域,继电器——作为切换电路的关键设备,正在经历前所未有的技术变革。固态继电器(SSR)和机械继电器之间的争论由来已久。然而,从未来发展的角度来看,固态继电器正逐渐占据上风。本文将从耐用性、速度和能效三个方面,全面剖析固态继电器为何更具优势,并探讨其在行业中的应用与发展趋势。1. 耐用性:经久耐用的设计机械继电器:机械继电器依靠物理触点完成电路切换。然而,随着时间的推移,这些触点因电弧、氧化和材料老化而逐渐磨损,导致其使用寿命有限。因此,它们更适合低频或对切换耐久性要求不高的
    腾恩科技-彭工 2025-01-10 16:15 97浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 483浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 512浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 461浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 452浏览
  • 随着全球向绿色能源转型的加速,对高效、可靠和环保元件的需求从未如此强烈。在这种背景下,国产固态继电器(SSR)在实现太阳能逆变器、风力涡轮机和储能系统等关键技术方面发挥着关键作用。本文探讨了绿色能源系统背景下中国固态继电器行业的前景,并强调了2025年的前景。 1.对绿色能源解决方案日益增长的需求绿色能源系统依靠先进的电源管理技术来最大限度地提高效率并最大限度地减少损失。固态继电器以其耐用性、快速开关速度和抗机械磨损而闻名,正日益成为传统机电继电器的首选。可再生能源(尤其是太阳能和风能
    克里雅半导体科技 2025-01-10 16:18 322浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 442浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 173浏览
  • 数字隔离芯片是现代电气工程师在进行电路设计时所必须考虑的一种电子元件,主要用于保护低压控制电路中敏感电子设备的稳定运行与操作人员的人身安全。其不仅能隔离两个或多个高低压回路之间的电气联系,还能防止漏电流、共模噪声与浪涌等干扰信号的传播,有效增强电路间信号传输的抗干扰能力,同时提升电子系统的电磁兼容性与通信稳定性。容耦隔离芯片的典型应用原理图值得一提的是,在电子电路中引入隔离措施会带来传输延迟、功耗增加、成本增加与尺寸增加等问题,而数字隔离芯片的目标就是尽可能消除这些不利影响,同时满足安全法规的要
    华普微HOPERF 2025-01-15 09:48 42浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 492浏览
  • 食物浪费已成为全球亟待解决的严峻挑战,并对环境和经济造成了重大影响。最新统计数据显示,全球高达三分之一的粮食在生产过程中损失或被无谓浪费,这不仅导致了资源消耗,还加剧了温室气体排放,并带来了巨大经济损失。全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,艾迈斯欧司朗基于AS7341多光谱传感器开发的创新应用来解决食物浪费这一全球性难题。其多光谱传感解决方案为农业与食品行业带来深远变革,该技术通过精确判定最佳收获时机,提升质量控制水平,并在整个供应链中有效减少浪费。 在2024
    艾迈斯欧司朗 2025-01-14 18:45 41浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦