谈谈特斯拉FSDV12,基于自动驾驶算法从业者视角

谈思汽车 2023-08-31 11:40

 智能汽车安全新媒体 


日前,特斯拉CEO马斯克在其个人账号上直播测试了特斯拉最新版本的FSD自动驾驶系统,此次直播并未经过任何的剪辑处理,并为观众们带来了更加详细的讲解。

最新版本的FSD系统不再依赖于传统的高精地图和导航数据,而是完全依靠车载摄像头和神经网络来识别道路和交通情况,并做出相应的决策。

在驾驶过程中,马斯克提到,特斯拉的工程师没有为减速带、停车标志或环形交叉路口编写程序。但是车辆仍然能够很好地处理这些情况。通过使用视频对系统进行训练,让车辆自主学习。

从此次的直播来看,车辆整体表现还算优秀,但是在一个红路灯路口,特斯拉在绿灯时并没有按照路线左转,所以马斯克不得不对车辆进行了接管。不过,虽然此次自动驾驶还是令人印象深刻。

当时,想要直行的车辆在路口已经等了很久红灯,而在对面信号灯刚刚转为左转状态时,Model S竟突然跟着启动。


不过马斯克和旁坐的工程师反应迅速,连忙干预制止。



有意思的是,马斯克此次测试的地点,正是马克·扎克伯格的豪宅所在地,在直播的过程中,马斯克还调侃道,如果我们会遇到扎克伯格,我们可以挑战一下,打一架,让气氛变得更有趣”。

其实挺惊讶对这次demo的评价目前看来还是比较负面的,从消费者角度其实这可以理解,毕竟19min就接管一次,还是闯红灯这种极其普遍的驾驶场景中的致命错误,不过要知道这并非发布的用户版本,而是研发内测的Alpha版本,说一个研发版本不够完善稳定我个人感觉是有点吹毛求疵了。

作为技术从业者,我们更应该从更加技术的角度去看待FSD Version 12的这次demo,我个人认为这次demo给我带来的冲击和引起的思考是比较大的,甚至不输于以往的几次AI Day和Autonomous Day。 

首先要知道为什么大家对V12如此感兴趣。原因是老马在今年5月份就爆了一剂猛料,FSD V12会彻底转向端到端的自动驾驶技术方案,并且他还说V12会令FSD走出Beta阶段彻底成为一个正式版的产品,这个消息的噱头有多大呢,我感觉吧,其实不输于2020年公布FSD Beta将于当年10月发布,毕竟端到端的自动驾驶长期以来一直局限于学术研究中,Tesla之前唯二的先行者Comma仅仅只能进行高速方面的简单驾驶动作,Wayve则局限于英国少数地区的内部测试,而要知道FSD可是在广大的北美大陆可以任意开启的,这需要端到端系统体现的泛化性可以说和前两者相比要高出一个层级。


老马5月宣布Version12将转为端到端系统的Twitter(X)

业内普遍共识,端到端的自动驾驶系统理论上有比现今模块化的自动驾驶系统更高的能力上限,那么端到端系统为什么并没有成为业界主流呢?原因是端到端系统在提高模型上限的同时也无限放大了神经网络黑盒的不可解释的问题,而不可解释性会给研发迭代和问题解决造成巨大的负面影响,同时业界也没有端到端系统的成功先例,对于这种处于前沿科技无人区的技术方案绝大多数公司是没有勇气和实力敢为天下先的。

那作为端到端的V12首次公开亮相,我认为这次demo是毫无疑问的成功的,甚至是惊艳的,我的理由主要有以下三点:

1. 本次Demo展现了FSD V12端到端系统的成熟度

很多国内外的网友质疑这次Demo的路况场景都十分简单,Palo Alto的交通即使在下班高峰看起来也远远比不了国内大城市道路的拥挤繁杂,在这种情况下甚至还有一次严重问题接管,其实算不上优秀,对于这个观点我其实很认同。

然而作为自动驾驶的算法从业者,我对于这次demo的关注点其实不在场景的困难程度,因为理论上端到端的系统自然比基于规则和搜索的现今主流自动驾驶系统上限高很多,其核心问题在于下限可能很低。

端到端系统起步慢但上限高

今年CVPR 小鹏的Patrick有这样一个图表很好的说明了端到端系统的特性,可以看到端到端的系统最大问题在于模型能力起步较慢,同时黑盒不可解释不可控的性质会导致系统虽然能够处理复杂场景,但是简单场景很可能相比目前主流系统会产生退步,甚至是犯很多“弱智”的错误,同时因为业界缺乏端到端系统的工程实践经验,一些看似简单的fix无法通过增加规则代码迅速解决,因此尝试端端到端的方案大多数时候可能会是死在起跑线。

实际上我甚至认为如果哪家公司能够利用端到端的新技术架构来获得一个功能稳定性匹敌现有技术架构的自动驾驶系统,那么基本可以证明端到端系统是未来方向,因为理论上端到端系统在达到现有技术水平的那个时间点之后会很快继续提高水平将现有技术栈甩在身后,所以上图红蓝线交叉的点我认为可以称作端到端系统正收益的爆发点,一旦达到这一点基本上主流的技术范式就会被颠覆。

所以考虑到Tesla V12应该研发时间不长,我对于V12首秀能在随机选取的测试路线上在众多基础的转弯,变道,环岛,与行人交互等场景表现十分稳定平顺其实是非常惊讶的,而FSD V12的这次初次亮相部分说明了Tesla已经比较接近这个爆发点了,而这是我认为本次Demo传递的十分重要的信号。

2. 透漏了Tesla端到端自动驾驶的一些重要的思路,理念和实践经验

这次Demo另一个关键意义在于,通过Demo的一些细节以及直播过程中老马和Ashok的聊天透漏了很多Tesla对于端到端系统的实操经验和理解,而在端到端系统严重缺乏行业最佳实践的现在,这毫无疑问是对技术从业者具有启发意义的。

比如说很多人以为端到端是一个中间完全不透明的黑盒,但是实际上目前大多数比较深入的端到端实践都表明保持端到端系统中间结果的可解释性是很重要的。今年CVPR Best Paper UniAD就设计了一个端到端可导但是保留了中间子网络输出的端到端系统,而从直播中可以发现V12几乎完整的保留了当前FSD的感知结果输出,很显然至少在目前阶段Tesla的端到端技术方案也是保留中间功能子网络的路径。

那这个方案和普通的模块化方案有什么区别呢?其实重要区别在于各模块都去除了基于规则的代码,使得整个系统端到端可导,这使得整个系统作为一个整体直接对于驾驶动作进行训练优化成为可能。而传统的自动驾驶架构由于模块化以及并非端到端可导,使得各个功能模块只能通过各自训练优化自己的任务,最终结果是多个局部最优无法实现整个系统的全局最优。

CVPR 2023 Best Paper UniAD保留了整个系统中间的各个功能网络

V12几乎保留了全部的FSD感知结果可视化效果,但是似乎没有红绿灯可视化

这样的方案其实比较好理解,保留中间结果相当于通过人类先验知识把人类觉得有用的驾驶概念提取出来,给到端到端下游网络,同时给到网络的还有可能包括更加前端基础的输入,由下游决策规划网络自由选择使用哪些信息进行判断,这样的技术方案通过人类先验加快了端到端系统训练时性能起步速度,但是又保留了原始信息直接输入下游,减少了传统模块话系统中间输输出导致的信息损失。同时对中间结果进行分析也有助于确定系统犯错时问题的原因,提高解决问题的效率。

另外马斯克和Ashok在聊天过程中反复强调V12没有显式的把车道线,环岛,减速带等概念的处理办法灌输给系统,对于这点我的理解是V12并不是没有检测这些内容,而是在规控网络中没有显式的添加如何应对这些概念的规则,应对方法是由网络自己通过驾驶员视频学习得到的,例如软件没有显示要求自车要在车道线居中,模型自己从人类驾驶视频中学习何时应该居中,何时可以适当偏离中线以达成更加拟人的驾驶决策。

3. 展现了端到端自动驾驶系统相比传统架构优势的一些闪光点

虽然上面说了,我更加关注的是V12相比现有FSD是否在基础功能上存在性能回退,但是在这次Demo中我们也看到了很多V12的闪光点。这次的一个大家容易忽略的亮点其实就发生在老马第19min红绿灯接管之前。

当时的场景是这样的,直行的绿灯亮起但是前方路口拥堵,这时比较合理的驾驶决策是不要进入路口,等待目标路口空间出现再选择通过路口,而FSD V12也正是这样做(不要纠结国内国情,实际上我国的交规也是这样建议的,虽然很少有人按照执行),不过这也导致了这次绿灯V12没能通行,一直到绿灯变红,再下一次左转绿灯亮起的时候V12出现了误判,原因是V12目前似乎并不直接检测红绿灯的状态(可视化界面中好像不再出现红绿灯检测结果),而是综合参考了红绿灯情况和周围其他这辆行为来判断是否应该通行,所以当有红灯变绿,且周围左转车辆开始移动的时候,V12产生了错误判断,认为直行也已经可以通行,造成接管。

直行绿灯但路口拥堵,V12选择等待,没有进入路口

第二个亮点出现在一次途径点到达过程中,V12可以进行靠边停车的操作,而这也是目前的FSD所不具备的功能。而且Ashok在直播过程还透露,未来FSD甚至可以响应用户语音指令输入,例如用户可以告诉FSD向左换道,或者告诉FSD带自己到达前面沃尔玛,FSD就会根据语音指令分析其中语义信息并执行相应动作。

这里我的猜测是有可能在V12的模型中也有文字模态的加入,这也是目前自动驾驶系统中很少使用的新技术,随着大语言模型的爆炸式发展,在自动驾驶中融入语言模型这一方向也给人很大的遐想空间。

总之这次FSD V12的Demo可以说是自动驾驶行业内一次具有颠覆性的事件,虽然本次demo依然存在问题,也还无法完全证明端到端系统就是自动驾驶未来的前进方向,但是随着本次demo的展示,我相信端到端的自动驾驶很可能将摆脱空中楼阁的尴尬境地,有潜力成为未来几年内行业争先投入的重点。

作为行业领军的Tesla(也许有人不认同,但是我身边的从业者绝大多数对此是承认或者默认的)再次扮演了敢为天下先的角色,后续自动驾驶技术范式到底如何迭代,这次demo的意义可能比很多人想象的更加深远。


内容来源:

mp.weixin.qq.com/s/YisB7tMJt-o5VQ9UibFbrg

-  THE END  -

因文章部分文字及图片涉及到引用,如有侵权,请及时联系17316577586,我们将删除内容以保证您的权益。

谈思汽车 智能汽车安全新媒体
评论
  • 时源芯微 专业EMC解决方案提供商  为EMC创造可能(适用于高频时钟电路,提升EMC性能与信号稳定性)一、设计目标抑制电源噪声:阻断高频干扰(如DC-DC开关噪声)传入晶振电源。降低时钟抖动:确保晶振输出信号纯净,减少相位噪声。通过EMC测试:减少晶振谐波辐射(如30MHz~1GHz频段)。二、滤波电路架构典型拓扑:电源输入 → 磁珠(FB) → 大电容(C1) + 高频电容(C2) → 晶振VDD1. 磁珠(Ferrite Bead)选型阻抗特性:在目标频段(如100MHz~1GH
    时源芯微 2025-04-14 14:53 96浏览
  • 一、芯片的发展历程总结:1、晶体管的诞生(1)电子管时代 20世纪40年代,电子管体积庞大、功耗高、可靠性差,无法满足计算机小型化需求。(2)晶体管时代 1947年,贝尔实验室的肖克利、巴丁和布拉顿发明点接触晶体管,实现电子信号放大与开关功能,标志着固态电子时代的开端。 1956年,肖克利发明晶体管。(3)硅基晶体管时代 早期晶体管采用锗材料,但硅更耐高温、成本低,成为主流材料。2、集成电路的诞生与发展 1958年,德州仪器工程师基尔比用锗材料制成世界上第一块含多个晶体管的集成电路,同年仙童半导
    碧海长空 2025-04-15 09:30 107浏览
  • 三、芯片的制造1、制造核心流程 (1)晶圆制备:以高纯度硅为基底,通过拉晶、切片、抛光制成晶圆。 (2)光刻:光刻、离子注入、薄膜沉积、化学机械抛光。 (3)刻蚀与沉积:使用干法刻蚀(等离子体)精准切割图形,避免侧壁损伤。 (4)掺杂:注入离子形成PN结特性,实现晶体管开关功能。2、材料与工艺创新 (1)新材料应用: 高迁移率材料(FinFET中的应变硅、GaN在射频芯片中的应用); 新型封装技术(3D IC、TSV硅通孔)提升集成度。 (2)工艺创新: 制程从7nm到3nm,设计架构由F
    碧海长空 2025-04-15 11:33 172浏览
  • 展会名称:2025成都国际工业博览会(简称:成都工博会)展会日期:4月23 -25日展会地址:西部国际博览城展位号:15H-E010科士威传动将展示智能制造较新技术及全套解决方案。 2025年4月23-25日,中国西部国际博览城将迎来一场工业领域的年度盛会——2025成都国际工业博览会。这场以“创链新工业,共碳新未来”为主题的展会上,来自全球的600+ 家参展企业将齐聚一堂,共同展示智能制造产业链中的关键产品及解决方案,助力制造业向数字化、网络化、智能化转型。科士威传动将受邀参展。&n
    科士威传动 2025-04-14 17:55 83浏览
  • 一、磁场发生设备‌电磁铁‌:由铁芯和线圈组成,通过调节电流大小可产生3T以下的磁场,广泛应用于工业及实验室场景(如电磁起重机)。‌亥姆霍兹线圈‌:由一对平行共轴线圈组成,可在线圈间产生均匀磁场(几高斯至几百高斯),适用于物理实验中的磁场效应研究。‌螺线管‌:通过螺旋线圈产生长圆柱形均匀磁场,电流与磁场呈线性关系,常用于磁性材料研究及电子束聚焦。‌超导磁体‌:采用超导材料线圈,在低温下可产生3-20T的强磁场,用于核磁共振研究等高精度科研领域。‌多极电磁铁‌:支持四极、六极、八极等多极磁场,适用于
    锦正茂科技 2025-04-14 13:29 71浏览
  • 一、智能语音播报技术演进与市场需求随着人工智能技术的快速发展,TTS(Text-to-Speech)技术在商业场景中的应用呈现爆发式增长。在零售领域,智能收款机的语音播报功能已成为提升服务效率和用户体验的关键模块。WT3000T8作为新一代高性能语音合成芯片,凭借其优异的处理能力和灵活的功能配置,正在为收款机智能化升级提供核心技术支持。二、WT3000T8芯片技术特性解析硬件架构优势采用32位高性能处理器(主频240MHz),支持实时语音合成与多任务处理QFN32封装(4x4mm)实现小型化设计
    广州唯创电子 2025-04-15 08:53 93浏览
  •   高空 SAR 目标智能成像系统软件:多领域应用的前沿利器   高空 SAR(合成孔径雷达)目标智能成像系统软件,专门针对卫星、无人机等高空平台搭载的 SAR传感器数据,融合人工智能与图像处理技术,打造出的高效目标检测、识别及成像系统。此软件借助智能算法,显著提升 SAR图像分辨率、目标特征提取能力以及实时处理效率,为军事侦察、灾害监测、资源勘探等领域,提供关键技术支撑。   应用案例系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合
    华盛恒辉l58ll334744 2025-04-14 16:09 146浏览
  •   无人装备作战协同仿真系统软件:科技的关键支撑   无人装备作战协同仿真系统软件,作为一款综合性仿真平台,主要用于模拟无人机、无人车、无人艇等无人装备在复杂作战环境中的协同作战能力、任务规划、指挥控制以及性能评估。该系统通过搭建虚拟战场环境,支持多种无人装备协同作战仿真,为作战指挥、装备研发、战术训练和作战效能评估,提供科学依据。   应用案例   系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。   核心功能   虚拟战
    华盛恒辉l58ll334744 2025-04-14 17:24 87浏览
  • 在制造业或任何高度依赖产品质量的行业里,QA(质量保证)经理和QC(质量控制)经理,几乎是最容易被外界混淆的一对角色。两者的分工虽清晰,但职责和目标往往高度交叉。因此,当我们谈到“谁更有可能升任质量总监”时,这并不是一个简单的职位比较问题,而更像是对两种思维方式、职业路径和管理视角的深度考察。QC经理,问题终结者QC经理的世界,是充满数据、样本和判定标准的世界。他们是产品出厂前的最后一道防线,手里握着的是批次报告、不合格品记录、纠正措施流程……QC经理更像是一位“问题终结者”,目标是把不合格扼杀
    优思学院 2025-04-14 12:09 70浏览
  • 在当今汽车电子化和智能化快速发展的时代,车规级电子元器件的质量直接关系到汽车安全性能。三星作为全球领先的电子元器件制造商,其车规电容备受青睐。然而,选择一个靠谱的三星车规电容代理商至关重要。本文以行业领军企业北京贞光科技有限公司为例,深入剖析如何选择优质代理商。选择靠谱代理商的关键标准1. 授权资质与行业地位选择三星车规电容代理商首先要验证其授权资质及行业地位。北京贞光科技作为中国电子元器件行业的领军者,长期走在行业前沿,拥有完备的授权资质。公司专注于市场分销和整体布局,在电子元器件领域建立了卓
    贞光科技 2025-04-14 16:18 139浏览
  • 四、芯片封测技术及应用场景1、封装技术的发展历程 (1)DIP封装:早期分立元件封装,体积大、引脚少; (2)QFP封装:引脚密度提升,适用于早期集成电路。 (3)BGA封装:高密度互连,散热与信号传输优化; (4)3D封装:通过TSV(硅通孔)实现垂直堆叠,提升集成度(如HBM内存堆叠); (5)Chiplet封装:异质集成,将不同工艺节点的模块组合(如AMD的Zen3+架构)。 (6)SiP封装:集成多种功能芯片(如iPhone的A系列SoC整合CPU、GPU、射频模块)。2、芯片测试 (1
    碧海长空 2025-04-15 11:45 171浏览
  • 一、智能门锁市场痛点与技术革新随着智能家居的快速发展,电子门锁正从“密码解锁”向“无感交互”进化。然而,传统人体感应技术普遍面临三大挑战:功耗高导致续航短、静态人体检测能力弱、环境适应性差。WTL580微波雷达解决方案,以5.8GHz高精度雷达感知技术为核心,突破行业瓶颈,为智能门锁带来“精准感知-高效触发-超低功耗”的全新交互范式。二、WTL580方案核心技术优势1. 5.8GHz毫米波雷达:精准感知的革命全状态人体检测:支持运动、微动(如呼吸)、静态(坐卧)多模态感知,检测灵敏度达0.1m/
    广州唯创电子 2025-04-15 09:20 77浏览
  • 二、芯片的设计1、芯片设计的基本流程 (1)需求定义: 明确芯片功能(如处理器、存储、通信)、性能指标(速度、功耗、面积)及目标应用场景(消费电子、汽车、工业)。 (2)架构设计: 确定芯片整体框架,包括核心模块(如CPU、GPU、存储单元)的协同方式和数据流路径。 (3)逻辑设计: 通过硬件描述语言(如Verilog、VHDL)将架构转化为电路逻辑,生成RTL(寄存器传输级)代码。 (4)物理设计: 将逻辑代码映射到物理布局,涉及布局布线、时序优化、功耗分析等,需借助EDA工具(如Ca
    碧海长空 2025-04-15 11:30 135浏览
  • 你知道精益管理中的“看板”真正的意思吗?在很多人眼中,它不过是车间墙上的一块卡片、一张单子,甚至只是个用来控制物料的工具。但如果你读过大野耐一的《丰田生产方式》,你就会发现,看板的意义远不止于此。它其实是丰田精益思想的核心之一,是让工厂动起来的“神经系统”。这篇文章,我们就带你一起从这本书出发,重新认识“看板”的深层含义。一、使“看板”和台车结合使用  所谓“看板”就是指纸卡片。“看板”的重要作用之一,就是连接生产现场上道工序和下道工序的信息工具。  “看板”是“准时化”生产的重要手段,它总是要
    优思学院 2025-04-14 15:02 117浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦