图森未来首届AIDAY:全技术分享,下半年发布“干净数据集”

原创 赛博汽车 2023-08-02 17:37

今年下半年,图森未来会发布一个“数据集”,至少是百小时级别的、干净的。


作者 | 章涟漪

如何做负责任的自动驾驶


7月27日,首届AI DAY上,自动驾驶卡车公司图森未来主要就讲了这一件事。


在图森未来CTO王乃岩看来,过去3至4年里,辅助驾驶系统在乘用车领域飞速发展,功能不断增加,但依然是L2级辅助驾驶产品,无法突破至L3,乃至L4级自动驾驶。


“这其中很大原因在于,L3和L4从功能上来说可能并不比L2更复杂,但可靠性上是质的飞跃,因此辅助驾驶产品开发方法论,不适用于L3级及以上产品”。王乃岩表示,图森未来基于更高阶自动驾驶设计了一整套全冗余架构。


那么,图森未来自动驾驶系统方案具体如何设计?从技术研发到大规模量产落地还需要多久?


01

从车辆到算法,全冗余架构解读


全冗余,这是图森未来L4级自动驾驶系统的最大特点之一


根据王乃岩介绍,图森未来设计了一套全冗余的架构,包括了最底层车辆,到上层系统、传感器,以及最上层算法模块。


车辆方面,图森未来使用车辆配备了冗余的转向系统和制动系统,来保证出现单路失效状况时,车辆仍然能够在其控制之下。


实现方式是,在系统设计层面,图森未来设定了两套完全独立的系统,即主系统和备系统。其中主系统L4驾驶的“主力”,使用的是高算力平台和全套传感器,可以实现完整的L4驾驶的功能。



与此同时,图森未来还配置了与之完全独立的备系统,其使用了低算力,但可靠性很高的车规级芯片和比较有限的传感器。备系统只需要完成在主系统失效时候的降级功能。


两套系统都实现了完全独立的供电,可减少因为供电导致供电故障的可能,进一步提升了系统的可靠性。


在系统运行模式方面,除了正常的L4级别自动驾驶外,图森未来还设计了两种最小风险状态,分别是车辆侧后方感知及转向系统可用时,可以实现应急车道靠边停车;在一些非常极端情况下,比如说彻底失去了后向和侧向感知时,设计了相应的在当前车道安全刹停等待救援模式。


传感器冗余方面,图森未来设计原则是使用全波段的电磁波感知,使用了相机、激光雷达和毫米波雷达三种传感器,基于他们不同的特点和优劣势,图森未来设计了一套使用全类型传感器、高可靠冗余方案



算法冗余是图森未来非常关注的领域。王乃岩称,算法设计中最关键的点是如何处理失效问题。图森未来在设计算法架构时最核心的思想是:假设没有一个传感器是永远可靠的,没有一个算法不会犯错


基于这样的一个想法,图森未来车上运行的算法分成了两大类:Data-Driven算法和Principle-Based算法。前者为数据驱动算法,它的原理是使用大模型驱动AI算法,来实现像物体识别、车辆识别,以及包括动态道路的环境感知等;后者的特点是能够对问题和过程进行精确建模。


王乃岩展开介绍称,算法架构设计的第一个模块是感知模块,这是冗余设计最困难的模块,因为在该模块中,图森未来大量使用了数据驱动算法。


基于此,图森未来在感知模块实现了三重冗余。一方面,其把三种感知方法分为两大类:基于识别的物体感知和基于场景的障碍物感知。由于两者原理不同、假设不同,这就意味着图森未来已经实现了一套冗余。



与此同时,在基于识别的物体感知中,又使用了两套完全独立的系统去分别使用激光雷达和相机在第一阶段生成候选框和候选物体,这两套传感器及算法都是完全独立的。


在基于场景的障碍物感知方面,使用的也是层次化或者说漏斗式设计方案,去逐层提高识别准确率,其中最底层,图森未来基于激光雷达几何性很强的特征,去初筛所有可能存在的通用障碍物,在此之上使用高精度地图和相机,去实现准确率的逐步提升,以满足下游规控算法需求。


这两套系统一起提升了整个感知模块的冗余程度。


除了冗余挑战之外,卡车场景还有一个天然的挑战:远距离感知由于卡车的载重、车身长度等因素,导致其相比于乘用车需要更长的紧急刹停距离和完整变道距离,这对算法的性能和可靠性都提出了很大的挑战。王乃岩称,根据其经验,卡车的车道感知距离最好是400米至500米,乃至更远距离。


02

从感知到产品,实践经验分享


在王乃岩演讲过程中,不断有图森未来技术专家基于实践,针对感知模块、定位模块、预测规划和控制、端到端仿真、数据自动标注和产品六个方面进行了分享


感知模块方面,正如前面所言,图森未来L4级自动驾驶方案需要做到感知算法的冗余,这要求视觉能够独立感知周围环境。以3D目标检测为例,其所要做的是,通过环视摄像头来获取物体在3D空间下的大小位置和姿态信息。


目前主流3D目标检测的方式是BEV方法。但如果直接应用到场景中,会遇到两个问题:一是长距离感知需要构建长距离BEV空间,这会消耗大量的计算和空间资源;二是算法设计没有考虑到相机之间互补冗余,如果出现漏检,会造成整个系统消失。



针对上述两大问题,图森未来给出的方法是:基于物体多视觉的3D检测框架,在环视镜头输入后,会对每个相机进行2D检测,并融合各视角信息,最终形成3D检测结果。在实现相对鲁棒的同时,也能保证算法内部的冗余


定位模块方面,作为无人驾驶汽车模块中非常重要部分,它对于可靠性的要求比感知模块更高。毕竟如果在300米范围内漏检了一辆车,可能不会立即导致事故,但如果定位算法偏差超过半米可能直接冲出车道,碰撞障碍物。


因此,在定位算法里,对于精度和鲁棒性的要求远高于其他模块。基于此,图森未来选择了多传感器融合方案,包括相机、激光雷达和组合导航


预测规划和控制模块方面,图森未来称,由于卡车不是单体结构,而是由两部分组成,会导致出现非常复杂的动力学和运动学模型;同时,因重量和尺寸原因,卡车只有非常有限的加减速性能。


为应对上述挑战,业界流行做法是,将对其他车辆预测、自车决策、自车控制,以及自车轨迹横向和纵向规划五个部分分别取优化,这样的好处是整个系统比较可控,且每个模块可以独立完成自己目标,但劣势是分块的系统难以去实现统一优化目标服务于一辆车。


业界第二代的做法是实现横纵联合规划,即把整个横向规划和纵向规划耦合在一起,变成同样一个模块。而图森的做法是“一步到位”,实现五个部分的联合优化,实现预测为决策服务



端到端仿真模块,常见的仿真是做规控的仿真,在规控仿真中只运行规控模块和底层车辆模型,它对于低级别自动驾驶系统可行,但图森未来的感知系统及规控系统间有非常复杂的耦合关系,简单的仿真测试不足以满足。


为此,图森未来在仿真测试中采用到了端到端的仿真测试框架,将整个算法系统作为黑盒进行测试,实现更高级别的集成测试,也是HIL测试的基础


仿真测试系统是怎么构成的呢?首先,它是一个离线闭环系统,目的是测试我们整套算法系统,同时也支持多场景测试,包括真实场景导入仿真场景库后测试和人工编辑长尾问题测试。


在工程上,端到端仿真系统架构主要分为两部分:有仿真引擎及仿真底层物理世界引擎和车辆动力学模型构成的仿真系统;另一部分是由运行整套算法自驾的域控,以及一些虚拟车辆控制单元组成的测试环境。两套系统通过传感器的输出,以及一些看的消息进行通讯。可以通过回放路测场景和虚拟引擎渲染方案实现,但两者都存有一些弊端。



为此,图森未来采用了神经渲染的方法。即,基于录采数据重建3D场景,并在相机中渲染出来,而对于路上遇到的各种交通参与物,只需要传感器扫到他们,再离线通过一套处理将其加入仿真场景库。


据介绍,图森未来循环运行所有的离线仿真场景只需要不到30分钟,每小时运行成本小于10元


此外,数据自动标注模块,图森未来的核心思想是在一个序列里面,一旦检测到一帧会使用跟踪算法,把整个序列上的物体关于它的点源全部找到,然后堆叠起来,以保证比较高的效率;产品模块,图森未来的主要工作是用户研究和需求挖掘、需求定义、需求验收和ODD定义。


03

实现自动驾驶数据很重要,下半年会分享数据集


在详细介绍完技术情况后,图森未来还组织了一场圆桌论坛,去谈论从限定区域自动驾驶到全场景L5级别自动驾驶需要多久


上海人工智能实验室青年科学家李弘扬指出,作为学术界,“如何实现L4、L5级自动驾驶”是他们非常关心的问题。其中,大模型是非常重要的技术


至于“什么是大模型”,李弘扬也坦言,怎么定义其实大家都没有想得很清楚。但可以换个方式思考,大模型应该是什么样子。在他看来,它应该是个感知、决策相关的,追求自动驾驶稳定、安全、可靠的。从这个角度思考,大模型至少需要有预测环节的能力,这背后需要海量数据的支持



“每家车企都在说自己有海量数据,但这其实和我们关系不大,我们要的是公开演讲,需要能够爬到的数据”。李弘扬称,但如果没有海量、高质量的数据,无法实现大模型。这意味着,想要实现L4、L5级自动驾驶,需要先建立拥有海量数据的自动驾驶大模型


对于李弘扬的观点,复旦大学工厂与应用技术研究院青年研究员丁文超部分认同。他也认为,自动驾驶实现需要海量数据。但车企并非不愿意开放数据,而是不知道怎么处理。所以,如何把数据规整出来,比如时间戳标定同步,是当下需要解决的问题,这也是制约真正的自动驾驶大模型建立、实现的因素


“关于数据,主机厂一直希望能够得到咱们的诉求,或者说一起合作去做一些事情。”福田汽车智能驾驶研究中心副主任金大鹏也表示,愿意支持学界、自动驾驶公司去做更多数据的工作。“我们有大量的需求和数据,能够给到学术界和自动驾驶公司使用,以持续迭代。”


同时,他也就主机厂的需求进行了探讨。他指出,这些年主机厂也有了思想转换,大家更多的不去想L3、L4、L5的问题,而是思考如何满足客户的需求,当然是在符合法规的前提下。比如,用户需要降低长距离行驶疲劳、降低司机成本。作为主机厂就会优先考虑怎么解决这些诉求,而不是局限在级别定义里


对于上述嘉宾们提到的问题,王乃岩深表认同。他认为,数据问题确实是当下非常大的挑战,特别是在数据清洗这一块,不止学术界,企业内部也面临这样的问题。


不过,在活动最后,王乃岩放出彩蛋表示,今年下半年,图森未来计划发布一个“数据集”,可能没有上千小时那么大,但是至少是百小时级别的,并且很干净,会是完整环视的、多视觉的,包括商用车、甚至乘用车,给学术界使用


此次AI DAY,是图森未来宣布业务优化后首次对外正式活动。今年5月中旬,图森未来宣布业务重组计划,会减少美国业务,进一步扩招中国团队;6月28日图森未来再发公告,称正在探索美国业务的战略替代方案,包括可能出售美国业务,并更加重视亚太地区和全球其他主要市场。


一直以来,图森未来被认为是自动驾驶卡车领域的“技术”担当,此前因为内外部问题,一度陷入“混乱”。此次在上海举办AI DAY,为再次对外表达回归技术、回归中国的决心


-END-


随着埃安昊铂、小鹏G6等产品上市,汽车智能化转型在中国已从趋势认同转为量产落地,基于新一代E/E架构打造的产品即将陆续上市,但从概念到量产中间,存在着大量不为人知的“陷阱”。


8月4日19:00-20:30,《赛博汽车》&《电动汽车观察家》直播邀请广汽埃安、东软睿驰、恩智浦专家们一起,为你深度解读“如何打造全新一代智能汽车电子电气架构”!



往期精彩内容推荐


点亮星标,精彩内容不错过

赛博汽车 聚焦智能汽车、自动驾驶,与产业共同成长.
评论
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 146浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 1065浏览
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 72浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 238浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 509浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 189浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 162浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 178浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 199浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 103浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 216浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 857浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 325浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦