端到端的自动驾驶系统架构思考

谈思实验室 2024-06-15 17:41

点击上方蓝字谈思实验室

获取更多汽车网络安全资讯

以uniad为例,聊一聊端到端模型下,系统架构工程师如何发挥自己重要角色,一方面uniad开创性的提出了以planning为导性的网络模型,这也是模型由开环到闭环的重要转变,另一方面,保留了传统各个技术模块显性输出,分析框架上,大家也比较熟悉。系统工程师都比较清楚,性能&问题拆分都是从规控执行侧逐步往上拆分,所以uniad可以说是二者的一个混合中间过渡阶段,是进行一些思考不错的参考方案。

首先,我们先从目前系统架构的工作职责,审视一下基于网络架构的变和不变的

不变的是

  1. 用户是无感的:产品体验是不care 技术的

  2. 功能逻辑是不变的:adas还是adas,NOA 还是NOA,该降级还得降级

  3. 法规行业标准是不变的:这个不赘述了

  4. 安全冗余依旧是要求的

变的是

  1. 功能要求不变,但是功能实现逻辑变了
    1. 如何满足功能逻辑,比如激活,退出功能,变道时间,导航信息,人机交互策略等如何重新适配
    2. 故障诊断如何实现:比如车道线不清楚,如果没有车道线的输出如何判断,或者模型对车道线的容忍度高了,怎么量化和标定
    3. 如何确定性能边界:传统规则 60km/150m 弯道即可确定性能边界ok,基于网络的是否可以
    4. 安全冗余等要求:planning的冗余逻辑,lidar& rader&视觉的冗余可靠性怎么设计和验证,暂时无思路
  2. 性能指标变了,但是又没变
    1. 整个网络,但是依旧有感知,规控等技术模块独立链接,可以分开调试,这是不变的
    2. 变的是拆解到各个网络,关注的元素变了,元素的性能要求变了,上下游的影响链路变了
    3. 变得是如何鲁棒性验证,比如延迟的影响分析,现在一个网络直接级联过去........
    4. 重点引入感知信息的无损传递,然而有无损传递,就要求下游有效的过滤和筛选
  3. 迭代优化&拆解方式变了
    1. 如何debug问题:从Control-planning-decision&prediction-perception的链路,肯定是变了
    2. 如何优化问题且保证问题解决有效性:基于规则的逻辑和性能,是可确定性分析验证的,且对其他模块影响也是可分析和可控的,但是基于网络的,解释性差,如何验证问题优化不会对其他模块带来负面影响
  4. 主要矛盾的转变
不变的就是我们的基础能力,重点来阐述变在哪里,以及如何变,毕竟唯一不变的东西就是变化,那么好,我们就要抓住主要矛盾和矛盾的主要方面
  1. 主要矛盾转变,基于规则的优化算法变为数据驱动的网络模型,也就是基于数学方法论论证的设计方式,转变为数据驱动的模型拟合!本质上说是可论证方法变为实验验证的方法
  2. 矛盾的主要方面
    1. 数据代替人的建模能力,依赖数据和算力暴力拟合或者学习
    2. 信息的无损传递,其实就是线性化到非线性的转变,规则大部分都只适合线性系统,EKF、 QP求解等大部分都是非线性系统进行线性化处理,非线性系统的低维线性化必然会带来损失,而模型本质就是高维拟合和分类,天然优势就在非线性系统
    3. 闭环论证变为经验开环拟合(学习)为主,经验开环底层逻辑为注意力机制
那么好,本质上来说,是只要历遍ODD内的所有场景,二者都可以设计出符合预期的产品,现实情况是规则根据自己的边界设计ODD,模型通过数据拓展ODD,规则的ODD是上限, 模型的ODD是数据
进入正题,就从矛盾的主要方面对uniad进行系统性分析
  1. 无损传递&有效滤除:要实现高维信息的无损传递到决策,再有效滤除到执行端,其实挑战在决策规划,最终的执行器是两维信息,高维无损信息传递给决策规划,信息是无损了,但是更多的是无效信息,无损隐藏的要求是更多的信息给你,性能应该更好,这就对下游带来更大的挑战。本质上来说模型就是一个类似人的注意力的非线性分类和滤波器,举个例子说走路上,大部分的环境你是没印象的,甚至你会盯着某个短裙长腿妹很长时间,甚至娃名字都想好了,但是不影响你安全通过路口。
    1. 无损传递并不是降低感知的性能要求,只是对感知的要求有变化,更意味者决策规划要进一步挖掘感知和自身的能力,释放整个系统潜力
    2. 既然感知是无损传递,决策规划是后处理,依然有这个划分,那么双方依旧需要一些性能指标的拆分
    3. 既然留了传输接口和可视化,那么元素和性能现阶段我们依旧需要或者可以列出来,逐步迭代
  2. 感知无损传递
    1. 重新定义无损:何为无损,足够下游做正确的决策需要信息传达下去即为无损,对下游无用的信息即为噪声,所以是何为无损,够不够损,依旧跟下游模型策略有关系
      1. 元素:属性是否足够,比如障碍物六自由度信息,长宽高等,障碍物是否还需要其他信息
      2. 范围:是否整个探测区域范围元素要求都需要无损?还是不同场景重点关注场景不一样,比如拥堵路邻邻车道车根本就不care
      3. 性能:所有范围内的障碍物的性能要求都一样吗
      4. 整体关联性:车辆&车辆、车辆&车道线&路沿、自车&他车相对位置关系组成的整体观感,这是无损很重要的一个点,或者说如何学习和理解整个交通流,才是端到端的关键能力
      5. 聚焦点
        1. 逆向推演,如果有最终的决策执行,反向拆分到感知,其实能得到对整个决策有影响的只是感知的部分区域和信息
        2. 感知给出完备的元素,相互关系,但是不同距离的性能可以降低
        3. 规控需要解决的是各种注意力机制提升非线性拟合能力和判断能力,弥补感知无法给出视角范围内足够精准稳定的局限性,提升鲁棒性
        4. 规控要有基于自身视觉的场景理解能力,能够在无效噪声信息中,利用多方信息交叉验证,提取有效信息,实现更高的性能天花板的同时具备鲁棒性,比如在传统规则后处理试图对障碍物通过交通流的物理特性进行校验和滤波,发现几乎不现实,但是如果用模型的话,可以天然融入处理好
  3. 决策规划的后处理
    1. 闭环稳定性:开环和闭环稳定有本质的差别
      1. 控制出身的同学都知道,即使很轻微的正反馈的干扰,也会导致系统逐渐发散,大家都经历过,上车调试前看规划曲线很正常,但是一闭环就画龙,开环的评测和闭环反馈是有本质区别的,也是端到端必然面临的挑战
      2. 闭环链路
        1. 预测&决策&规划&控制的闭环影响依旧是存在的,预测会影响决策,规划和控制的稳定性也会影响决策,这是基本的稳定链路环路,核心点还是决策,既要保证顺序传递链路决策的合理性,即规划执行合理舒适无风险,又要随时准备规划或者预测异常时,能够足够快进行调整。这是基本的能力,在这个基础上,需要考虑博弈和交互等更加复杂的场景,这些在网络设计中依然是重点要考虑的
      3. 闭环理论分析&数据驱动的融合迁移
        1. 如何从现在感知(开环)的训练和评测迁移到感知到规划&控制的闭环,也是难点之一,以往的数据遮挡、或者异性特征,都可以从测评直接得出,但是感知到规划,如何验证闭环的稳定性,从工具和评测都会有很大差异
    2. 控制执行连续稳定和安全性
      1. 如何训练出适合控制器执行的轨迹,也就是整个端到端的输出,叠加规则和后处理也好,但是最好在网络里面有这个注意力机制起作用,能够从原理上有约束力,然后依旧需要规则的安全 校验
      2. 控制端最好也针对轨迹的新特性做一定的调整,依旧是一个系统工程,没有理上游底层算法特性变了,输出轨迹没有任何改变
      3. 核心点,还是轨迹的连续性和稳定性和安全性,需要规划和控制系统性优化
        1. 模型输出轨迹,是不知道控制需求的,这个需要将控制的需求体现在训练里面
          1. 控制关心的轨迹的长度
          2. 控制需要轨迹的连续性如何体现
          3. 控制关心的轨迹点上各个元素的精度,模型如何体现精度
          4. 是否需要增加一个适配层,做一些滤除和调整,实现更好的闭环?
        2. 控制算法,是否参考模型特性,是否可以更类人
          1. 人类驾驶习惯
          2. 大概率第一阶段还是要延续现有的方法论
    3. 如何设计合理和验证的整体闭环稳定性(目前对模型的技术基础尚不了解,提出问题待日后完善)
      1. 预测决策规划的新特性
      2. 需要知道控制跟踪轨迹是否正常
  4. 对uniad 工程量产落地进行系统工程分析
  • 开环&闭环问题
    • uniad 是开环验证,如图,每次轨迹都从车身原点出来,每次更新都重新刷新轨迹,没有历史的连续性,控制无法进行稳定闭环跟踪。控制是一个物理过程,是时间维度的连贯性,举个简单的例子,跟踪有误差,控制需要有误差积累的反馈然后动态调整,如图所示的轨迹,显然达不到。之所以开环看起来很稳定,每次循环都刷新轨迹,只能保证单次合理性,能够看起来合理是因为驾驶员本身做了正确的操作,只是驾驶员操作的单次映射而已。
    • 参考 开环端到端自动驾驶:从入门到放弃 
      (https://zhuanlan.zhihu.com/p/669454065):不受到累计误差的影响。再难的路, 0.5s后 human driver总会给你正确答案
    • 关于ego status: 英伟达最新!CVPR 2024 | 开环端到端自动驾驶中自车状态(Ego Status)是你所需要的一切吗?
      (https://zhuanlan.zhihu.com/p/685494828):该文章不敢苟同,没有了图像输入,依旧有轨迹输出,应该反思的不是用不用ego status,而是训练验证方法论的问题,很明确的一个点,ego status是必须要有的,分歧点或者难点是如何使用他。腿不好不要嫌弃路不平
  • 轨迹问题
    • 控制需要连续的轨迹去跟踪,这块可以参考传统adas基于车身坐标系下的轨迹的拼接和stich的原理
    • 如图所以uniad训练出来的轨 迹是不合理的折线
    • 实际训练其实是可以参考自车走过的路径的,将未来一段时间的自车轨迹标定出来进行训练
  • 上下游拆解
    • 最好是复用现有的感知的能力,所谓的无损信息传递,并非是现有的接口信息不需要,而是远远不够
    • 预测与感知障碍物输出合并,进一步节省资源
    • 去掉或者大幅减少感知后处理,包括障碍物和车道线等,不要阻挡无损传递的通路
    • 可以认为模型有自己的整体关联性视感:更多的关注车道线&障碍物的相对关系,障碍物等交通流的相对关系、道路结构拓扑图的结构关系
    • 决策规划要降维滤除无效信息的能力
      • 无损信息提取,拥有整体视感阅读能力和聚焦能力,也就是如何发挥注意力机制,从整体视感上,抓住重点信息
      • 从感知到出规划轨迹,是有更明显的时空关联关系,最终输出是低纬度有约束的信息,从控制角度来说是多输入单输出系统,意味着存在更多冗余信息可以交叉验证,是挑战也是挖掘潜力的重要的点。
      • 高维噪声的评估和过滤能力,比如高频和偶发的车道线和障碍物的抖动,现有滤波处理会带来刻板画龙或者点刹,模型我相信会有更好处理能力
      • 对输入指令分类处理能力,如何设计,人类其实就有很强的分类组合能力
    • 实例化描述
      • 障碍物直接输出带3条预测轨迹,带概率,将预测跟感知信息一同处理能够尽可能的损失预测的信息
      • 障碍物的性能指标在不同的距离和相对位置关系的要求可以进一步下降,下游通过综合无损信息和噪声信息进行滤除
      • 车道线也可以允许一定的抖动
      • 决策规划要求
        • 对上游的高频噪声要有足够的鲁棒性
          • 传统的单点滤波:障碍物前高频小幅跳动,偶发一帧跳变,速度,加速度,位置的白噪声不敏感
          • 不同场景有聚焦区域:能够有意训练出真正影响功能的区域,重点关注
          • 关联性滤除:无关紧要的障碍物滤除,比如邻邻车有个横向位置,这种就直接不管;能够根据周围车交通流将不符合物理规律的异常检测滤除
          • 关联性优化&鲁棒&泛化:根据障碍物&车道线&路沿等,综合安全和灵活性给出合理的轨迹
        • 输出要求
          • 障碍物车道线的高频噪声&跳动在轨迹层面彻底滤除
          • 符合车辆的物理特性,低频特性
          • 轨迹是连续的,跟车身解耦的,且车身画龙等非预期时,依旧是一个解耦车身且车辆有能力跟踪
  • 数据&训练:konw how 不够 hold
  • 鲁棒性验证问题:hold
通过对uniad在没有网络模型的基础上,从系统工程的角度进行了一些思考,分析出一些认为关键的或者不同的方案迭代要注意的设计要点,接下来会进一步学习逐渐完善系统工程的分析、闭环和验证工作:
  • transformer、注意力机制等底层的模型网络
  • 数据标注&训练&评测流程
  • 模型的设计和调试机理
  • 决策&规划的模型如何设计
  • 模型闭环的安全&鲁棒性如何验证和保证
  • 对uniad进行闭环量化的分析
  • 进一步评估其工程落地能力
心得补充:
人为什么开新车也很熟练:
因为人其实是三重冗余:学习的开环经验,开环经验的微调, 紧急异常执行
比如开新车过弯道
  • 按照经验打一个角度基本上就能过,这就是习惯,或者程序化的
  • 发现新车不一样,需要微调一下,这就是人的泛化或者鲁棒能力,其实是另外一套监控体系
  • 再然后发现这车太不一样了,要撞马路牙子了,会条件反射猛打,这属于安全机制
  • 对应到车上就是adas&AES,但是少adas的冗余监控,这恰恰是用网络模型我们要思考的
  • 这套体系在控制系统叫做复合控制

来源:达木@知乎

 end 

 专业社群 

 精品活动推荐 

更多文章

关于涉嫌仿冒AutoSec会议品牌的律师声明

一文带你了解智能汽车车载网络通信安全架构

网络安全:TARA方法、工具与案例

汽车数据安全合规重点分析

浅析汽车芯片信息安全之安全启动

域集中式架构的汽车车载通信安全方案探究

系统安全架构之车辆网络安全架构

车联网中的隐私保护问题

智能网联汽车网络安全技术研究

AUTOSAR 信息安全框架和关键技术分析

AUTOSAR 信息安全机制有哪些?

信息安全的底层机制

汽车网络安全

Autosar硬件安全模块HSM的使用

首发!小米雷军两会上就汽车数据安全问题建言:关于构建完善汽车数据安全管理体系的建议

谈思实验室 深入专注智能汽车网络安全与数据安全技术,专属汽车网络安全圈的头部学习交流平台和社区。平台定期会通过线上线下等形式进行一手干货内容输出,并依托丰富产业及专家资源,深化上下游供需对接,逐步壮大我国汽车安全文化及产业生态圈。
评论
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 45浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 119浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 127浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 145浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦