ADS算法的技术演进与挑战

TechSugar 2022-07-12 08:00

作者:Dr. Luo,东南大学工学博士,英国布里斯托大学博士后,是复睿微电子英国研发中心GRUK首席AI科学家,常驻英国剑桥。Dr. Luo长期从事科学研究和机器视觉先进产品开发,曾在某500强ICT企业担任机器视觉首席科学家。

中国古人追求的梦想是“拓地三千里,往返速若飞”,现代人类衣食住行的理想境界,也无非是“健康、快乐、富足、平安”。然而,从联合国的统计数据可以看到,全球每年道路交通事故受伤者约5000万人,死亡人数125万,经济损失高达1.85万亿美元左右,而94%交通事故均来自可以避免的人为因素,且90%发生在中低收入的国家。


研究表明,将有效预警提前1.9秒,事故率可下降90%,而提前2.7秒,事故率可下降95%,所以AI算法的感知认知领域的技术进展推动了辅助ADAS以及自动驾驶ADS技术的行业落地也是势所必然。2021年统计数据表明,一个美国司机在自然驾驶环境NDE下每英里的车祸发生平均概率约在百万分之一的水平。


而2021年美国加州自动驾驶车辆AVs最好的disengagement rate也只能做到十万分之一,这一定程度表明AVs的安全性能估计比人类明显要差一个数量级,虽然可以适应仿真和简单的不密集的约束真实场景,但仍难以应对城市的复杂道路交通场景。场景适应能力问题,以及最核心的安全差异问题也就是所谓“Long-Tail Challenge长尾挑战”,依旧是ADS当前亟待解决的最大难题之一。


图1. ADSv2.0典型系统分层架构 (Khan, 2022)


图2. ADS分层核心部件 (Khan, 2022)


ADS算法的典型系统分层架构如图1和图2所示,目前已经从多模数据结构化+决策层后融合ADSv1.0演进到了一个全新的多模感知与融合推理的特征级前融合ADSv2.0阶段。如上文所述,ADS面临的挑战具体体现在:


  1. 能够在统一空间支持多模传感器感知融合与多任务共享,在提升有限算力的计算效率的同时,确保算法模型在信息提取中对极端恶劣场景(雨雪雾、低照度、高度遮挡、传感器部分失效、主动或被动场景攻击等)的泛化感知能力,降低对标注数据和高清地图的过度依赖;


  2. 预测与规划联合建模,离线与在线学习相结合,监督与自监督学习相结合,从而能够处理不确定性下的安全行驶与有效决策,提供认知决策行为的可解释问题,通过持续学习解决新场景问题。


ADS场景适应能力的挑战


图3. ADS场景适应能力问题 (Khan, 2022)


如图3所示,ADS部署的传感器在极端恶劣场景(雨雪雾、低照度、高度遮挡、传感器部分失效、主动或被动场景攻击等)的影响程度是不一样的。所以传感器组合应用可以来解决单传感器的感知能力不足问题,常用的几种组合是:

➤ Camera+LiDAR;

➤ Radar(3D,4D)+Camera+LiDAR(LD,HD);

➤ Radar+Camera。

统计数据表明Radar+Camera是最常见组合。ADS传感器特性总结如下:


  • Camera:可以提供360环视和远距前后视角的环境语表征,但需要一个照明环境,单目和多目摄像头可以提供一定程度的目标深度信息;受恶劣场景影响严重;镜头脏污会严重影响图像质量。

  • LiDAR可以提供场景的空间信息;但难以检测有反光效应的或透明的物体;当雨速高于40mm/hr到95mm/hr,信号反射密度严重损失并产生雨枕现象;大雪天气下可视距离缩短并产生反射干扰波形;浓雾场景会产生鬼影现象;温差会产生额外时间延迟。
  • Radar:对周围车辆检测准确率高,可以提供目标的速度信息,4D Radar还可以提供目标高度的可靠信息;不适合做小目标检测;大雨、浓雾和暴风雪会产生接收信号强衰减和斑点噪声,总体对环境的适应性高。


AVs使用体验数据显示,在暴风雨雪天气,车辆的控制由于打滑和oversteering等原因,目前是远低于用户期望的。


ADS长尾问题的挑战


“长尾问题”没有一个很明确的定义,一般指AVs即使经历了交通公路百万公里数的路况测试,对每个AI算法模块而言,包括感知层和决策层(预测+规划),仍不能完全覆盖各种各样的低概率安全至关重要的复合驾驶场景,即所谓的“Curse of Rarity (CoR)稀缺问题”。如何定义和分析这些稀有场景,可以有助于更好理解算法性能的提升,从而加速安全可靠的ADS解决方案的开发与部署。


对于大部分视觉任务而言,问题复杂度增加,对应维度也在增加,意味着数据在特征空间更加稀疏,为了一个可靠的结果,数据需求会随维度增加而指数增长,而性能只可能线性增长,R. Bellman统一定义这类问题为“Curse of Dimensionality(CoD)高维问题”。ADS领域的CoD高维问题显然来自上述所提的各类天气状况,道路基建,人车混杂,城市乡村各类路况,道路设施(高速、路口、转盘、隧道、高架桥),人车交互,车车交互等。针对CoD问题,深度学习DL算法在ADS领域确实带来了很多长足的进展,包括


  • 多模感知:主要是针对Camera/LiDAR/Radar海量数据流进行特征提取,DL网络主流趋势是卷积CNN或者贝叶斯NN+Transformer的组合架构,在统一的特征空间实现多模感知,特征融合共享以及多任务来提升算力的整体效率与安全可靠的环境感知能力。

  • 融合推理:主要是基于模型与基于数据的双学习模式,DL网络主流趋势是基于目标交互GNN或基于统计模型的贝叶斯RL学习或On-Policy应急学习,实现ADS安全可信的预测规划类决策与控制。


对于上述CoD高维问题的解决,可以简单分成两种应用方式:

  1. 感知层的特征高维提取和降维融合重建:DNN网络多采用梯度下降Gradient Descent(GD)来做网络参数调优,对应的视觉任务包括3D目标检测跟踪、交通路标检测分类、场景与可驾驶区域分割、分道线检测或分割等,AI模型多采用CNN、Transformer、Bayesian NN、RNN、GNN等;


  2. 决策层的策略(decision-making policy)学习:DNN多采用Policy Gradient (PG)理论、Bootstrapping、Monte Carlo Tree Search来做优化策略,将高维变量空间转换到NN的参数空间,对应的视觉任务包括目标行为建模与运动轨迹预测、运动规划与定位控制等。AI模型多采用Deep Reinforcement Learning (DRL),Graph Convolution Network (GCN), Transformer, 结合贝叶斯学习、模仿学习Imitation Learning (IL)、Inverse RL、Off-Policy和On-Policy应急学习等;


图4. ADS中CoR问题的呈现图 (Khan, 2022)



如图4所示,上述几类方法可以部分解决CoR稀缺问题,但在机器人、ADS领域的一个关键挑战是系统安全性能的保证。一个解决的思路是采用仿真来产生上述所提的大量稀少的安全事件场景,但仍然远远不够,原因在于多数仿真环境采用手工设计的规则很难模仿现实驾驶场景的高复杂性与不确定性,安全相关的真实事件数据非常难以采集,实际路况中人车交互和车车交互也很难建模,安全度量和评估也同样异常艰难。从AI算法角度,可以在仿真数据基础上继续结合Importance Sampling和Importance Splitting方法,Importance Sampling方法可以根据输入的概率分布来对输出的Likelihood Ratio释然比进行加权来产生无偏置的估计,这只适合简单的场景。Importance Splitting方法强激励的通道可以继续分解,可以将稀有事件的估计分解成条件概率分布序列从而减少估计方差,但人工设置的阈值选取是一个挑战,也很难评估Policy空间的性能敏感性,尤其是针对near-miss事件和交通事故等各类不确定性。


ADS-RL安全学习的挑战


对于ADS的决策层算法而言,最早采用的基于手工设计的规则的方法,应用场景受限难以应对现实驾驶场景的高复杂性与不确定性,其典型案例是开源自动驾驶系统Autoware和仿真平台CARMA,采用有限状态机来产生车辆轨迹,为了确保AVs行驶安全,在高复杂度交互场景会产生车辆减速或停车现象即所谓的”Freezing Robot”问题。工业界采用的基于数据的监督学习的方法,仍然难以解决CoR和CoD中数据总量和数据不平衡的问题,现有的真实驾驶里程标注数据总量,估计只有期望数据量的1%以下。


第三类最有希望的DRL方法是一种模仿动物学习行为的自学习方法,通过状态State不断地与环境的行为交互Action带来的奖励Reward积累来寻求最优策略Policy,最大化未来累计奖励的一个随机过程,来应对不确定性。按照最优策略的获得方式,可以将RL分成间接式Indirect RL和直接式Direct RL两种:

  • Indirect RL:可以分成Policy Iteration和Value Iteration两种,其基本原理是通过求解问题的最优性条件得到最优策略,针对连续时间问题,多采用哈密顿-雅可比-贝尔曼方程(HJB equation)求解;针对离散时间问题,采用贝尔曼方程(Bellman equation)求解

➤ 算法案例:Deep Q-Learning, DQN, D3QN, A3C, GAE, DDQN

  • Direct RL:其最优策略是寻找最大化目标函数的参数化策略,将最优控制问题看成一个优化问题,采用数值优化方法进行求解,可以采用一阶优化方法,即策略梯度Policy Gradient法,它沿着目标函数上升的梯度方向,不断地更新策略参数,直到找到最优解,最新的策略多采用将ADS行驶安全也做为一个约束项

➤ 法案例:TRPO,PPO, DPG, DDPG


        DRL采用的Policy Gradient方法,其目标函数可以表示为:

其中𝜃为神经网络参数, 𝐽(𝜃) 为目标函数, 𝑆𝑡 and 𝐴𝑡为state和action,策略policy 𝜋,以及q𝜋(𝑆𝑡, 𝐴𝑡)表示state-action值。Policy Gradient方法中最重要的一个步骤是计算目标函数的梯度值,可以采用Monte Carlo方法来计算。值得一提的是,上述A3C(Actor Critic)是DRL的一个案例,实际上它既可以从间接方法推导得到(Critic是一步策略评价,Actor是一步策略更新),也可以从直接方法推导得到(Actor本身是Policy Gradient的估计过程,而Critic则是该梯度内部的一项,即Value函数 的估计)。DQN方法不同与上述参数化Policy直接进行学习模式,其目标是通过对action值进行学习,通过基于预估值来选取,主要步骤是更新能够预估 action值的NN参数。显而易见,稀有事件问题仍难以解决。


采用DRL学习的方法,由于CoR和CoD问题,同样存在稀疏奖励Reward问题和Policy Gradient估计的方差过大等瓶颈问题。


在数据比较充分的情况下,深度模仿学习Deep IL通过行为克隆、直接策略学习、和Inverse IL来模仿人类的驾驶行为,这种监督模式的知识学习方式对大多数场景是比较有效的,而且学习效率高于DRL, 但同时缺陷也非常明显,其一是模仿学习永远难以超越人类的驾驶水平,其二是涉及交通安全的场景,CoR问题依旧存在,存在数据集偏置不平衡和实验与真实场景不匹配“Covariate Shift”的问题。现在一种比较通用的方法是把Deep IL与DRL相结合来提升学习效率。这里值得一提的是将图神经网络Graph attention-based Network (GAT)与DRL结合,利用自关注GAT来对异构交通信息(路面结构和车辆状态)进行编码和对车辆 交互进行隐形建模,DRL的策略网络综合了基于像素的和基于状态的知识信息来无监督训练AVs来适应动态变化的城市交通场景,减少了对标注数据的依赖。


Deep Safe-RL的挑战


Deep Safe RL作为DRL的一种,通过一些先验假定(例如受限扰动集)与安全约束,来提升安全性能保证。Safe-RL通常可以建模成受限的马尔可夫决策过程CMDP,对应的可行策略集需要满足安全约束边界,优化目标是在累计约束下提供最大奖励性能和用最小的代价来满足安全。太约束的先验假定会导致部署时决策过于保守,反之则容易导致车祸发生,而且这些先验约束会与场景相关,仍难以应对不确定性的超级复杂场景,尤其是CoR和CoD问题的组合场景。目前对safe multi-agent RL的研究也处在刚起步阶段。


Safety Under Uncertainty:对ADS决策来说,知道我们什么时段不知道什么非常重要,同时我们也需要识别决策是否是确定可行的,一种常用的做法是对不同的路径规划提供安全性的概率估计来帮助决策。决策的确定性分析与可解释性,也有助于开发与验证工作。


CoR稀缺问题的挑战


涉及交通安全的事件场景数据是非常稀缺的。假定上亿英里里程数可能碰到一次AVs的致命事件,需要上万亿英里的里程数估计才能积累足够的数据。从工程实践来看是非常不现实的,虽然2022年已有几个国家先后开通了ADS L4车辆上路的法规,但这个僵局严重影响了AVs安全性能的提升和部署进程。一个可行的方案是通过收集人驾驶的车辆数据,例如美国交通部的统计,每年全美有3万亿英里的里程数累计,其中包括6百万次车祸,2百万人受伤,3万人致命伤亡事件。避开数据采集的隐私问题不谈,这类自然驾驶环境(NDE)海量车辆轨迹数据,可以有助于建立高保真NDE模型,从而通过仿真环境来构建大量合成数据,这样的思路在过去对其它行业感知类视觉任务已经证明是非常行之有效的。


图5. ADS协同CAV的呈现图 (Khan, 2022)


业界第二种思路是将这类涉及交通安全事件的发生概率降低到人类可以接受或者可以忽略的水平。如图5所示,解决问题的途径包括协同CAV技术,即通过对道路基础设施部署大量的多模传感设备(Camera、LiDAR、Radar),通过V2V,V2I(例如路边边缘计算设备RSD)和V2X通信技术来提供车车或者车路协同来实现知识与信息共享,有效解决单辆自动驾驶汽车由于遮挡和有限视野问题产生的难决策的僵局。相对而言,单AV的多摄像头、多模融合感知多任务共享,以及CAV(V2V,V2I)之间跨摄像头、跨模感知融合技术目前已经有非常明显的进展。


小样本数据问题,一直是业界的一个大难题。零样本或者小样本学习,持续学习或者终身学习,也一直是学术界的研究重点,从人类常识角度来说,也是可行的。人类的推理学习模式是两种的融合:从底往上推理(感知数据驱动建模)+由上往下推理(知识学习与认知期待驱动推理)。ADS在知识推理层面演进也应该能够解决CoR和CoD的综合难题。DL算法演进能够有效解决CoD问题,稀有事件的仿真也许可以有效解决CoR问题,通过有限数据与数学物理模型的组合应用在液体动态力学有了一些长足进展,期待类似思路能够应用到ADS领域。


参考文献

【1】M. Khan, and etc., “Level-5 Autonomous driving - are we there yet?”, https://www.researchgate.net/publication/358040996

【2】H. Liu, and S. Feng,“Curse of rarity for autonomous vehicles”, https://arxiv.org/ftp/arxiv/papers/2207/2207.02749.pdf



复睿微电子复睿微电子是世界500强企业复星集团出资设立的高新技术企业。复睿微电子根植于创新驱动的文化,通过技术创新改变人们的生活、工作、学习和娱乐方式。公司成立于2022年1月,目标成为世界领先的智能出行时代的大算力方案提供商,致力于为汽车电子、人工智能、通用计算等领域提供以高性能芯片为基础的解决方案。目前主要从事汽车智能座舱、ADS/ADAS芯片研发,以领先的芯片设计能力和人工智能算法,通过底层技术赋能,推动汽车产业的创新发展,提升人们的出行体验。在智能出⾏的时代,芯⽚是汽⻋的⼤脑。复星智能出⾏集团已经构建了完善的智能出⾏⽣态,复睿微是整个⽣态的通⽤⼤算⼒和⼈⼯智能⼤算⼒的基础平台。复睿微电子以提升客户体验为使命,在后摩尔定律时代持续通过先进封装、先进制程和解决⽅案提升算⼒,与合作伙伴共同⾯对汽⻋智能化的新时代。

TechSugar 做你身边值得信赖的科技新媒体
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 96浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 33浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 135浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 34浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 20浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 106浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 155浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 69浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 82浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 101浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 117浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦