自动驾驶算法逻辑框架中的三层特性

TechSugar 2022-06-30 08:00








自动驾驶算法逻辑框架中的三层特性

“多”重,“自”主,“深”化演进


复睿微电子

方涛 博士






前言



自动驾驶,作为目前汽车产业整体集中发力的重要技术方向,是一项融合了传感器,先进算法,软件生态,芯片硬件,地图导航,整车架构、信息安全、法律法规等多元素多维度,综合性系统工程。


在这之中,算法的开发和演进对于自动驾驶技术的发展起到至关重要的作用。目前的自动驾驶系统在工程实现上依然面临各式各样的挑战,例如:极端恶劣的天气条件,复杂多变的交通状况,千奇百怪的corner case,以及与传统智能硬件设备相比更为苛刻的功能安全等等。这也决定了整个算法的逻辑框架是复杂的,进化的,多粒度的。


因此,我们以自底而上的方式,分析自动驾驶算法在逻辑框架的各个层面的特性,梳理对自动驾驶算法的理解以及对未来算法发展方向的展望。








01

“Multi-”

是自动驾驶算法的底层特性,来源于驾驶环境的复杂性。这一特性体现在:多传感器输入,多模态信息,多任务处理,多尺度分析,等等。



· 多传感器输入


随着自动驾驶等级从L1向L5的提升,对传感器数量的需求也是与日俱增。以信号像素分辨率最大,语义最清晰的摄像头为例,在L2等级的自动驾驶阶段,摄像头的数目一般不超过5个,而以L4为目标的车型上,摄像头的数目一般在10个乃至15个以上。


更多的传感器可以让车辆感知更多更精准的信息,而一部分的信息冗余也能为自动驾驶提供更好的功能安全保障。这就要求感知算法必须以极低的延迟处理来自多数据源的数据,以提供即时可靠的信息,保障行驶的安全顺畅。








· 多模态信息


除了传感器的数目众多之外,传感器的种类也是多种多样。比如提供图像信息的摄像头,红外传感器,提供点云信息的激光雷达和毫米波雷达,提供距离信息的超声波传感器,提供位置信息的GNSS模块,提供位姿信息的惯性传感器等等。


多样的传感器决定了输入信号的多模态形式,也使得各种传感器信息互补,冗余安全。例如,相比于可以提供高像素分辨,色彩信息的摄像头,雷达传感器虽然缺少语义信息,但却可以提供极高精度的点云即深度信息,并且不受环境光照条件的影响。


因此将各种传感器,多种模态输入的信息进行融合是感知算法中的重要模块。主流的实现方向有前融合和后融合两种。后融合算法在各模态信息进行特征提取的基础之上进行融合,数据和算力的要求较低,但信息互补的效力也随之降低。


与之相对,前融合算法以不同传感器的原始数据进行融合,能够更好的保留冗余异构的多模信息,更好的达到以数据之间的互补来降低识别误判的风险的效果。同时,高安全性,高鲁棒性的前融合算法对算力也提出更高的挑战。


· 多任务处理


车辆在行驶过程中需要同时对多任务进行处理,例如感知信号的识别,检测,分割,融合,目标追踪,行为预测,规划决策等等。能否高效的,即时的处理多任务是保证车辆行驶安全的重要因素之一。


基于多任务处理的算法设计核心思路是尽可能多的复用骨干网络来提取特征以支持不同的下游任务。这样做首先可以节省资源开销,降低运算时延,其次由于各任务是基于相同的信息进行分析和处理,可以充分保证结果的一致性和连贯性。Tesla的九头蛇网络就是一种非常形象的多任务网络架构。


· 多尺度分析


车辆行驶的环境是复杂多变的。从卡车,汽车,到单车,行人,乃至远处的交通信号和路上的锥桶障碍,需要检测和追踪的目标的大小,以及目标显示在传感器上的尺度千差万别。


因此,多尺度分析的发展,对于自动驾驶的算法,尤其是感知模块的算法会有相当显著的提升。以特征金字塔网络(FPN)和Swin Transformer等类似的多尺度特征分析网络架构在自动驾驶系统的应用中提供高效的感知分析能力。




02

“Self-”

是自动驾驶算法的中间逻辑层的特性,来源于算法的终极目标—自动驾驶。这一特性体现在:自监督算法,自注意力机制,自适应大小的高效网络设计空间,等等。



· 自监督算法


有监督的深度学习算法在自动驾驶领域已经有了长足的发展和应用,而自监督或无监督的深度学习算法还有相当深厚的应用潜力有待挖掘。


深度学习的算法是数据驱动的,自动驾驶更是如此。有监督学习需要以大量的标注数据对深度模型进行训练,标注数据的数量和质量极大程度上影响模型的训练结果。而大量的优质标注数据则意味着极大的时间,人力成本。而自监督学习框架可以极大程度的减少学习过程对于标注样本的依赖。譬如利用数据增广产生的正样本与其他数据的负样本之间的度量对比,或部分内容掩盖再预测的方式学习到信息数据的本质特征。再由自监督学习中得到的理解了数据本质的预训练网络应用于各项下游任务中。


除了判别式的自监督,生成式的自监督算法在自动驾驶领域也有不可忽视的地位。在小样本数据的情况下,通过对抗生成网络(GAN)的数据增强能使训练获得更好的学习效果。此外,更高的自动驾驶等级也意味着更高的系统安全性要求,而GAN网络在数据安全的攻击对抗算法中有着举足轻重的作用。


强化学习是自动驾驶中规划控制算法的重要研究方向。其中以行为克隆(Behavior cloning)为代表的有监督强化学习是目前较为主流的方案,期望以专家的行为模板为机器算法提供常识性的学习经验。然而这样的模仿学习需要大量的专家行为数据,而且模型的泛化能力也很差,很难应对复杂的道路状况。就如同围棋领域,没有学习任何人类经验的AlphaGo Zero在自我对弈了数百万盘棋局之后,棋力已远超参考人类棋谱的前辈Alpha Master。


相信在自动驾驶的领域里,随着交通法规的不断细化完善,虚拟环境仿真能力的不断增强,以及芯片算力的不断提高,自监督的强化学习也将取代模仿学习成为规划控制模块研究的新方向。





· 自注意力机制


基于自注意力机制的Transformer算法从最初的NLP领域成功出圈到视觉领域后同样取得了令人惊叹的成绩。卷积神经网络(CNN)可以高效的对图像进行特征提取是基于图像信息局部性、平移不变性、权重共享和稀疏连接的归纳偏置。而CNN网络感受野较小等局限性同样来自于这样的归纳偏置。


相对应的,transformer的自注意力机制拥有强大的全局建模能力,从根本上规避了卷积网络归纳偏置的缺陷,对于数据整体特征的理解更有优势。除了应用于传统视觉的识别,检测,和分割等任务之外,自注意力机制的全局理解能力也能很有效的应用于多模态信息处理,例如多传感器融合的算法中。


· 自适应大小的高效网络设计空间


网络设计空间是由Facebook AI团队提出的网络设计新范式。如果把每一各网络结构看作某种空间上的一个点,那么所有可能的网络所组成的点的集合就构成一个空间。按照一定设计规则和参数范围所映射的子空间就构成一个网络设计空间。这种新范式的设计目标是用通用性和普适性更高的规则寻找一个高性能,高泛化性的网络设计空间,即一个网络架构簇,而不再是寻找单一的网络。


文章中提出的Regnet就是用这种方法构建出的一套网络设计空间。使用这种设计方式的优势在于,用网络设计空间的逻辑构建出的网络簇可以兼顾网络表现的整体一致性和网络尺度的多样性,当芯片算力提升,希望增加网络模型的大小以优化算法表现时,用设计空间的更大网络替换较小网络就能实现目的。因为网络空间的整体一致性使得设计空间中网络间的泛化性增强,网络架构的优化历程可以由随机性的搜索变成系统性的演进。




03

“Deep-”

 是整个自动驾驶逻辑框架最顶层的特性,是自动驾驶算法未来发展的方向。



在目前的工程实践中,感知模块中的传统算法已逐渐被深度学习算法取代,而在信息融合,跟踪预测等任务以及规划控制模块中,传统算法还是发挥着重要作用。例如卡尔曼滤波算法在信息融合和跟踪预测等任务中有相当活跃的表现,而在规划模块中,基于控制论和机器人学的算法也被广泛应用于运动路径规划中。








尽管如此,我们相信深度神经网络的算法代替传统算法几乎是必然的趋势。在深度学习已经涉及的所有科学技术领域,人们都无一例外的发现,只要提供足够的算力,深度学习方法对比传统算法在精度,普适性,泛化性上都取得压倒性的优势。


随着车载芯片算力的不断提升,感知,融合,预测,规划,控制等一个个任务模块被深度学习算法取代,并最终有可能形成一个端到端的完整深度网络模型,是未来自动驾驶发展的趋势和方向。


作者介绍:方涛博士,毕业于南京大学,日本京都大学博士后研究员。长期从事汽车行业算法研究。


免责声明:本文系网络转载,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将立即删除内容!本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。

TechSugar 做你身边值得信赖的科技新媒体
评论 (0)
  • 二、芯片的设计1、芯片设计的基本流程 (1)需求定义: 明确芯片功能(如处理器、存储、通信)、性能指标(速度、功耗、面积)及目标应用场景(消费电子、汽车、工业)。 (2)架构设计: 确定芯片整体框架,包括核心模块(如CPU、GPU、存储单元)的协同方式和数据流路径。 (3)逻辑设计: 通过硬件描述语言(如Verilog、VHDL)将架构转化为电路逻辑,生成RTL(寄存器传输级)代码。 (4)物理设计: 将逻辑代码映射到物理布局,涉及布局布线、时序优化、功耗分析等,需借助EDA工具(如Ca
    碧海长空 2025-04-15 11:30 136浏览
  • 展会名称:2025成都国际工业博览会(简称:成都工博会)展会日期:4月23 -25日展会地址:西部国际博览城展位号:15H-E010科士威传动将展示智能制造较新技术及全套解决方案。 2025年4月23-25日,中国西部国际博览城将迎来一场工业领域的年度盛会——2025成都国际工业博览会。这场以“创链新工业,共碳新未来”为主题的展会上,来自全球的600+ 家参展企业将齐聚一堂,共同展示智能制造产业链中的关键产品及解决方案,助力制造业向数字化、网络化、智能化转型。科士威传动将受邀参展。&n
    科士威传动 2025-04-14 17:55 83浏览
  •   高空 SAR 目标智能成像系统软件:多领域应用的前沿利器   高空 SAR(合成孔径雷达)目标智能成像系统软件,专门针对卫星、无人机等高空平台搭载的 SAR传感器数据,融合人工智能与图像处理技术,打造出的高效目标检测、识别及成像系统。此软件借助智能算法,显著提升 SAR图像分辨率、目标特征提取能力以及实时处理效率,为军事侦察、灾害监测、资源勘探等领域,提供关键技术支撑。   应用案例系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合
    华盛恒辉l58ll334744 2025-04-14 16:09 146浏览
  • 一、智能门锁市场痛点与技术革新随着智能家居的快速发展,电子门锁正从“密码解锁”向“无感交互”进化。然而,传统人体感应技术普遍面临三大挑战:功耗高导致续航短、静态人体检测能力弱、环境适应性差。WTL580微波雷达解决方案,以5.8GHz高精度雷达感知技术为核心,突破行业瓶颈,为智能门锁带来“精准感知-高效触发-超低功耗”的全新交互范式。二、WTL580方案核心技术优势1. 5.8GHz毫米波雷达:精准感知的革命全状态人体检测:支持运动、微动(如呼吸)、静态(坐卧)多模态感知,检测灵敏度达0.1m/
    广州唯创电子 2025-04-15 09:20 77浏览
  • 一、芯片的发展历程总结:1、晶体管的诞生(1)电子管时代 20世纪40年代,电子管体积庞大、功耗高、可靠性差,无法满足计算机小型化需求。(2)晶体管时代 1947年,贝尔实验室的肖克利、巴丁和布拉顿发明点接触晶体管,实现电子信号放大与开关功能,标志着固态电子时代的开端。 1956年,肖克利发明晶体管。(3)硅基晶体管时代 早期晶体管采用锗材料,但硅更耐高温、成本低,成为主流材料。2、集成电路的诞生与发展 1958年,德州仪器工程师基尔比用锗材料制成世界上第一块含多个晶体管的集成电路,同年仙童半导
    碧海长空 2025-04-15 09:30 107浏览
  • 一、磁场发生设备‌电磁铁‌:由铁芯和线圈组成,通过调节电流大小可产生3T以下的磁场,广泛应用于工业及实验室场景(如电磁起重机)。‌亥姆霍兹线圈‌:由一对平行共轴线圈组成,可在线圈间产生均匀磁场(几高斯至几百高斯),适用于物理实验中的磁场效应研究。‌螺线管‌:通过螺旋线圈产生长圆柱形均匀磁场,电流与磁场呈线性关系,常用于磁性材料研究及电子束聚焦。‌超导磁体‌:采用超导材料线圈,在低温下可产生3-20T的强磁场,用于核磁共振研究等高精度科研领域。‌多极电磁铁‌:支持四极、六极、八极等多极磁场,适用于
    锦正茂科技 2025-04-14 13:29 71浏览
  • 三、芯片的制造1、制造核心流程 (1)晶圆制备:以高纯度硅为基底,通过拉晶、切片、抛光制成晶圆。 (2)光刻:光刻、离子注入、薄膜沉积、化学机械抛光。 (3)刻蚀与沉积:使用干法刻蚀(等离子体)精准切割图形,避免侧壁损伤。 (4)掺杂:注入离子形成PN结特性,实现晶体管开关功能。2、材料与工艺创新 (1)新材料应用: 高迁移率材料(FinFET中的应变硅、GaN在射频芯片中的应用); 新型封装技术(3D IC、TSV硅通孔)提升集成度。 (2)工艺创新: 制程从7nm到3nm,设计架构由F
    碧海长空 2025-04-15 11:33 177浏览
  • 你知道精益管理中的“看板”真正的意思吗?在很多人眼中,它不过是车间墙上的一块卡片、一张单子,甚至只是个用来控制物料的工具。但如果你读过大野耐一的《丰田生产方式》,你就会发现,看板的意义远不止于此。它其实是丰田精益思想的核心之一,是让工厂动起来的“神经系统”。这篇文章,我们就带你一起从这本书出发,重新认识“看板”的深层含义。一、使“看板”和台车结合使用  所谓“看板”就是指纸卡片。“看板”的重要作用之一,就是连接生产现场上道工序和下道工序的信息工具。  “看板”是“准时化”生产的重要手段,它总是要
    优思学院 2025-04-14 15:02 117浏览
  • 一、智能语音播报技术演进与市场需求随着人工智能技术的快速发展,TTS(Text-to-Speech)技术在商业场景中的应用呈现爆发式增长。在零售领域,智能收款机的语音播报功能已成为提升服务效率和用户体验的关键模块。WT3000T8作为新一代高性能语音合成芯片,凭借其优异的处理能力和灵活的功能配置,正在为收款机智能化升级提供核心技术支持。二、WT3000T8芯片技术特性解析硬件架构优势采用32位高性能处理器(主频240MHz),支持实时语音合成与多任务处理QFN32封装(4x4mm)实现小型化设计
    广州唯创电子 2025-04-15 08:53 93浏览
  • 时源芯微 专业EMC解决方案提供商  为EMC创造可能(适用于高频时钟电路,提升EMC性能与信号稳定性)一、设计目标抑制电源噪声:阻断高频干扰(如DC-DC开关噪声)传入晶振电源。降低时钟抖动:确保晶振输出信号纯净,减少相位噪声。通过EMC测试:减少晶振谐波辐射(如30MHz~1GHz频段)。二、滤波电路架构典型拓扑:电源输入 → 磁珠(FB) → 大电容(C1) + 高频电容(C2) → 晶振VDD1. 磁珠(Ferrite Bead)选型阻抗特性:在目标频段(如100MHz~1GH
    时源芯微 2025-04-14 14:53 96浏览
  • 在当今汽车电子化和智能化快速发展的时代,车规级电子元器件的质量直接关系到汽车安全性能。三星作为全球领先的电子元器件制造商,其车规电容备受青睐。然而,选择一个靠谱的三星车规电容代理商至关重要。本文以行业领军企业北京贞光科技有限公司为例,深入剖析如何选择优质代理商。选择靠谱代理商的关键标准1. 授权资质与行业地位选择三星车规电容代理商首先要验证其授权资质及行业地位。北京贞光科技作为中国电子元器件行业的领军者,长期走在行业前沿,拥有完备的授权资质。公司专注于市场分销和整体布局,在电子元器件领域建立了卓
    贞光科技 2025-04-14 16:18 139浏览
  • 在制造业或任何高度依赖产品质量的行业里,QA(质量保证)经理和QC(质量控制)经理,几乎是最容易被外界混淆的一对角色。两者的分工虽清晰,但职责和目标往往高度交叉。因此,当我们谈到“谁更有可能升任质量总监”时,这并不是一个简单的职位比较问题,而更像是对两种思维方式、职业路径和管理视角的深度考察。QC经理,问题终结者QC经理的世界,是充满数据、样本和判定标准的世界。他们是产品出厂前的最后一道防线,手里握着的是批次报告、不合格品记录、纠正措施流程……QC经理更像是一位“问题终结者”,目标是把不合格扼杀
    优思学院 2025-04-14 12:09 70浏览
  •   无人装备作战协同仿真系统软件:科技的关键支撑   无人装备作战协同仿真系统软件,作为一款综合性仿真平台,主要用于模拟无人机、无人车、无人艇等无人装备在复杂作战环境中的协同作战能力、任务规划、指挥控制以及性能评估。该系统通过搭建虚拟战场环境,支持多种无人装备协同作战仿真,为作战指挥、装备研发、战术训练和作战效能评估,提供科学依据。   应用案例   系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。   核心功能   虚拟战
    华盛恒辉l58ll334744 2025-04-14 17:24 87浏览
  • 四、芯片封测技术及应用场景1、封装技术的发展历程 (1)DIP封装:早期分立元件封装,体积大、引脚少; (2)QFP封装:引脚密度提升,适用于早期集成电路。 (3)BGA封装:高密度互连,散热与信号传输优化; (4)3D封装:通过TSV(硅通孔)实现垂直堆叠,提升集成度(如HBM内存堆叠); (5)Chiplet封装:异质集成,将不同工艺节点的模块组合(如AMD的Zen3+架构)。 (6)SiP封装:集成多种功能芯片(如iPhone的A系列SoC整合CPU、GPU、射频模块)。2、芯片测试 (1
    碧海长空 2025-04-15 11:45 172浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦