定位技术的关键:基于环境特征的地图匹配(三)

原创 汽车电子与软件 2022-09-13 18:05

作者:陶博士,复睿微剑桥研究所 ADS算法科学家

定位技术:自动驾驶的基础(上)

定位技术:自动驾驶里程计技术对比(二)

在上一篇自动驾驶定位深度学习:里程计中,我们分析了深度学习在航迹推算方案的应用。航迹推算持续跟踪汽车的⾃我运动并估算相对姿势,在给定初始状态的情况下,通过整合这些相对姿势来重建全局轨迹,从而实现定位。

这一篇,我们讨论另一个定位的关键技术,基于环境特征的地图匹配定位。地图匹配定位是根据车辆相对于当地地标的位置来进行定位。在许多情况下,我们有提供当地地标的地图作为参考框架。基于先验地图,我们匹配历史中最相似的地图子集(图像/点云/特征点),根据匹配到的地图子集所提供的历史位姿真值、特征点坐标真值,计算点对间的变换矩阵,求解当前定位。地图匹配定位通常会输出相对的XYZ坐标,滚动/俯仰/偏航數值,或表示方向和空间自由的四元数。最流行的地图匹配定位算法有迭代最近点 (ICP) 以及正态分布变换 (NDT)。

为了进行地图匹配定位,我们必须有某种形式的传感器输入,例如激光雷达,雷达,相机等。使用激光雷达,可以会得到相对于基于点云的地图 (Point-cloud-based map) 的定位;使用雷达,可以得到相对于基于返回的地图 (Return-cloud-based map) 的定位;使用具有分类和深度的相机的位置,可以得到相对于基于对象的地图 (Object-based map) 的定位。

本文讨论主要集中在基于点云地图的 ICP 和 NDT 算法的原理和性能区别,以及相应拓展的深度学习⽅法。



01


基于点云的地图匹配方法


自动驾驶汽车中,摄像头被广泛应用,基于大量图像数据的深度学习应用的方式和功效已被广泛研究。然而,由于相机拍摄的图像只能记录二维的环境,不能用于准确估计三维环境,激光雷达(LiDAR)因此引起了业界的关注。在适当条件下,相比其他环境传感器,如摄像头和雷达,激光雷达更加精确和稳健,能够获取误差率在一厘米以内的三维距离信息。

在实际操作中,由于城市和郊区环境会不断变化,会影响匹配算法的精度。这些变化发生在不同的时间尺度上,包括动态和短暂的对象(例如停放的汽车),季节性的变化(植被、雪、灰尘)和人类影响,例如建造。因此,算法面对这些真实环境变化时的鲁棒性至关重要。其次,由于自动驾驶系统必须根据车辆行驶过程中环境变化做出实时决策,低延迟性极其关键。典型城市车速15~35mph,超过 100 毫秒的延迟将导致可能导致米级别的车辆位置不确定性,导致安全问题。因此,匹配算法需要同时考量精度和速度。

1. a: 实际地图 b: 点云地图 

作为业界最流行的三维环境点云匹配算法,ICP 和 NDT 已广泛用于地图构建和三维重建。图 2 展示了正态分布地图与点云地图之间的地图匹配过程。该过程对点云中的所有点执行匹配过程并重复,直到获得准确的汽车姿态估计。

2. 地图匹配流程 


迭代最近点 (ICP)

ICP 是最简单且易于实现的匹配算法,它用迭代的方法不断地最小化传感器数据和参考环境地图之间的点到点的欧几里得距离。在每一步中,选择离每个扫描点最近的参考点,并用最小化距离平方和来分别计算旋转和平移。

3. ICPUdacity Self Driving Car Nanodegree)


正态分布变换 (NDT)

NDT 不像 ICP 那样使用点云的各个点,而是将位于三维像素内的 3D 数据点转换为正态分布。它把环境用局部概率密度函数 (PDF) 建模成一个平滑表面。参考点被分组为固定大小的单元格,形成三维像素网格,并用牛顿迭代法匹配最优的网格区间。

 4. NDTUdacity Self Driving Car Nanodegree)


ICP 与 NDT 的性能对比

相关的研究显示,当在小范围并有足够数量的特征时,这两种方法都表现得非常稳健,但 NDT 的运行速度比 ICP 快得多,并且定位误差要小得多。与 ICP 中关注单个点相比,将环境进行三维像素概率化的表达使得 NDT 能够获得环境的整体认知而不只是细节。基于 NDT 的方法具有更好的能力来处理实际变化,包括静态和动态的环境变化,以及计算效率更高。研究同时显示,NDT 的性能很大程度取决于三维像素分辨率的选择。换句话说,需要根据传感器精度以及环境条件,仔细地调整三维像素的大小,才能保证其性能。

然而,在进行大规模的环境匹配时,ICP 和 NDT 作为传统的点云匹配方法,都显示无法胜任所需的通用性和可扩展性,计算上也缺乏效率。

 5. ICP 与 NDT 在不同像素下的性能对比

 6. ICP 与 NDT 在转弯时性能对比



02


地图匹配深度学习


基于深度学习的地图匹配一直存在着相当的挑战性,这与现有解决方案中常用的模型的局限性有关。现有方案把地图匹配理解为图神经网络(GNN)或序列到序列(seq2seq)结构,然而,这些方案无法完全捕捉 3D 点云中的空间分布和上下文线索,也无法进行并行处理,因而地图匹配的精度和速度都不理想。而且,现有解决方案常常会对原始密集的 3D 点云进行下采样操作,而导致局部几何信息的退化。

深度学习的最新发展,尤其是在 Transformer 方面的研究,开始改变这个现状。

Transformer 同时考虑数据点的内部相关性轨迹,以及输入轨迹和输出路径之间的外部关系,通过并行的方式使用自我和多头注意机制提取多组特征表达,从而实现更精确和快速的匹配。以下,我们将细节讨论基于 Transformer 的 ICP 和 NDT 的深度学习模型。

DCP:基于 Transformer 的 ICP

ICP 及其变体为地图匹配提供了简单且易于实现的迭代方法,但是由于算法本身的局限性,常常收敛到虚假的局部最优。来自于自然语言处理和计算机视觉的最新发展 Transformer 提供了新的灵感。DCP 设计了一个模块,在获取本地特征值之后,通过捕获自我注意力和有条件的注意力机制来学习上下文线索。

 7. DCP 网络架构

DCP 由三部分组成:

(1)DGCNN 模块将输入 3D 点云映射到固定的表征排列,

(2)基于 Transformer 的注意力模块,结合指针网络预测点云之间的软匹配,

(3)奇异值分解层(SVD)预测运动转变。

注意力模块的加入使得 DCP 模型能足够可靠地一次性提取对齐两个输入 3D 点云间的运动所需的对应关系,并且还可以通过经典 ICP 的迭代方法继续提高。相应的实验展示 DCP 不仅高效,而且优于 ICP 和它的变体。

 8. DCP 性能对比


NTD-Transformer:基于 Transformer 的 NDT

NDT-Transformer 可以实现基于 3D 点云的实时和大规模地点识别。它采用三维空间的概率分布变换来压缩原始、密集的 3D 点云作为 NDT 单元,以提供几何形状描述表达。然后,利用 Transformer 网络从一组 NDT 单元中学习全局描述表征。受益于 NDT 和 Transformer 网络, NDT-Transformer 学习到的全局描述表征同时丰富了几何和上下文信息,然后使用查询数据库进行表征匹配检索,实现地点识别。与单独的 NDT 相比,NDT-Transformer 性能有明显的提升。

 9. NDT-Transformer 网络架构

NDT-Transformer 主要由三部分组成:

1)由点变换和不确定性反向传播组成的 NDT 表达模块,

2)残差 Transformer 编码器,

3) 局部聚合描述表达的描述向量 (NetVLAD)。

在将 3D 点云 NDT 化之后,与大多数人的现有方法利用 KNN 分组对上下文信息建模的方法不同, NDT-Transformer 使用注意力机制来学习底层地标(NDT 单元)之间的上下文,并采用残差 Transformer 编码器聚合一个 NDT 单元与其他 NDT 单元的上下文线索,以增加表征的独特性。然后, NDT-Transformer 使用 NetVLAD 代替最大池化层来提高 3D 点云描述的排列不变性。NetVLAD 通过记录本地特征与参照特征之间区别的统计信息以及总和,将一组本地描述聚合生成一个全局描述表征向量。最后使用一个多层感知器 (MLP),将一组 NDT 单元描述表征融合为一个固定大小的全局描述表征向量。

NDT-Transformer 通过分层地聚合和增强局部特征,从而在运行时间和匹配结果上获得极好的表现。在 Oxford Robocar 数据集上的实验结果表明 NDT-Transformer 能够成功地找到 SOTA 性能和运行时间之间的妥协。

 10. NDT-Transformer 性能对比


03


小结


现有的研究中,并没有对都是基于 Transformer 的 DCP 和 NDT-Transformer 精确性进行直接对比,但理论上来讲, NDT-Transformer 在计算效率上具有更高的通用性和可扩展性。虽然因为篇幅的原因,我们无法详尽地含括所有的深度学习在地图匹配方面的应有,但令人欣喜的是最新的深度学习发展,尤其是 Transformer,通过引入自注意力机制和上下文的信息提取,给地图匹配算法提供了新的灵感和研究方向。


参考文献

Development of a GPU-Accelerated NDT LocalizationAlgorithm for GNSS-Denied Urban Areas,Keon Woo Jang, Woo Jae Jeong and Yeonsik Kang, Sensors, 2022.

NDT-Transformer: Large-Scale 3D Point Cloud Localisation using the Normal Distribution Transform Representation,Zhicheng Zhou, Cheng Zhao, Daniel Adolfsson, Songzhi Su, Yang Gao, Tom Duckett and Li Sun, Arxiv, 2021.

Deep Closest Point: Learning Representations for Point Cloud Registration, Yue Wang and Justin M. Solomon, Arxiv, 2019.

Map-Matching Algorithms for Robot Self-Localization: A Comparison Between Perfect Match, Iterative Closest Point and Normal Distributions Transform, Heber Sobreira, Carlos Miguel Correia da Costa, Ivo M. Sousa and Luís F. Rocha, Springer, 2019.

3D Scan Registration Based Localization for Autonomous Vehicles - A Comparison of NDT and ICP under Realistic Conditions, Su Pang, Daniel Kent, Xi Cai, Hothaifa Al-Qassab, Daniel Morris and Hayder Radha, Arxiv, 2018.


  • 关于复睿微

复睿微电子是世界500强企业复星集团出资设立的先进技术型企业。公司目标成为世界领先的智能出行时代的大算力方案提供商,致力于为汽车电子、人工智能、通用计算等领域提供以高性能芯片为基础的解决方案。目前主要从事汽车智能座舱、ADS/ADAS芯片研发,以领先的芯片设计能力和人工智能算法,通过底层技术赋能。

复睿微是复星智能出⾏⽣态的通⽤⼤算⼒和⼈⼯智能⼤算⼒的基础平台。复睿微电子以提升客户体验为使命,在后摩尔定律时代持续通过先进封装、先进制程和解决⽅案提升算⼒,与合作伙伴共同⾯对汽⻋智能化的新时代。



汽车电子与软件 主要介绍汽车电子软件设计相关内容,每天分享一篇技术文章!
评论
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 51浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 106浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 132浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 74浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 83浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 78浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 175浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 146浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 124浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦