各企业纯视觉智驾技术方案盘点

智驾最前沿 2024-06-19 08:50

--关注星标「智驾最前沿」,回复“入群”--

↓↓免费进入:「智驾最前沿」微信社群(技术&商务)↓↓

纯视觉方案,马斯克是这样说的:“如果雷达与摄像头传来的信息相互矛盾,智能驾驶系统反而会难以抉择。不如只选其一,做到极致。”相比人眼,车辆摄像头可以同时“看”到每一个方向,视野范围达到360度,探测范围远超人类。各个方向的行人、障碍物,远处的红绿灯、交叉路口一切信息都“尽收眼底”。以特斯拉为代表的车企为了实现降本增效提出了纯视觉的智驾方案,国内汽车行业很快也认识到了纯视觉方案的经济效益,纷纷加入到这一技术路线的探索中。本文将举例分析多家企业的纯视觉智驾方案。

特斯拉
特斯拉从第一性原理出发选择“纯视觉”路线,把“看路”的工作完全交给摄像头,通过不断精进算法、强化硬件、训练车辆,全方位提升车辆观察世界、理解交通和处理问题的能力。特斯拉最早做纯视觉方案是比较有底气的,原因主要有几点:
(1)自研FSD芯片
为了更快处理视觉数据实现类似人类大脑的思考能力,特斯拉自主研发算力更强的FSD芯片,既负责图形处理,也负责数据处理和深度学习。
(2)自建Dojo超级计算机
特斯拉专门打造了Dojo超级计算机,突破全行业的算力瓶颈,用全球超百万台特斯拉车辆的真实驾驶数据(数据仅用于自动辅助驾驶功能的优化和升级),不断训练车辆应对各种行驶状况的能力。马斯克认为特斯拉的辅助驾驶技术已经不再受算力限制。
2023Q2特斯拉引入Dojo实现高效率、低成本的神经网络训练,累计里程由2023Q1不到1.5亿英里,到23Q2突破3亿英里;2023Q4引入“端到端”V12版本后,2023Q4突破7亿英里,2024年4月初突破10亿英里。
(3)海量数据优势和数据闭环
在特斯拉自动驾驶方案中,核心算法基本都是由数据驱动的,数据的数量和质量决定了算法的性能。特斯拉拥有海量实时驾驶数据,并构建了一套高效获取、标注及仿真训练的数据闭环。特斯拉数据闭环体系为:数据采集——搭建数据集——自动+人工标注——送入模型训练——部署到车端。
(4)持续迭代算法
经过大量训练和算法迭代,特斯拉的“大脑”会不断进化,更高效地处理摄像头拍摄的画面,做出更准确的判断。其中,HydraNet模型使用RegNet作为Backbone,BiFPN构建多尺度featuremap,并添加taskspecific的Heads。已经实现更精准地识别需要转弯的十字路口、提醒减速的交通标志、红绿灯变化,更熟练地理解其他行人和车辆的行为,更精准地测距等……

基于新一代自动辅助驾驶硬件(HW4.0),让特斯拉的纯视觉辅助驾驶掀开全新篇章。2024年4月,搭载更前瞻的自动辅助驾驶硬件HW4.0后,特斯拉的摄像头探测能力和芯片运算能力又得到了大幅提升,安全实力也获得更高水平的硬件保障:
HW4.0配备的双目摄像头拥有超过行业均值的探测能力,最远探测距离达424米,下个路口、甚至下下路口的路况能够提前掌握。前摄、后视、车周共7个500万像素摄像头组合,360度感知,视野更清晰,成像更精准。当车主停车时,纯视觉驻车辅助还能呈现高清3D图像,车辆周围的障碍物、喷漆路标都被“实时建模”,即使坐在车内,也能掌控全场,盲区死角都能看见。影像清晰度也得到了提升,使得需要处理的数据容量成倍增长,系统算力需求也相应增加。HW4.0芯片算力提升了5倍,复杂的图像情况也能够处理。

广汽研究院
广汽研究院于2024年4月12日正式发布无图纯视觉智驾系统,并计划于2026年搭载在量产车上。与目前主流的多传感融合技术相比,广汽无图纯视觉智驾系统不依赖高精地图,并去掉了激光雷达,结合视觉传感器和人工智能算法。
在实际道路测试中,在没有高精地图的情况下,广汽无图纯视觉智驾系统可实现城市NDA和高速NDA零接管,并且在雨中、夜晚也能正常行驶。
在技术层面,广汽无图纯视觉智驾系统在视觉识别上基于自研的道路感知多任务模型XRoadNet,通过多路相机输入的BEV+Transformer感知框架技术,对摄像头拍到的图像特征进行提取、融合,并转换到3D空间里。

在对信息作出决策和执行方面,广汽无图纯视觉智驾系统具有以下特点。一是对动态交通物体的实时跟踪、意图识别和轨迹预测;二是建立了数据驱动与专家规则协同的指挥大脑;三是研发了流体式时空联合规划技术,用来解决自车与其他交通参与者之间的博弈,提升交通效率。此外,广汽无图纯视觉智驾系统还通过自研的数据闭环和仿真系统,不断迭代算法,持续进化。


大疆车载
(1)首先是环境感知预测能力
大疆的“成行平台”利用BEV融合算法,把不同传感器的数据,在特征提取阶段映射到以本车坐标系下,然后进行融合,通过深度学习技术感知车辆周围环境,将输出的环境感知结果直接提供给下游的决策规划环节使用。
BEV算法把传感器输出的环境特征映射到本车坐标系,所以可以根据车辆的位姿,把前后时刻道路特征进行对齐。BEV算法天然对时序特征融合较为友好,而且时序检测对于遮挡场景效果也会更加稳定,因此,在BEV算法下通过对车辆不同时刻位姿的特征,转换到当前本车坐标系下,便可以进行结果预测。BEV感知算法不仅能预测出下游所需的丰富语义信息(如车道线、地面标识、道路边缘、车道中心线、导流带、道路分割等语义信息),还能预测出具有更高语义信息的拓扑信息(如车道分流和合流、路口拓扑等)。将这些道路语义信息,按照前后时序进行拼接融合,便可得到一张可达空间内的在线局部“高精度地图”,为车辆的智能驾驶提供实时的道路动静态高精度信息。
基于BEV感知算法的输出,“成行平台”能在不依赖高精地图情况下,在缺失、磨损的车道线道路上,顺利完成车道保持这样的基础行车辅助功能,也能在领航高速中完成上下匝道及领航城区时的路口左右转等高阶智能驾驶功能,极大地脱离了功能使用需要高精地图覆盖的限制。
(2)局部位姿估计:高精度融合定位
大疆车载“成行平台”的硬件只有一对前视惯导立体双目摄像头、一个后视单目摄像头,以及四个环视鱼眼摄像头。
解决了可达空间内的环境感知预测问题,还需要对车辆的运动轨迹做出稳定的高精度融合定位。大疆的“成行平台”以惯导立体双目为主导的SLAM技术,在拥堵、暴雨、夜间及地下停车场等多个场景,可保持稳定、高精度的车辆轨迹估计,同时支持扩展接入其它周视单目、鱼眼等多种相机,以进一步提升性能。
为了避免这样的情况发生,“成行平台”对车辆运动轨迹的,不仅能够实习轮速和IMU两类传感器的输入,还在线融合了以双目深度估计为主导的视觉信息,即通过利用图像信息,结合3D的视觉原理,便能够直接获取到前后两帧图像的相对位置、姿态信息。

2023年,大疆和奇瑞推出了完全采用纯视觉硬件智驾的iCAR03,最基础的智驾版本仅仅只装配了7颗摄像头,算力低到只有32TOPS。
其中四颗环视摄像头分布在车身前后左右,再加上车身前方一个双目传感器(两个摄像头),车后一个后视单目摄像头,车中一个高性能控制器。
2023年,宝骏云朵搭载大疆第二代贯导双目摄像头智驾方案,采用前置双目800万像素的摄像头的纯视觉方案。
2024年4月,上汽大众和一汽大众宣布在新款途观LPro版和新一代迈腾上采用大疆的7V+100Tops的惯导双目纯视觉智驾方案,成本在7000元左右
大疆目前推出的均为纯视觉方案,但实际上大疆车载并不排斥激光雷达。大疆的下一代方案中,已有激光雷达上车计划。2024年北京车展上,大疆车载发布激目系统,即惯导三目集成一个全链自研的激光雷达。

百度
百度ANP3Pro智驾方案基于纯视觉方案,取消了激光雷达,硬件包括1颗算力254TOPs的英伟达芯片、11颗摄像头、3颗毫米波雷达、12颗超声波雷达,总成本仅需万元。在百度Apollo的技术生态中,有超过7000万公里的高质量的Robotaxi原始数据积累,打下了“纯视觉技术方案”的“冷启动”数据基础。百度AI拥有超过170亿参数的视觉大模型、高标准的自动化标注产线实现日均产能过百万(帧)、高质量标注数据BEV+OCC精标训练数据过亿(帧),能够大幅提升数据处理效率和精度。
2024年1月极越01整车OTA升级,与百度Apollo联合研发的OCC占用网络(OccupancyNetwork)。极越01以“BEV+OCC+Transformer”的高阶智驾的完整体系,大幅提升“纯视觉”智驾方案应对异形障碍物识别和场景泛化的能力。OCC占用网络通过一个个像素立方体,将实时变化的真实世界在3D空间里进行实时重建,并将汽车视觉世界里各种不规则的物体,如障碍物、道路、建筑,甚至花草树木,快速、精准地完成等比例复刻,显著增强智能汽车理解周围环境的能力。百度和极越已基于近2EFLOPS高算力训练集群,实现模型高效训练、每周快速迭代。

华为
华为ADS2.0在BEV感知能力基础上,使用GOD网络,可以识别通用障碍物白名单外形态各异、大小不一的障碍物。其中ADS2.0纯视觉方案(基础班):使用前视双目摄像头进行感知,不依赖高精地图。它能够检测异形障碍物,具有较低的成本。ADS2.0激光雷达方案:使用激光雷达和毫米波雷达来弥补视觉感知的缺陷,具有精度高、范围大、抗干扰能力强的特性。
智界S7Pro版车型搭载HUAWEIADS2.0基础版,搭载3个毫米波雷达、10个视觉感知高清摄像头组及12个超声波雷达,实现不依赖激光雷达的视觉智驾方案。依靠纯视觉方案收集车辆周围的路况信息,并能在高速、城市快速路中可实现领航辅助驾驶功能,智能泊车也能够实现多场景的泊入功能,用户还可选择车头或车尾泊入。
智界S7Max以上的版本仍然采用的激光雷达方案。因为华为视觉方案目前仅限于高速和城市快速路上使用,如果想要覆盖城市主干道和全国的支路,还是得上激光雷达方案。所以华为这样的智能驾驶巨头,仍然认为激光雷达是必不可少的。

小米
2024年3月28日小米SU7的发布会上,正式公布了小米SU7两套智驾系统,分别为:XiaomiPilotPro(纯视觉版)和XiaomiPilotMax(视觉+激光雷达版)。小米SU7纯视觉方案在BEV方面进行了创新,搭载了变焦技术,提高了理解的准确性和分辨率。在占用网络(OCC)部分有所创新,降低了对3D像素识别的依赖。全系标配高速NOA、代客泊车辅助、智能泊车辅助、极窄车位泊车,城市NOA4月开启了用户测试,预计2024年8月全国开通。

目前国内纯视觉方案的车辆都比搭载了激光雷达的便宜好几万,降本增效可能是推出纯视觉方案的主要原因。短期看拿掉激光雷达,降本效果会立即出现。然而从长期看,车企需要为这一选择投入更多的研发资源。要保证纯视觉智驾方案的的安全性,需要在纯视觉技术路线中投入很高的隐性成本,包括算法、路测数据、算力芯片、数据标注、仿真测试等方面。就像我们在海面上看到的冰山,仅仅只是冰山一角罢了,如何保证航行安全,需要再继续挖掘冰山的全部。因此,未来很长一段时间内,基于安全第一的原则,纯视觉技术还需要不断提高升级,切不可因降低成本而置安全不顾。

-- END --

声明:内容源自汽车视界研究,文中观点仅供分享交流,不代表本公众号立场,如涉及版权等问题,请您告知,将及时处理!

智驾最前沿 「智驾最前沿」深耕自动驾驶领域技术、资讯等信息,解读行业现状、紧盯行业发展、挖掘行业前沿,致力于助力自动驾驶发展与落地!公众号:智驾最前沿
评论
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 59浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 94浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 56浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 37浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 166浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 63浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 59浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 61浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 59浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 68浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦