如何打造自动驾驶系统?

智驾最前沿 2024-12-07 08:40

编者语:后台回复“入群”,加入「智驾最前沿」微信交流群


在纳斯达克完成递交招股书后,小马智行敲钟进入倒计时。

一支天才云集的队伍,创业8年,在自动驾驶领域打造出一家明星独角兽,靠的还是扎实的业务能力和领先的技术。

而小马智行的招股书,实际上也对自动驾驶技术做了一次完整又详实的科普。

根据招股书,小马智行的自动驾驶系统,可以拆解为几部分,下面来逐一了解。


传感器

自动驾驶汽车,想像人类司机一样行驶,就需要像人类司机一样,清楚地感知到路况,这就涉及到传感器:

  • 激光雷达

激光雷达,顾名思义,是使用激光束探测汽车周围的物体,在各种光照条件下,可以实现高分辨的距离感应。

多个位置部署激光雷达,可以在各种环境和光照条件下,观测到汽车、行人、交通信号灯等等,实时生成周围环境的三维图像。

  • 摄像头

多个高精度的摄像头,可以让车辆更全面、全方位地观察周围环境,没有重大盲点,能从中分辨、识别出障碍物,也能让交通状况的图景范围也更广泛。

  • 雷达

雷达是通过发射无线电波的方式,实现车辆的距离与速度探测,在雨、雪、雾等恶劣天气时,相比起激光雷达和摄像头,毫米级雷达表现更出色。

小马最新第六代自动驾驶汽车模型中,采用的就是以上三种结合的多传感器方法,配备了7 个激光雷达、11 个高分辨率摄像头和 3 个远程雷达,三种传感器优劣势互补,可以更有效观测到环境。

但传感器组件中,有单一传感器出现故障该怎么办?

在这个时候,除了感知环境,汽车的准确定位也是重要数据,所以小马还采用了GNSS 天线模组、IMU惯性测量单元等设备。

  • GNSS / IMU

高精度全球导航卫星系统 (GNSS) ,和惯性测量单元 (IMU),是和高清地图和定位模块协同工作的,可以确定汽车的准确定位。

端到端技术的软件堆栈

在招股书中,小马智行特别强调了自己的自动驾驶技术栈整体可以看成一个“大脑”,通过一整套软件模块和算法来控制车辆,这个大脑或者说AI司机,本身不受车辆平台种类限制,集成各种传感器类型和算法模块。

小马还着重强调端到端的可解释性,所以采用分段式模式,仍然包含感知、预测、规控、模拟等等模块,下面来一一详解:

  • 端到端驱动闭环演进

首先来看小马的端到端模型,通过融合可学习度量空间,模拟车辆在真实世界的行为,并且通过智能标记和特征提炼技术,把LLM的知识库迁移到端到端模型中,扩充原本有限的资源,方便系统处理复杂的驾驶条件。

而没做标记的数据,会通过自监督解释模型,继续训练世界模型和端到端模型,解释端到端的推理结果,包括感知结果、预测结果、做出的具体决策和详细的场景描述等等。

这种全面的可解释性,可以更深入地了解自主系统的功能和决策过程。

在这个过程中,为了保障适应性和准确性,小马智行加入了可学习优化模型,集成基于模型方法和优化方法,既具备数据驱动的特性,也保留了可控性。

另外,想要真正实现L4级的系统,只有当前和过去的数据预测未来是不够的,真正的挑战,还是在于如何与现实世界的频率相匹配,模拟长尾场景和行为,以实现开发的不断迭代。

因此,需要创建一个高保真的环境,方便模拟现实场景。这就是小马的闭环模拟引擎,PonyWorld。

PonyWorld在视觉细节和动态响应方面,精确复制了真实世界条件,这可以让系统突破功能的界限,模拟关键场景,比如突然出现的孩子、未盖的沙井,或前方车辆掉落的碎片等等。

这个系统会使用过去事件的记录和既定的未来事实,对各种未来场景进行合理的推断。

当自动驾驶汽车的未来行动与这些记录一致时,真值条件生成模型会如实反映记录中的未来;相反,当未来行动偏离记录时,模型会重建与记录不同的关键行为特征,以便保持可信度。

  • 感知与预测

车辆自动驾驶的过程,需要“虚拟驾驶员”能够“看到”汽车周边的环境,并且及时做出反应,这就需要具备感知和预测能力。

小马智行的感知和预测模块,采用的都是多模态、多任务和快速调整的大型Transformer框架。

在感知方面,采用的是快速学习技术,集成点云、图像和电磁响应等各种模态的输入,可以基于单一模型,准确检测各种不同类型的物体,并且大幅降低延迟。

通过处理传感器组件收集的数据,感知模块自动完成物体的分割、检测、分类、跟踪,以及场景的理解。

出现极端、恶劣天气,肉眼难以看清时,这种能力让自动驾驶车辆在行驶过程中,依然能无障碍感知环境,因此会比人类驾驶员表现得更好。

为了进一步提升感知模块的性能,感知模块中加入了深度学习技术处理数据,并且利用启发式方法,也就是人类知识和常识,在决策层添加确定性数学公式和规则,以此弥补深度学习技术中,模拟与现实之间的差距。

在预测方面,预测模块采用多模态深度学习模型,融合了感知观察和人类常识的信息。

这些常识,是从交通规则和人为设计的提示中提取,以知识图谱的形式表示,而Transformer结构,会捕获不同模态之间的相关性。

根据一系列数据,预测模块会给出判断。这些数据同样围绕传感器数据展开,又结合了感知模块的输出数据,以及类似道路代理的历史决策经验。

考虑到可能出现意外情况,在记录常规数据以外,数据集还针对每种情况,给预测模块添加了额外的可学习和针对性提示。

预测模块和感知模块类似,也采用了深度学习和启发式方法,为每个观测到的道路代理提供一条预测轨迹,并且会计算出发生的概率,为其他模块的工作提供参考。

  • 规划与控制

成功感知并预测数据之后,就要根据输入的数据,进行规划和执行操作了。

关于规划和控制模块,小马是靠AI来创建的,这里面涉及到博弈论的方法。

在模拟和分析 车辆与其他道路主体间的相互作用时,举个例子,如果自动驾驶汽车和有人驾驶汽车同时接近十字路口,博弈论会帮助自动驾驶车辆,选择最佳路线、平稳加减速,或者适当变道,确定一个最佳的行动决策,很适用于高峰时段、拥堵道路的场景。

同时,为了让驾驶行为和人类更接近,决策器中使用了强化学习人类反馈 (RLHF) 的调整机制。

利用人类贴标员,获取在各种情况下,有关自动驾驶系统的安全性、舒适性和效率的反馈,这些反馈会用于训练奖励函数,让这个函数在更大的数据集上调整深度学习决策。


硬件以及整车集成

了解完软件,接下来就是自动驾驶的汽车硬件,以及如何把每一部分整合在一起了。

  • 计算系统

从传感器收集到的数据,是由计算系统处理,通过算法实时运行来实现自动驾驶的。而车载计算单元,就负责处理传感器收集的数据。

小马智行的自动驾驶计算单元(ADCU),运用的是异构计算架构,包括中央处理单元(CPU)、图像处理单元(GPU),现场可编程门阵列(FPGA)和微控制器单元(MCU),是一个完全汽车级的计算平台,可以方便定义完全适配自动驾驶应用的计算架构。

利用ADCU计算平台,小马可以通过微调,保持性能和资源的消耗平衡。如果出现新技术,ADCU也可以更轻松地进行调整和升级,具备很强的灵活性和可扩展性。

  • 车辆集成

自动驾驶的最后一环,就是把每一部分系统,集成到车辆中。

小马智行的解决方案,是建立在汽车级硬件和软件工具链的基础之上,并加入了监管系统。

在自动驾驶软件堆栈和车辆平台之间,通过可靠的接口,实现车辆平台准确地接收并执行控制命令。

各个模块当中,车载系统提供了统一的应用程序交互接口(API),以便数据在整条传输路径上,能够保持稳定和顺畅。同时,车载监控系统,也能及时发现各模块中可能出现的故障。

还有最重要,也是最后的一重保障,就是安全冗余。

在小马的汽车模型中,冗余平台是通过冗余传感器、计算系统、电源以及执行器来保障安全的,这样可以避免出现单点故障的情况。

举个例子,在计算系统中,不同的处理器,会相互交叉检查,并充当彼此的备份系统,如果发生错误,GPU上运行的某些算法就会回退到CPU。

再举个例子,如果主电源系统发生故障,备用电源系统将无缝接合,确保计算系统的持续供电,保障车辆正常运行。

这个过程中,冗余有三层:正常运行模式、降级安全模式、最小风险条件模式。

降级模式和最小风险条件模式,是在物理上独立的冗余平台上运行,其中包括冗余传感器和计算。

如果在正常运行期间发生故障,平台就会检测到这些故障,并将系统转换为降级安全模式,让车辆行驶到安全位置。

如果发生降级安全模式也无法解决的严重故障,就会触发最小风险条件模式,让车辆至少可以在车道上停车,不会发生碰撞。

最后,作为这一切的载体——自动驾驶汽车,小马的选择是与主机厂合作,共同设计、测试汽车,并且一起建立集成的精简装配线。

目前小马智行推出的自动驾驶车辆,是和丰田合作开发的,更新到了第六代,2023年7月就开始部署面向公众的机器人出租车服务。

最新的进展是,第七代自动驾驶软硬件系统,已经进入了研发验证阶段,就在11月2日,小马智行和北汽新能源签约,第七代系统将搭载极狐阿尔法T5,2025年就会完成并推出首批极狐阿尔法T5的Robotaxi车型。

如今,自动驾驶行业玩家都在竞速,商业化落地,谁会是第一个呢?

招股书传送门:

https://www.sec.gov/Archives/edgar/data/1969302/000110465924109475/tm2310344-12_f1.htm#tRPT

-- END --

声明:内容源自智能车参考,文中观点仅供分享交流,不代表本公众号立场,如涉及版权等问题,请您告知,将及时处理!

智驾最前沿 「智驾最前沿」深耕自动驾驶领域技术、资讯等信息,解读行业现状、紧盯行业发展、挖掘行业前沿,致力于助力自动驾驶发展与落地!公众号:智驾最前沿
评论
  • 2025年,科技浪潮汹涌澎湃的当下,智能数字化变革正进行得如火如荼,从去年二季度开始,触觉智能RK3562核心板上市以来,受到了火爆的关注,上百家客户选用了此方案,也获得了众多的好评与认可,为客户的降本增效提供了广阔的空间。随着原厂的更新,功能也迎来了一波重大的更新,无论是商业级(RK3562)还是工业级(RK3562J),都可支持NPU和2×CAN,不再二选一。我们触觉智能做了一个艰难又大胆的决定,为大家带来两大重磅福利,请继续往下看~福利一:RK3562核心板149元特惠再续,支持2×CAN
    Industio_触觉智能 2025-03-12 14:45 26浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
  • 引言汽车行业正经历一场巨变。随着电动汽车、高级驾驶辅助系统(ADAS)和自动驾驶技术的普及,电子元件面临的要求从未如此严格。在这些复杂系统的核心,存在着一个看似简单却至关重要的元件——精密电阻。贞光科技代理品牌光颉科技的电阻选型过程,特别是在精度要求高达 0.01% 的薄膜和厚膜技术之间的选择,已成为全球汽车工程师的关键决策点。当几毫欧姆的差异可能影响传感器的灵敏度或控制系统的精确性时,选择正确的电阻不仅仅是满足规格的问题——它关系到车辆在极端条件下的安全性、可靠性和性能。在这份全面指南中,我们
    贞光科技 2025-03-12 17:25 92浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 文/Leon编辑/cc孙聪颖作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减K
    华尔街科技眼 2025-03-12 17:37 145浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 47浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 37浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦