【智能驾驶】如何搭建自动驾驶超算中心

智享新汽车 2023-02-27 23:29

征稿:关于智能汽车新材料、新工艺、新技术的文稿,请发送至gearshare@163.com,加群请添加管理员微信GSAuto0001验证后邀请。

社群推荐GSAuto联盟|座椅技术专家委员会招新了

热门推荐: 

【智能驾驶】一文了解自动驾驶汽车“定位”
【智能座舱】人车一体:汽车交互的未来?
【智能座舱】车载HMI进化论-多模态交互之智能表面
【智能座舱】气味交互设计趋势
【智能座舱】智能座舱的过去、现在和未来
【智能座舱】解读奥迪数字化灯光技术






好书推荐

↓↓↓

点击下方链接查阅目录

↑↑↑

快速查看300+高质量干货文

如需加群,请联系微信群管理员圈圈哥微信GSAuto0001验证信息后邀请进群

作者 | 刚峰

出品 | 汽车电子与软件

特斯拉超算中心拥有近2万张GPU,对自动驾驶训练效率产生立竿见影的效果,最大限度地提升了自动驾驶系统的开发效率。

蔚来智能计算中心,将推理速度提高至6倍,并节省了24%的资源;模型开发效率提升了20倍,助力其缩短了自动驾驶汽车的上市周期。

大陆集团的高算力集群,将开发周期从几周缩短至几个小时,使自动驾驶得以在中短期商业计划中落实;机器学习时间的缩短加快了新科技进入市场的速度。
......

当前,一个不争的事实就是,在自动驾驶领域具有长期规划的车企,无论是造车新势力还是传统品牌,或者技术供应商,都在搭建自己的超算中心,以掌握稳定的算力资源,缩短开发周期,加快自动驾驶产品的上市。

相反,如果没有超算中心,那么自动驾驶训练速度将明显放缓,自动驾驶企业间的差距也将愈发明显。

近日,由英伟达与IDC联合发布《现实+仿真,超大算力赋能自动驾驶》。该白皮书结合当下自动驾驶开发现状,深入挖掘自动驾驶开发过程中的业务需求与挑战,并综合分析车企及技术供应商如何通过搭建超算中心,满足自动驾驶开发对算力的需求,促进自动驾驶的高效开发与落地。

下文将对《现实+仿真,超大算力赋能自动驾驶》进行分析与解读,揭开自动驾驶超大算力的神秘面纱。


01


AI 技 术 推 动 自 动 驾 驶 行 业 发 展


白皮书IDC统计数据显示,截至2022年第一季度,L2及以上级别自动驾驶乘用车新车渗透率达到23.2%,并将在可预见的未来持续上升。我们再往前迈步,随着自动驾驶技术的进一步发展,最终达到自动驾驶的终局——规模化L4。

要实现L2以及更高级别的自动驾驶,甚至达到L4,必须进行大量的测试,以 " 行驶一亿公里出现一次致命事故的人类驾驶水平 " 为参考,自动驾驶汽车至少要进行千亿公里的测试——相当于 100 万辆车,以每天 10 个小时的频率不间断行驶 10年。这并不是只靠时间就能达成的目标,车辆还需解决百万长尾问题,才能确保乘客安全。

如此庞大的时间、人力、物力成本,怎样才能降低?只要有大量的数据,就可以解决大部分问题,以数据驱动软件算法持续升级迭代,降低研发的时间及人力物力成本。

正如白皮书指出的,自动驾驶系统的前期开发依赖大量道路环境数据的输入,形成贯穿感知、决 策、规划、控制多环节的算法。而后依然需要持续不断地输入数据,继续对算法的训练与验证,从而实现迭代,加速自动驾驶落地。而自动驾驶算法的训练需要在有限的时间内完成大量的运算,因而对算力形成极高的要求。高强度的算力不仅需要被用于模型的运行、更新、迭代,还需要支撑仿真测试中场景的搭建与渲染。

1.1、A I超算中心为自动驾驶系统的训练提供算力支持

想要利用数据,进行自动驾驶系统的训练及验证,就需要算力。算力直接影响着开发效率,决定产品的上市周期。

白皮书指出,数据中心承载着训练自动驾驶系统所需的巨大算力,为支撑人工智能计算提供了重要的硬件基础设施,其底层硬件技术路径包括GPU、ASIC、FPGA、NPU。通过调研,IDC发现汽车行业训练自动驾驶算法的硬件基础设施以GPU为主,其他为辅。
 
(人工智能计算中心硬件基础设施)

此外,GPU的发展伴生出大量的配套软件与服务,包括开发工具与平台,大大减少了开发者部署硬件设施时所需消耗在测试与优化上的时间成本,使汽车行业的终端用户得以更加快捷地部署算力。

看到这里,很多读者朋友可能要问,业界数据中心所使用的GPU及配套软件及服务有哪些。这里介绍一下NVIDIA DGX SuperPOD一体化方案。

为了满足 AI 模型算力需求,帮助企业构建 AI 数据中心,2021 年 4 月,NVIDIA 推出 DGX SuperPOD 云原生超级计算机,为用户提供一站式 AI 数据中心解决方案,是企业满足 AI 大模型计算的有力方案。

SuperPOD是一个支持从小规模迅速扩展的参考架构、持续的软件优化、消除数据中心复杂的“交钥匙”的方案,助力自动驾驶客户应对极具挑战性的 AI 和高性能计算 (HPC) 工作负载,同时助力客户将更多时间和精力聚焦在做算法上,去做算法迭代、软件迭代,而不是把精力花在构建数据中心。

该一体化方案包括20台DGX,GPU服务器、高速存储、 Mellanox IB网络,以及软件、调度平台、服务都是由NVIDIA直接提供,安装部署服务、调优服务、为客户所做的培训、为客户所做前期能力建设等等,以及专门的项目技术客户经理,很多服务都包含在里面。

1.2、数字孪生技术加强仿真测试

众所周知,目前实车数据的采集有两种方式,一是靠测试车采集,另一种是靠量产车回传数据。但对于刚开始做自动驾驶开发的企业,这两种方式都比较难。因为还没有足够的采集数据的车队以及能回传数据的量产车。

如果像上面那样没有大量用于实测的车辆,再加上实测也无法穷尽所有的Corner Case,同时受限于实测的成本、安全性限制,此时可以通过虚拟仿真解决部分成本及场景多样性的需求。其中,大规模的长尾场景需要数据中心提供充足的算力支持。同时,仿真场景对现实的回归过程,同样需要巨大的算力提供支持。

利用数字孪生技术可以加强仿真测试中虚拟环境的真实性。在仿真层对现实层的映射中,通过渲染技术使像素集更加贴近物理真实,借助算力生成对诸如地形、环境、天气,甚至光线的模拟,确保像素集与现实间的一致性。其次,基于物理仿真引擎,确保虚拟世界中的物理现象符合现实世界场景中的物理定律,保证虚拟世界中物体的物理属性准确。

那么,行业内自动驾驶企业都会利用什么工具做仿真测试呢?这里可参考NVIDIA DRIVE Sim。它是基于Omniverse(Omniverse是NVIDIA面向元宇宙所构建的一个平台)构建,具有以下特性:

一是云原生,这里是指为企业的内部云而构建,是中间数据中心的大规模集群,有数据中心级别的管理和任务分发,以及结果统计。

二是Scenario-based 基于场景,通过不断创建随机场景,去寻找自动驾驶里可能会出现问题的场景。

三是可扩展,随着开发量的增长,随着corner case越来越多,对集群的数量要求越来越大,所以需要扩展,支持从workstation到数据中心不同的应用。

四是这个软件有三个阶段的推出,即先推出合成数据、再推出软件在环仿真、再到硬件在环仿真,满足客户所需要的端到端的需求。具有
 

( NVIDIA DRIVE Sim 工具)

DRIVE Sim的优点:一是快速,因为有大量的合成数据,就算没有采集数据,也可以开始着手做测试;二是准确,用机器打标,从上帝的视角查看打标的场景,准确率更高;三是多样性,可以覆盖下雨天、雾天、下雪天等天气去做模拟;四是低成本,通过仿真人工合成数据大大降低了数据采集的成本。



02


自动驾驶企业超算中心搭建状况


开发自动驾驶算法需要针对算力需求进行持续性的投资。通过调研 ,IDC发现搭建人工智能计算中心时,行业内最常见的问题是初始投资过高,这一问题对于自动驾驶行业独角兽尤为棘手。另一个行业内普遍存在的问题是难以找到合适的 解决方案提供商。此外,项目时间周期过长是车企和传统一级供应商经常面临的问题。
 
(搭建人工智能计算中心时遇到的问题)

2.1、有关搭建人工智能计算中心的初始投资

投资方面,主机厂及一级供应商对搭建人工智能计算中心的预算普遍超过(人民币)1亿元。与此同时,超过(人民币)2亿元的占五分之一多。科技公司的投入亦普遍以千万计,其中不乏过亿的情形。人工智能计算中心的投入对于行业内各方开发团队均形成了较大的资金压力。
 
(搭建人工智能计算中心投资金额 (人民币))

针对于人工智能计算中心搭建状况的初始投资的状况,NVIDIA认为对于人工智能计算中心搭建初始成本比较高,带来后期规模扩大时边际成本有所收敛。相对来讲,其他途径在初始投资时可能门槛稍低,但是到后期时边际成本会逐渐发展到不可控的状态。这种情况下,自动驾驶开发者基于长期在自动驾驶领域的规划做出权衡取舍,也就是说对自己的投入做个合理的规划。

2.2、有关搭建人工智能计算中心如何找到合适的解决方案提供商

针对这一问题,白皮书指出人工智能计算中心的搭建与运营过程复杂,技术门槛较高。需要同时兼顾GPU集群、存储、高速网络、软件调度、机房管理等不同的部分。其中每个部分均涉及大量的组件,不仅增加了设计的复杂性,还因为每个组件都有独立的交货周期,而使部署的时间出现极大的不确定性,这对于缺乏搭建经验的团队挑战巨大。同时,计算中心的运营也需要具备经验的团队指导,方能维持最大的运转效率。

2.3、有关搭建人工智能计算中心项目周期过长

目前搭建人工智能计算中心,市场的现状是普遍都在1个月以上,多数情形接近3个月,潜在可供优化的空间较大。NVIDIA认为一个比较成熟的方案能够缩短搭建时间,助力自动驾驶产品率先落地以抢占市场,为自动驾驶产品提供强大的先发优势。
 
(搭建人工智能计算中心时间投入)



03


IDC对行业的5大建议


为了使算力资源更加有效地支持自动驾驶系统的开发工作,IDC建议:

1、数据中心芯片的选型与网络的搭建涉及IT领域专业知识,企业需要具备相关知识储备

2、数据中心解决方案供应商应当推出一套集成的全栈式AI解决方案, 提供的不仅是设备,还包括设备搭建服务以及后期的售后服务。

3、基于市场上算力方案的供给以及自己自动驾驶解决方案对算力的需求,以及资金投入,在算力方面做个长期规划。

4、在超算中心搭建完成之后,就涉及到算力稳定性的问题。算力运营者需要有一套主动的方案去应对各种各样的突发状况,而不是被动地被各种突发状况牵着头走。

5、行业发展一定来自于行业生态的进步,要支撑行业生态各个主体的合作,就需要算力供给方提供开放式的平台,能够方便各方的合作。

在自动驾驶技术的发展进程中,算力成为驱动自动驾驶开发效率及产品快速落地的关键驱动力之一。在自动驾驶领域具有长期规划的车企或技术供应商,在算力方面做好长期的规划,并综合考虑硬件、网络、软件及服务等因素,搭建适合自己的超算中心,缩短研发时间,降低成本和风险,加速自动驾驶产品落地。

说明:锦缎,由干货小Q整理,转载请注明出处【智享新汽车】,如涉及版权等问题,请您告知,我们将及时处理。如需申请内外饰、车身、座椅等专业群请添加微信GSAuto0001验证信息后要求进群。

免费投稿请发送邮件到:gearshare@163.com
(欢迎行业内人士踊跃投稿,将你们的文章分享给大家)

智享新汽车 汽车新四化专业资讯及干货分享平台
评论
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 66浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 310浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 637浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 196浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 534浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 128浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 194浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 155浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 142浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 120浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 163浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦