前言:
谈及无人车硬件,通常大家直接看到的是安装在车身周边的传感器,特别是曾经Velodyne 64 “全家桶”一度是L4无人驾驶开发车的标识。虽然无人驾驶车载计算平台藏于车身内,各家L4无人驾驶方案也很少公开提及,但它担任了几乎全部的数据处理和算法执行任务,同时也是整体PonyAlpha X硬件系统的中央计算单元,我们有着一些独特的思考。
目前计算硬件行业内通常用TOPS来衡量计算能力,但有一种趋势认为越高的TOPS越能满足L4计算的需要,甚至有一些方案声称达到某个TOPS数据就可以实现L4自动驾驶。我们认为,TOPS更像是计算硬件提供商对于L4计算需求的强行归纳,但实际上L4的整体系统能力,绝不仅仅是TOPS,而更多的是针对不同传感器和算法对于时延、数据吞吐量、计算效率(perf/watt)、计算确定性、准确度、系统稳定性等等的整体软硬件共同优化。
PonyAlpha X系统开发中,Pony.ai软件和硬件团队共同合作,通过高度定制的异构计算系统,打造了充分满足Pony.ai应用软件需求并同时兼顾高性能、高效率和高可靠性的L4无人驾驶中央车载计算平台。
虽然性能强大的CPU和GPU仍是L4无人驾驶计算的主要处理器,但通过特定的异构系统,可以大幅降低时延,提高性能、安全性和计算效率。
计算平台通过引入FPGA,将海量高吞吐的不规则的传感器数据进行预处理,提供时间同步、标定校准、数据压缩、校验和重打包等功能,使得整体传感器数据流时延提升6倍,CPU/GPU占用率降低20%。同时FPGA提供了硬件抽象层的作用,使得传感器的升级更新不影响整体系统功能。
安全性一直是高性能无人驾驶硬件的关键,通过引入车规级别MCU作为安全岛,全面监控计算平台健康状态,实时进行故障检测并输出错误码,以此触发失效安全系统。
异构计算通常会面临芯片间通信的额外代价,计算平台通过使用业界最先进的IO通信协议,芯片间数据交换带宽提升了三倍,使得多芯片并行计算成为可能
异构计算的魅力在于,通过合理安排不同的计算任务到最适合的计算芯片,整体系统的计算效率得以大幅提升。计算平台经过软硬件优化,最终平均功耗仅为同等数据中心服务器的1/3,节省了能源的同时散热压力和可靠性也大幅改善。
在汽车电子产品中,更高的性能和更大的功耗通常会使可靠性下降。Pony.ai 中央车载计算平台的工程魅力就在于寻找性能和可靠性的平衡。
为了实现硬件和软件的开发解耦,计算平台对于性能的设计理念是不光满足现有开发需求,还要超前设计以支持未来3年的L4无人驾驶软件开发。除了上文提到的异构计算,我们通过软件和硬件的共同优化,不仅仅关注芯片和系统的绝对性能,而是寻找与perf/watt的最佳平衡点。下图即为我们通过多维度权衡以选择最高效的计算方案。
我们应对汽车级别可靠性的方法,其中之一是留足设计余量,无论是信号/电源完整性,还是震动温度等环境因素,唯有足够大的设计缓冲才能在汽车恶劣环境下保持可靠。例如我们设计了比正常运行功耗大4倍的供电系统,以保证任何功耗峰值都不会引起系统失效。
另外一个可靠性的思路是为高性能计算系统尽可能提供舒适的工作区域。例如即使汽车电子需要工作在-40C - 105C的环境温度,但我们通过精密的液体加热散热设计,使得即便是消费级的芯片也可以在汽车环境中可靠的运行。又例如通过合理的缓冲设计,使原本脆弱的器件可以在25g的冲击下不受损伤。
最后,通过等效冗余和降级冗余,以及实时的健康监控系统,即使系统模块出现故障,比如冗余电源输入其中一路失效,系统仍可以正常或降级运行。
按照经典的硬件开发V模型,在设计实施之后,我们进行了多个维度的系统验证。
首先,在信号层面,关键信号的电源都在不同温度电压条件下按照工业标准进行了测量,以验证信号余量与设计相符。
其次,按照Pony.ai定义的DVT测试标准,进行了环境和压力测试,保证温度、震动、湿度等等各种工况下系统正常运行,并在掉电、短路、碰撞等条件下系统不受损坏。
之后,在系统级别,我们开发了HIL仿真平台,使得计算平台系统可以在线下7x24小时不间断验证,以达到统计意义上的大于100,000小时MTBF。
最后,我们进行了大量的实际路测,以保证和整体L4无人驾驶硬件系统集成可靠。
Pony.ai 中央车载计算平台不仅仅是一个前沿的预研项目,而是目标支持L4无人驾驶硬件的量产:
每一个设计细节都充分考虑DFM和DFA,使得批量加工和组装成为可能,并保证量产级别的成品率;
计算平台非常容易部署和维护,整体设计即插即用,模块化设计易保养维护;最后,计算平台有清晰的车规路线图,在2023年即可实现车规级L4计算平台。