地平线是国内领先的智能驾驶和智能物联网(IoT)芯片企业。随着国产化的需求深入,系统级芯片(SOC)产品矩阵通过创新的BPU架构和多款强大的芯片产品,为人工智能应用提供了卓越的计算能力。
我们从目前的芯片层面来探讨下,地平线的BPU架构及其主要SOC产品。
地平线BPU架构
自2015年成立以来,地平线一直致力于BPU架构的不断演进。从最初的伯努利架构到贝叶斯架构,再到如今的纳什架构,每一次迭代都针对特定的算法需求和自动驾驶场景进行优化和提升。
地平线提出的BPU(Brain Processing Unit)架构是一种专门为人工智能应用设计的处理器架构,旨在解决传统处理器在处理大规模并行计算任务时的效率问题,尤其在图像识别、语音处理、自然语言理解和控制等领域。
BPU通过优化的硬件加速器,实现了卷积神经网络(CNN)、循环神经网络(RNN)和Transformer等复杂神经网络模型的高效计算,在有限的功耗和成本下,达到更高的计算效率和性能。BPU架构的持续迭代源于对实际应用场景和算法需求的深入理解,并通过软硬结合的方式不断优化计算效率。
地平线的产品矩阵
● 征程3(J3)芯片
征程3芯片于2020年9月推出,采用台积电16nm制程工艺,典型功耗为2.5W。主要技术规格包括:
◎ CPU:采用4个Arm Cortex A53内核,最大工作频率为1.2GHz,支持动态频率缩放(DFS)。
◎ BPU:由双核伯努利架构组成,算力为5TOPS,最大工作频率为950MHz,支持动态频率缩放(DFS)。
◎ DRAM:支持x32片外DDR4/LPDDR4/LPDDR4X DRAM,最大支持4GB容量,速度可达3200 MT/s
目前J3主要用在一体机上面。
● 征程5(J5)芯片
2021年7月推出的征程5芯片,采用16nm制程工艺,典型功耗为30W。其主要配置包括:
◎ CPU:八核Cortex-A55。
◎ DSP:2个可编程Vision P6 DSP,频率最高为650MHz,总算力为0.67TOPS。
◎ BPU:双核贝叶斯架构设计,算力为128TOPS。
◎ ISP:每个ISP模块可支持2x4k/8M@30fps图像处理,具备HDR、多帧曝光、图像降噪等功能。
J5的应用场景主要用在智能驾驶域控制器上,这是地平线目前主力的产品。
● 征程6(J6)芯片
地平线于4月在北京发布了征程6系列芯片,预计于2024年第四季度完成首批量产车型交付,并预计于2025年实现超10款车型量产交付。J6系列采用第四代BPU架构“纳什”,专为大规模参数的Transformer模型和高级智能驾驶优化,有6个配置(B、L、E、M、H、P),其中J6P为旗舰产品。
地平线最新发布的征程6系列芯片涵盖6款产品,分别是征程6B、6E、6M、6P、6L和6H,全面覆盖智能驾驶的各个场景和价位,重点介绍了征程6B、6E、6M和6P,其他两款芯片6L和6H的参数暂未公开,预估其性能:6H的AI算力在256-300 TOPS之间,CPU算力在250-300K DMIPS;6L的AI算力在30-40TOPS,CPU算力在40-50K DMIPS。
● 征程6系列的命名和定位
◎ 征程6B:主打极致性价比,推测CPU为6核心Cortex-A55,制造工艺为14或28纳米。
◎ 征程6E:面向高速NOA场景,提供超高算力和效率。
◎ 征程6M:提供普惠城区的性价比解决方案。
◎ 征程6P:旗舰型号,AI算力高达560TOPS(在1/2稀疏网络下),适用于高端智能驾驶场景。
● 技术升级亮点
与前代征程5系列相比,征程6系列的CPU算力大幅提升。例如,征程6P的CPU算力达到410K DMIPS,而征程5的CPU为8核心Cortex-A55,算力大致为25-30K DMIPS。
采用地平线自研的第三代BPU(Brain Processing Unit)架构,称为纳什架构,致敬博弈论创始人约翰·纳什,针对智能车与智能车、智能车与非智能车之间的决策交互,提升了智能驾驶系统的灵活性和准确性。J6P和特斯拉第一代FSD(Full Self-Driving)在部分指标上进行了对比,显示出地平线在人工智能芯片技术上的卓越竞争力。
征程6P,AI算力高达560TOPS(在1/2稀疏网络下的等效算力)。其CPU为18核心的ARM Cortex-A78AE,算力为410K DMIPS,远超英伟达Orin-X的227K DMIPS。征程6P还添加了一个微型GPU,算力为200GFLOPS,主要用于图像输出。为了降低成本和管理供应链,征程6P内置了一个达到ASIL-D级的MCU岛,算力为10K DMIPS,相较于当前市场上单独使用的英飞凌TC397,征程6P的方案更加经济且供应稳定。
在存储方面,征程6P升级到了LPDDR5,带宽达205GB/s,前视感知支持1800万像素,图像带宽5.3Gpixel/s。其内部采用TB/s级高性能总线,访存延时低至130纳秒,并添加了VPU(矢量浮点运算加速单元),以应对新一代大模型Transformer的运算需求。
小结
地平线通过BPU架构和多款SOC产品,在人工智能计算领域持续发展。从征程3到征程6,地平线的产品不断迭代升级。
J6系列的发布为智能出行带来更多可能。