Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。

据ABI Research预计，到2027年全球汽车市场对先进驾驶辅助系统（ADAS）的需求将增长两倍，这对新型汽车创新者、传统整车厂商（OEM）、Tier1供应商，以及汽车系统级芯片（SoC）厂商无疑都是好消息。但汽车行业领导者早已将目光投向了更远的全自动驾驶和自动驾驶出租车（RoboTaxi）。在从L2/L3级ADAS向L4/L5级全自动驾驶演进的过程中，神经网络加速器将是至关重要的组成部分。这些ADAS/自动驾驶系统需要处理各种各样的复杂场景，比如从多个摄像头和激光雷达的传感器融合中提取数据，以实现自动泊车、十字路口管理，以及复杂城市环境安全导航等高级功能。能够结合高性能、低延迟和高能效的AI加速器将是实现高级别自动驾驶的关键所在。

想了解ADAS/自动驾驶的最新设计和市场趋势？请即刻报名参加：汽车电子高峰论坛

近日Imagination推出专门面向ADAS和自动驾驶应用的新一代神经网络加速器（NNA）IMG Series4。据称这种AI加速器采用全新的多核架构，可提供高达600 TOPS（每秒万亿次操作）的超高计算性能，并且可为神经网络工作负载提供低带宽和低延迟特性。

Imagination视觉和人工智能部门高级总监Andrew Grant列举出IMG Series4的五大特性：

多核扩展和灵活性：全新的多核架构支持在多个内核之间对工作负载进行灵活分配和同步。Imagination软件可提供精细的控制能力，可通过对多个工作负载进行批处理、拆分和调度而提高灵活性。Series4可为每个集群配置 2个、4个、6个或者8个内核。
超高性能：Series4单核能够以不到1W的功耗提供12.5 TOPS的性能，比如一个8核集群可以提供100 TOPS的算力，那么若配置6个这种8核集群就可以提供高达600 TOPS的算力，足以满足Level 5完全自动驾驶所需要的500 TOPS。在AI推理方面，Series4 NNA的性能比嵌入式GPU快20倍以上，而比嵌入式CPU快1000倍。
超低延迟：将多个内核组成2核、4核、6核或8核的多核集群，所有内核可以相互协作，并行处理一个任务，从而降低处理延迟，缩短响应时间。例如，对于一个8核集群，理想情况下延迟会减少至单核独立执行时的1/8。
节省带宽：Imagination在Series4中新增了Tensor Tiling（ITT）技术，可以对计算任务进行瓦面平铺（tiling），充分利用片上存储来提升数据处理效率，并节省访问外部存储的带宽。ITT利用本地数据的依赖性将中间数据保存在片上存储器中，这样可以最大限度地减少将数据传输至外部存储器，从而大大降低带宽，多达90％。ITT是一种可扩展的算法，在拥有大量输入数据的网络上具有显著优势。
车规级安全性：Series4包含IP级别的安全功能，而且其设计流程符合汽车电子行业安全标准ISO 26262。在不影响性能的前提下，Series4可以安全地进行神经网络推理。其硬件安全机制可以保护编译后的网络、网络执行和数据处理管道。

Andrew Grant认为，Series4 NNA将会成为开发ADAS和自动驾驶汽车的行业标准平台。一些行业创新者已经在着手打造支持下一代ADAS功能和自动驾驶的系统级芯片，这一AI加速平台将为他们提供算力、功耗、带宽和延迟等方面的最佳组合性能。

多核集群实现性能线性提升

随着汽车电子从数字驾驶舱/人机界面（HMI）向ADAS和自动驾驶的演讲，在保证安全性和可靠性的同时，对处理性能要求越来越高。比如，Level 2级别的驾驶员监测功能只需要10 TOPS的算力即可处理，而Level 3-4级别的自动泊车功能就需要100 TOPS性能。要实现Level 5级别的完全自动驾驶，必须有500 TOPS以上的算力支持才行。

Series4 NNA采用全新的内核架构，每个内核具有12.5 TOPS性能。若基于5nm工艺节点，8个内核的集群可提供： 100 TOPS的算力性能；30 TOPS/Watt 的性能功耗比；12 TOPS/mm^2 的性能密度；低延迟处理大量输入数据。

由4 个内核组成的 50 TOPS 集群能够跨整个集群拆分各层，比如支持并行处理大型网络的各层；减少整体延迟，特别是在拥有大尺寸输入层的网络上。而各内核能够独立运行，可以共同执行一个批处理任务，也可以分别运行各自不同的网络。此外，这种4内核集群可以作为基础模块进行算力扩展。比如，4个50 TOPS集群就可以构成一个200 TOPS的多集群引擎。3个这种多集群引擎组合起来，就可以达到600 TOPS的算力性能，满足Level 5自动驾驶算力要求。

张量平铺(Tensor Tiling)技术

Imagination产品管理部门总监Gilberto Rodriguez对Series4新增的张量平铺（Tensor Tiling, ITT）技术做了详细介绍。网络的多层是以融合内核的形式在加速器硬件流水线里运行的，而融合内核之间的特征图需要通过外部存储进行交换。在不采用ITT技术的情况下，内核需要频繁的DDR存取，因此会占用很大的带宽。

若采用了ITT技术，就可以充分利用紧耦合的 SRAM 来融合更多的层，减少需要通过外部存储交换的特征图，从而降低带宽需求。

结语

ADAS和自动驾驶虽然呼声很高，但仍然难以商用落地。究其原因，严苛的安全性和极高的算力和即时处理决策要求对汽车厂商及其供应商提出了很大的挑战。素以GPU内核著称的Imagination技术公司开始发力AI加速器市场，最新发布的Series 4 NNA专为ADAS/自动驾驶应用而设计。虽然其多核集群架构可以提供高达600 TOPS的算力性能，但能否真正满足完全自动驾驶的性能需求，还要看基于这种AI加速器内核的芯片和系统开发，真正应用到自动驾驶实际场景中能否胜任还需要市场的检验。

责编：Amy Ｇuan

阅读全文，请先

汽车电子无人驾驶/ADAS 传感/MEMS 人工智能市场分析

您可能感兴趣

哪吒汽车官网突发崩溃，正遭遇连环危机

哪吒汽车官网突然无法访问，页面显示“系统维护中，请稍后再试”。尽管官网故障已得到修复，但这一事件暴露了哪吒汽车在技术运维和品牌管理上的不足。再加上哪吒汽车及其母公司合众新能源汽车股权冻结事件，内部管理层也发生了变动等，对哪吒汽车的财务状况和市场信心造成了显著冲击......

小米超级电机V8s项目组获“千万技术大奖”，背后有什么黑科技？

小米董事长兼CEO雷军在微博发文宣布，“小米超级电机V8s”项目组获得了今年小米集团内部最高级别的技术奖项，奖金为1000万元人民币。

中国调整制造电池组件和锂、镓等相关技术出口限制

中国商务部发布的《中国禁止出口限制出口技术目录》调整通知，中国拟对用于制造电池组件和加工关键矿物锂、镓等的技术实施出口限制......

2024年车企交付量成绩单出炉，新能源汽车市场创新高

2024年，多家新能源车企的交付量均创下新高。理想汽车以500,508辆的年度交付量成为首个年交付量突破50万辆的新势力品牌，同比增长显著。零跑汽车也超额完成了年度目标，全年交付近30万辆。随着市场竞争的加剧，各大车企纷纷设定了更高的年度目标。小米汽车计划在2025年交付30万辆，深蓝汽车目标为50万辆，岚图汽车目标为20万辆......

除了DTCO，制造企业还能为本土IC设计公司做些什么？

DTCO作为一种整合式优化的方法论，旨在改善芯片的效能、功耗效率、晶体管密度、良率及成本。在IDM时代，DTCO是标准方法学，随着Fabless与Foundry模式的成功……

日本车企面临“严峻挑战”，汽车行业将进一步整合

除了中国市场，日本车企还在其他国家和地区面临一些政策挑战。其中，泰国等国收紧贷款审查对日本车企的产销造成影响。而随着当选总统特朗普上台，美国未来可能会提高进口关税，也将进一步影响日本车企在美国市场的表现。

为什么翻新机的价格在上涨？

• 目前，iPhone在翻新市场中是最热门的商品，并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展，其平均销售价格（ASP）现已超过新手机。 • 新兴市场是增长的最大驱动力，消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年，这些翻新机平均销售价格将首次超过新手机。

2024三季度全球扫地机器人市场出货增长持续，卷势不减

从全球厂商竞争来看，三季度凭借多个新品发布，石头科技市场份额提升至16.4%,连续两季度排名全球第一……

摩尔斯微电子推出MM8108：全球体积最小、速度最快、功耗最低、传输距离最远的Wi-Fi芯片

最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准，配套USB网关，可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成

移远通信再扩短距离通信模组版图：Wi-Fi 7/6、Wi-Fi Halow等六款新品助力无线连接升级

其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……

38888元！大疆发布DJIMatrice4T旗舰无人机：六只眼

大疆发布DJI Matrice 4T旗舰无人机，售价38888元。该无人机可用于电力巡检、应急抢险、公共安全、水利林业监测等众多应用场景。DJI Matrice 4T的镜头模组拥有“六个眼”，除了广角

奥康皮鞋：终止收购芯片公司！

1月8日消息，奥康国际发布公告称，终止发行股份购买资产，公司股票将于1月8日开市起复牌。至此，奥康国际谋划的跨界收购芯片公司事项告一段落。奥康国际在公告中介绍，公司于2024年12月24日披露了《关于

光伏周价格|硅片电池连续两周报涨，临近假期组件大幅减产

01周价格表02周价格观察硅料环节本周硅料价格：N型复投料主流成交价格为40元/KG，N型致密料的主流成交价格为38元/KG；N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略，月

研报|机器人大语言模型市场规模预估于2028年破千亿美元，英伟达WFM平台或成主要驱动力

‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究，随着人型机器人迈向高度系统整合，并有望从工业场景走进家庭生活，前端的AI模型训练将更为关键，以满足更多后端理解与互动需求

天马创新显示技术闪耀CES2025，引领未来科技潮流

当地时间2025年1月7日，全球备受期待的技术盛宴——国际消费电子展（CES 2025）在美国拉斯维加斯盛大开幕。作为显示领域的领军企业，天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场，带来手

微信2025年首次更新！朋友圈视频支持倍速播放

日前，微信安卓版迎来8.0.56正式版更新，这是2025年首次版本更新。关于更新内容，依然是那9个字：“修复了一些已知问题”。虽然官方没有公布具体更新内容，但体验后发现，新版增加了朋友圈视频倍速播放等

深度伪造的好处？一项有争议技术的意外潜力

点击蓝字关注我们SUBSCRIBE to US如果你听说过深度伪造（deepfakes），即人们做着从未做过的事或者说着从未说过的话的高度逼真视频，你可能会认为这是一种可疑的技术发展成果。例如，它们

2028年中国在全球PCB销售占比预估仍超60%，主导地位稳固

△广告与正文无关 1月3日，The Elec援引电子元件专业媒体内容表示，尽管取代中国PCB的努力仍在继续，但预计到2028年，中国（包括大陆和台湾省）在全球PCB销售中的份额将超过60%，在市场

奥康皮鞋公司跨界半导体失败：终止收购存储芯片企业股权

日前，奥康国际发布公告表示终止发行股份购买资产。根据公告，2024 年 12 月 24 日，奥康国际披露《关于筹划发行股份购买资产事项的停牌公告》，公司拟筹划以发行股份或支付现金的方式购买联和存储科技

消息称Arm寻求收购半导体设计公司AmpereComputing

据彭博社报道，软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司，致力于塑造云计算的未来,并推出了

Level 5自动驾驶需要500+TOPS算力，IMG Series4多核集群AI加速器能否胜任？

多核集群实现性能线性提升

张量平铺(Tensor Tiling)技术

结语

杂志声明