Arm推出Ethos-U85\u2002NPU和Corstone-320,助力边缘AI芯片创新设计

EETOP 2024-04-23 07:23

随着 Transformer 与大模型的发展,以及生成式 AI 崛起,AI 模型的普适性、多模态支持,以及模型微调效率都有了质的突破,加上用户体验的持续提升、数据量激增,以及企业对数据价值的认可,边缘AI行业正经历巨大变化。大小模型云边端结合成为未来 AI 产品的重要发展趋势,也是 AI 应用赋能行业发展的重要方向。


边缘 AI 的重要特点就是节省带宽、更具安全性、减少数据传输、提高响应速度和可靠性。近来,随着低功耗的 AI 加速器和专用芯片被集成到终端设备中,边缘智能正变得越来越自主和强大。边缘AI为物联网发展带来了前所未有的发展机遇,但同时也面临一些设计上的挑战,就是对能效和成本方面有比较严格的限制。



软硬件协同才能释放AI最大潜能


在设计边缘 AI 芯片和系统时,需要在计算能力和能效之间找到合适的平衡。高性能的处理能力往往伴随着更高的功耗,而边缘设备往往对功耗和成本都有着严格限制。与此同时,随着越来越多的数据在边缘被处理,数据安全和隐私保护变得尤为重要。这要求芯片设计必须包含加密和安全功能。

传统物联网市场存在碎片化,为了更好地统一多样化的应用要求,达到规模化效益,软件定义和适于软件移植的标准更是必不可少。此外,系统变得愈加强大,其复杂度也随之提升。软硬件必须协同工作才能释放 AI 处理的最大潜能。

随着边缘AI的部署规模持续扩大,芯片创新者必须应对日趋复杂的系统和软件、不断激增的 AI 性能需求,以及加速产品上市进程的压力。与此同时,软件开发者需要更加一致、简化的开发体验,并能更轻松地与新型的 AI 框架和库实现集成。Arm 物联网事业部业务拓展副总裁马健表示:“Arm坚信, AI 需要硬件和软件之间的紧密结合。边缘 AI 潜力巨大,有望助力多个领域的持续智能化演进与转型。

近日,Arm 推出迄今性能最高且能效最佳的 Ethos NPU 产品Ethos-U85神经网络处理器 (NPU) 。与上一代产品相比,Ethos-U85性能提升四倍,能效提高 20%。与此同时,Arm还推出了全新物联网参考设计平台——Arm Corstone-320, 集成了前沿的嵌入式 IP 和虚拟硬件,可加速语音、音频和视觉系统的部署。 

全新的 Ethos-U85 和 Corstone-320 参考设计平台,满足了边缘 AI 用例对更高性能计算的需求,为最新的 AI 模型、框架提供了原生支持,并沿用 Arm 软件与 AI 开发者已经熟知的工具链,具有投资复用、上手容易等优势。

Arm Ethos-U NPU

边缘 AI 用例日趋复杂,想要把握 AI 时代的机遇离不开安全、高性能的计算系统。Arm Ethos-U NPU系列是业界首款 AI 微加速器。据介绍,迄今,Arm Ethos NPU 系列产品已有逾 20 家授权许可合作伙伴,包括英飞凌、恩智浦半导体、奇景光电 (Himax)、Alif Semiconductor 和 Synaptics 等领先企业均已推出搭载 Ethos-U 的量产芯片。其中,Alif Semiconductor 和英飞凌是全新 Arm Ethos-U85 NPU 的早期采用者。

Ethos-U85 专为与 Arm 领先的 Armv9 Cortex-A CPU 相结合而设计,以加速处理机器学习 (ML) 任务,并为更广泛的更高性能设备提供高能效的边缘推理能力。其 MAC 单元可从 128 个扩展到 2048 个,在最高性能配置下提供 4TOPs 的 AI 算力,以可持续的方式支持未来的应用场景,并提供了与前几代Ethos U产品相同的一致工具链,达到无缝的开发者体验。

Arm Ethos-U85 提供卓越的神经网络加速功能

此外,Ethos-U85 NPU 支持 TensorFlow Lite 和 PyTorch 等 AI 框架,支持 Transformer 架构和卷积神经网络 (CNN) 以实现 AI 推理。Transformer 在视觉和生成式 AI 用例中,比如视频理解、图文结合,图像增强与生成、图像分类和目标检测等方面都极有价值。Transformer 架构网络的注意力机制容易利用并行计算来实现,提高硬件使用效率,使得这些模型能够部署在计算资源有限的边缘设备上。开发者可以通过选用针对 Transformer 架构网络优化的设计,发掘边缘 AI 的新机遇,使这些应用享有更快的推理、更优化的模型性能和可扩展性。

新一代边缘 AI 应用的 ML 工作负载需要以节能的方式提供高性能表现。Ethos-U85 不仅支持低功耗 MCU 系统中的 AI 加速。在高性能边缘计算系统中,Ethos-U85 也能够很好地支持。马健分享说:“加之我们领先的 Armv9 Cortex-A CPU,将为基于应用处理器的智能物联网平台上运行的 AI 任务实现加速。这将使 Ethos-U85 能够在工业机器视觉、边缘网关、可穿戴设备和消费类机器人等应用中,带来高效能的边缘推理。“

相较于此前的 AI 技术,大模型和生成式 AI 最大的优势是泛化能力,及对多模态的支持。例如对图像生成、图像分割等多种用例的泛化、普遍性的支持。另外,大模型和多模态的优势是微调时间,用比较少的新样本进行模型的重新训练和微调,使这些模型很快适应之前没有看到过的新环境。例如智能家居的一些用例,已经从单一模型支持不同的传感器,到统一模型支持各种不同的多模态传感器的输入。

这种多模态 AI 以及未来自然语言的交互都需要大模型和多模态的支持,同时也对 AI 的算力提出了更高的要求。Ethos-U85 NPU AI 加速器正是基于这一趋势而发布的。马健分享到:“我们认为只有普适性的通用计算平台才可能达到规模化,进而更好地实现丰富的软件支持。期待未来通过大模型和多模态,物联网碎片化问题可以得到更好的改进,AI 会从一个单一功能到多功能,甚至是向通用 AI 的方向演进。

Arm Corstone-320

在万物智能的驱动下,无处不在的 MCU 和嵌入式系统对性能和 AI 加速的需求与日俱增。顺应这一趋势, 针对实际工作负载,Arm 特推出了全新的智能物联网参考设计平台Arm Corstone-320。它集成了 Arm 最高性能的嵌入式处理器 Cortex-M CPU——Cortex-M85、全新的 Ethos-U85 NPU AI 加速器,以及以实现为视觉应用优化的低功耗系统 Arm Mali-C55 ISP。

Corstone-320 不仅仅提供芯片计算子系统 IP 组合,还附带了软件、AI 模型库和开发工具,以实现软件的复用。其参考用例包括部署在智能家居中的电池供电摄像系统,在工业和零售系统中的低帧率网络摄像头,以及提供了有安全保证的软硬件组合。基于这种特性,将使开发者能够在物理芯片就绪前便启动软件开发工作,从而加速推进产品进程,为日益复杂的边缘 AI 设备缩短上市时间。

此外,Arm 在发布每款参考设计的同时,也会提供相应的 Arm虚拟硬件,虚拟硬件是对参考设计 IP 组合子系统的一个仿真。仿真可以在子系统的芯片就绪之前,就启动在云端仿真平台上的 AI 和 ML 以及应用的开发。为了支持中国广大的物联网嵌入式开发者,Arm 将虚拟硬件落地在了百度云上,正在实现与百度 BML 和 EasyDL 工具链的组合,使基于 Arm 技术的 AI 开发可以在百度飞桨 (PaddlePaddle)进行,且实现软硬件协同开发,即在基于 Arm 最新 IP 量产芯片就绪之前,就可以预先做软件应用的开发,以及 AI/ML 算法的开发和优化。

马健表示:所有这些努力都是使生态能够更加统一,使技术能够更加标准化,最终目的是使 AI 和软件开发者能够更便利地基于 Arm 架构、从云、边、端打造统一的计算平台,迅速地开发出所期望的新应用。

结束语


边缘 AI 的演进历史可以追溯到早期嵌入式系统,比如家用空调、电表等设备都会内置嵌入式处理器,从而实现控制和设备管理等简单功能马健认为,当前,边缘 AI 的广泛部署已趋向成熟,发展在中国市场尤为迅速。


未来,AI 模型就像一个家庭“大脑”,可以综合家里各类传感器、摄像头,以及外部天气、家人喜好、自然语言命令等多种输入,更安全、更节能地营造个性化的家居环境。AI 和大模型将使零售业变得更加智能化、个性化和自动化。通过个性化购物体验、智能库存管理、动态定价策略、线上线下无缝整合,以及自动化运营等,带来更高的效率和更卓越的客户体验。AI 和大模型还有望推动工业 4.0 向工业 5.0 的转变,实现智能化生产线、精准的质量控制、个性化定制生产、供应链优化、自主维护与远程监控、人机协作、节能减排,以及新材料和工艺的开发等,为制造业带来一场深刻的变革。


随着边缘 AI 的持续发展,Arm 始终处于推动市场和技术进步的核心地位。目前,基于Arm架构 的芯片出货量已达 2800 亿颗,全球范围内有 1000 多个生态系统合作伙伴及 1500 万 Arm 生态开发者。


马健总结说:“Arm 在 IP、参考设计和软件标准上持续投入,从而帮助整个边缘 AI 生态应对来自算力、能效、安全以及市场碎片化等方面的挑战。目前,全球约有 90% 的 AI 都运行在基于 Arm 架构的 CPU 上,这些持续投入使 Arm 成为全球最普遍的 AI 计算平台之一。但,我们不会止步于此。Arm 将与生态伙伴们砥砺奋进,释放前所未有的 AI 潜力。”

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 111浏览
  • 实用性高值得收藏!! (时源芯微)时源专注于EMC整改与服务,配备完整器件 TVS全称Transient Voltage Suppre,亦称TVS管、瞬态抑制二极管等,有单向和双向之分。单向TVS 一般应用于直流供电电路,双向TVS 应用于电压交变的电路。在直流电路的应用中,TVS被并联接入电路中。在电路处于正常运行状态时,TVS会保持截止状态,从而不对电路的正常工作产生任何影响。然而,一旦电路中出现异常的过电压,并且这个电压达到TVS的击穿阈值时,TVS的状态就会
    时源芯微 2025-01-16 14:23 160浏览
  • 近期,智能家居领域Matter标准的制定者,全球最具影响力的科技联盟之一,连接标准联盟(Connectivity Standards Alliance,简称CSA)“利好”频出,不仅为智能家居领域的设备制造商们提供了更为快速便捷的Matter认证流程,而且苹果、三星与谷歌等智能家居平台厂商都表示会接纳CSA的Matter认证体系,并计划将其整合至各自的“Works with”项目中。那么,在本轮“利好”背景下,智能家居的设备制造商们该如何捉住机会,“掘金”万亿市场呢?重认证快通道计划,为家居设备
    华普微HOPERF 2025-01-16 10:22 186浏览
  • 全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,与汽车技术领先者法雷奥合作,采用创新的开放系统协议(OSP)技术,旨在改变汽车内饰照明方式,革新汽车行业座舱照明理念。结合艾迈斯欧司朗开创性的OSIRE® E3731i智能LED和法雷奥的动态环境照明系统,两家公司将为车辆内饰设计和功能设立一套全新标准。汽车内饰照明的作用日益凸显,座舱设计的主流趋势应满足终端用户的需求:即易于使用、个性化,并能提供符合用户生活方式的清晰信息。因此,动态环境照明带来了众多新机遇。智能LED的应用已
    艾迈斯欧司朗 2025-01-15 19:00 81浏览
  • 晶台光耦KL817和KL3053在小家电产品(如微波炉等)辅助电源中的广泛应用。具备小功率、高性能、高度集成以及低待机功耗的特点,同时支持宽输入电压范围。▲光耦在实物应用中的产品图其一次侧集成了交流电压过零检测与信号输出功能,该功能产生的过零信号可用于精确控制继电器、可控硅等器件的过零开关动作,从而有效减小开关应力,显著提升器件的使用寿命。通过高度的集成化和先进的控制技术,该电源大幅减少了所需的外围器件数量,不仅降低了系统成本和体积,还进一步增强了整体的可靠性。▲电路示意图该电路的过零检测信号由
    晶台光耦 2025-01-16 10:12 102浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 143浏览
  • 随着智慧科技的快速发展,智能显示器的生态圈应用变得越来越丰富多元,智能显示器不仅仅是传统的显示设备,透过结合人工智能(AI)和语音助理,它还可以成为家庭、办公室和商业环境中的核心互动接口。提供多元且个性化的服务,如智能家居控制、影音串流拨放、实时信息显示等,极大提升了使用体验。此外,智能家居系统的整合能力也不容小觑,透过智能装置之间的无缝连接,形成了强大的多元应用生态圈。企业也利用智能显示器进行会议展示和多方远程合作,大大提高效率和互动性。Smart Display Ecosystem示意图,作
    百佳泰测试实验室 2025-01-16 15:37 179浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 246浏览
  • 一个易用且轻量化的UI可以大大提高用户的使用效率和满意度——通过快速启动、直观操作和及时反馈,帮助用户快速上手并高效完成任务;轻量化设计则可以减少资源占用,提升启动和运行速度,增强产品竞争力。LVGL(Light and Versatile Graphics Library)是一个免费开源的图形库,专为嵌入式系统设计。它以轻量级、高效和易于使用而著称,支持多种屏幕分辨率和硬件配置,并提供了丰富的GUI组件,能够帮助开发者轻松构建出美观且功能强大的用户界面。近期,飞凌嵌入式为基于NXP i.MX9
    飞凌嵌入式 2025-01-16 13:15 205浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 151浏览
  • 百佳泰特为您整理2025年1月各大Logo的最新规格信息,本月有更新信息的logo有HDMI、Wi-Fi、Bluetooth、DisplayHDR、ClearMR、Intel EVO。HDMI®▶ 2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新规范将支持更高的分辨率和刷新率,并提供更多高质量选项。更快的96Gbps 带宽可满足数据密集型沉浸式和虚拟应用对传输的要求,如 AR/VR/MR、空间现实和光场显示,以及各种商业应用,如大型数字标牌、医疗成像和
    百佳泰测试实验室 2025-01-16 15:41 168浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 99浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦