Arm更新Neoverse产品路线图,积极拥抱人工智能!

飙叔科技洞察 2024-02-27 18:10

在ChatGPT与Sora的带动下,人工智能热潮持续不退,全球都在拥抱人工智能。作为全球应用最为普及的架构,Arm亦成为AI得以运行的基石之一。近日,Arm更新Neoverse产品路线图,宣布推出两款基于全新第三代Neoverse IP构建的新的Arm Neoverse计算子系统 (CSS)。其中,Neoverse CSS V3是高性能V系列中的首款Neoverse CSS产品,与CSS N2相比,其单芯片性能提高了50%;Neoverse CSS N3更聚焦能效优势,与CSS N2相比,每瓦性能可提升20%。

Neoverse CSS汇集了构成系统级芯片核心的关键技术,去年一经推出即受到云服务提供商、初创公司等的青睐,被大量应用于云计算、网络、数据中心基础设施当中。Neoverse CSS V3与CSS N3作为新一代技术,具有更高性能和效率,可以满足更高的工作负载和总体拥有成本 (TCO)的需求。
对此,Arm 高级副总裁兼基础设施事业部总经理Mohamed Awad在日前举办的“Arm 技术媒体沟通会”上指出,计算正变得越来越专用化,通用CPU已经不能满足需求。在基础设施领域,人们可以看到越来越多的厂商正在转型,朝向更加复杂的仓库级计算发展。这种趋势变得越来越明显,厂商关注的重点已不再只是芯片、服务器或者机架,而是整个数据中心。
在此前景下,众多大型科技企业开始基于Arm平台构建新一代的系统和基础设施。英伟达、亚马逊云科技和微软等行业巨头都在从头开始设计系统,并且定制系统级芯片。“这是因为这些科技巨头更加了解自身的工作负载,他们有能力对系统的各个方面进行调优,包括网络、加速甚至是通用计算等。而Arm独特的定位能够赋予合作伙伴快速创建定制解决方案的能力。同时Arm强大的生态系统也受到头部云服务提供商和初创公司的信赖,愿意采用到云计算、网络、数据中心基础设施,以及AI等多种应用当中。”Mohamed Awad表示。据悉,Microsoft Azure Cobalt CPU便是基于 Arm Neoverse CSS 所打造。
Arm Neoverse CSS让定制芯片变得更加简捷
在AI热潮推动下,越来越多科技巨头亲自下场定制AI芯片。首要原因是各大厂商希望优化芯片性能、寻求差异化方案。摩尔定律放缓背景下,以往依靠定律推动芯片性能与效益提升已经越来越难以为继,要想得到最佳计算性能,必须仰赖针对特定应用和数据集合的体系架构。特别是在AI大模型领域,不同厂商均有着不同的差异化需求,一体适用的解决方案已不再适合。此外,降低成本也是各大厂商的现实考量。根据伯恩斯坦分析师StacyRasgon的分析,如果ChatGPT的查询规模增长到谷歌搜索的十分之一,其最初需要大约价值480亿美元的GPU,每年还需要约160亿美元的芯片维持运营。
Arm基础设施事业部产品解决方案副总裁Dermot O’Driscoll强调,借助Arm的合作式 IP 业务模式和计算子系统,能够支持头部企业对云计算关键工作负载的计算进行优化,同时以行之有效的方式来打造定制芯片。
2023年,Arm推出Neoverse CSS,让定制芯片变得更加简捷。Neoverse CSS 配置、优化和验证了一套完整的计算子系统,从而使得合作伙伴能够专注于,针对特定系统级工作负载塑造差异化竞争优势,如软件调优、定制加速等。新推出的CSS N3和CSS V3产品则是进一步的升级。CSS N3 的首个实例可以提供32 核,热设计功耗 (TDP) 降至 40W,可覆盖电信、网络和 DPU 等一系列应用;CSS V3 在单芯片上最多可扩展至 128 核,并支持最新的高速内存和I/O标准。
快速打造Chiplet
AI蓬勃发展对芯片算力提出更高要求的同时,也推升了业界对Chiplet(芯粒)等技术的研发与投入。研究显示,当5nm芯片的面积达到200mm2以上,Chiplet方案成本将低于单颗SoC,同时也减少了因芯片面积增加而带来的良率损失。除了成本和良率的优势,Chiplet技术还带来了高速的Die to Die互连,使得芯片设计厂商可以将多颗芯粒集成在一颗芯片之中,实现算力上的大幅提升。越来越多厂商意识到,Chiplet将是AI芯片实现算力跨越的破局之道。
Dermot O’Driscoll表示,芯粒已成为管理良率的常用机制,能让企业在单个芯片上利用到多种工艺节点。例如,使用较旧的工艺节点处理 I/O,同时搭配先进的工艺节点处理逻辑功能。企业也在努力寻找巧妙的方法来复用芯粒,但尤其是当他们将不同团队的设计组合在一起时,还是面临一些挑战。通用芯粒互连技术 (UCIe) 是一项行业标准,旨在解决芯粒物理层兼容性的问题。Arm和生态系统合作伙伴正积极参与这个项目。协议层存在多种标准,包括 PCIe、CXL 和 AMBA。Arm 深入参与到 AMBA CHI,引入芯片到芯片 (C2C) 的扩展功能。
而Neoverse CSS 可以帮助用户快速打造Chiplet,它能提供用户所需的所有接口,以便选择耦合自身的加速器。Arm近期发布芯粒系统架构 (Chiplet System Architecture, CSA),与20多家合作伙伴共同努力,推动整个生态系统释放Chiplet技术的潜力。
庞大生态系统支持
生态系统也是AI芯片设计中人们重点考虑的关键因素之一。Arm 基础设施事业部营销副总裁 Eddie Ramirez称,Arm的独特之处还在于拥有庞大的生态系统支持。Arm 全面设计 (Arm Total Design) 生态项目提供了一个生态系统,参与其中的合作伙伴均致力于无缝交付基于 CSS 的定制芯片。Arm 全面设计推出后短短四个月内,已经有20多家成员加入,包括新的EDA和配套IP提供商,以及来自韩国、印度、中国大陆,以及中国台湾地区的芯片设计合作伙伴。
Eddie Ramirez表示,Arm正在与三家主要代工厂合作,以确保CSS 产品能在其先进工艺节点上进行优化。“定制芯片离不开可靠供应链的支持,Arm可提供多样的技术和选择。Arm 全面设计合作伙伴正在打造多款基于CSS的SoC。”Eddie Ramirez强调。

飙叔感谢您花时间关注与分享,感谢在我的人生道路中多了这么多志同道合的朋友,一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙及华为手机等华为产业为代表的中国ICT产业崛起的点点滴滴;从此生活变得不再孤单,不再无聊!

勾搭飙叔,请扫码

飙叔科技洞察 一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙等华为产业点点滴滴!
评论
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 53浏览
  • 在智能化技术快速发展当下,图像数据的采集与处理逐渐成为自动驾驶、工业等领域的一项关键技术。高质量的图像数据采集与算法集成测试都是确保系统性能和可靠性的关键。随着技术的不断进步,对于图像数据的采集、处理和分析的需求日益增长,这不仅要求我们拥有高性能的相机硬件,还要求我们能够高效地集成和测试各种算法。我们探索了一种多源相机数据采集与算法集成测试方案,能够满足不同应用场景下对图像采集和算法测试的多样化需求,确保数据的准确性和算法的有效性。一、相机组成相机一般由镜头(Lens),图像传感器(Image
    康谋 2024-12-12 09:45 12浏览
  • 首先在gitee上打个广告:ad5d2f3b647444a88b6f7f9555fd681f.mp4 · 丙丁先生/香河英茂工作室中国 - Gitee.com丙丁先生 (mr-bingding) - Gitee.com2024年对我来说是充满挑战和机遇的一年。在这一年里,我不仅进行了多个开发板的测评,还尝试了多种不同的项目和技术。今天,我想分享一下这一年的故事,希望能给大家带来一些启发和乐趣。 年初的时候,我开始对各种开发板进行测评。从STM32WBA55CG到瑞萨、平头哥和平海的开发板,我都
    丙丁先生 2024-12-11 20:14 19浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 74浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 146浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 102浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 91浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 110浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 90浏览
  • 铁氧体芯片是一种基于铁氧体磁性材料制成的芯片,在通信、传感器、储能等领域有着广泛的应用。铁氧体磁性材料能够通过外加磁场调控其导电性质和反射性质,因此在信号处理和传感器技术方面有着独特的优势。以下是对半导体划片机在铁氧体划切领域应用的详细阐述: 一、半导体划片机的工作原理与特点半导体划片机是一种使用刀片或通过激光等方式高精度切割被加工物的装置,是半导体后道封测中晶圆切割和WLP切割环节的关键设备。它结合了水气电、空气静压高速主轴、精密机械传动、传感器及自动化控制等先进技术,具有高精度、高
    博捷芯划片机 2024-12-12 09:16 16浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 50浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-11 17:58 20浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 90浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 91浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦