Falcon Shores是在Rialto Ridge 取消后的替代品,也是 Ponte Vecchio 的指定后续产品。根据早前报导,Falcon Shores 将会是一款混合型态的XPU产品,因为在这个封装内将会整合 GPU、CPU 与 Memory 在内。然而在周一的会上,英特尔确定 Falcon Shores 将不再是 XPU,而回归到单纯的 GPU 而已。

据路透社消息,当地时间周一(5月23日),英特尔(Intel)就其计划于2025年推出的一款人工智能(AI)运算芯片提供了更多细节。

英特尔在德国举行的一个超级计算会议上表示,即将推出的“Falcon Shores” (猎鹰海岸)芯片将拥有288GB的HBM3内存和 9.8TB/s 的总内存吞吐量,正如预期的那样,它将支持较小的数据类型,如 FP8 和 BF16。这些细节也是英特尔实施战略转型,抢占人工智能处理器市场,以追赶英伟达和AMD的首批披露内容。

Falcon Shores是在Rialto Ridge 取消后的替代品,也是 Ponte Vecchio 的指定后续产品。根据早前报导,Falcon Shores 将会是一款混合型态的XPU产品,因为在这个封装内将会整合 GPU、CPU 与 Memory 在内。然而在周一的会上,英特尔确定 Falcon Shores 将不再是 XPU,而回归到单纯的 GPU 而已。

Falcon Shores GPU 将会是英特尔Xeon Max GPU 系列产品中的一环,采用标准以太网交换,很像英特尔专注于 AI 的 Gaudi 架构。此外,Falcon Shores GPU 将会如同 Ponte Vecchio 般采用Chiplet模块式设计,允许针对单一 GPU 进行程序处理。这个基础性架构非常灵活,可以随着时间的推移集成Intel和客户的新IP(包括CPU内核和其它芯粒),使用Intel IDM 2.0模式制造。

该设备的基本草图还包括一个通用的基于 GPU 的编程接口 OneAPI,它将允许与其他 CPU 和架构广泛兼容。 英特尔还将 CXL (Compute Express Link)支持列为一个关键的差异化因素,这让GPU、AI 芯片和其他加速器可以轻松访问大型存储和内存池。

为何从XPU变成了GPU?

下面我们来分析一下英特尔从 Falcon Shores 中抽出 CPU 内核背后的深层次原因。

英特尔表示,当前计算环境还不成熟,要实现将 CPU 和 GPU 内核混合到同一个 Falcon Shores 封装中的最初目标还为时过早。 如上图所示,随着生成 AI 和 LLM 进入 HPC 空间,不同处理器的工作负载在改变,CPU 和 GPU 内核的最佳组合随着时间的推移而发生变化。 因此也引发了英特尔关于如何构建下一代超级计算架构思维的转变,他们认为现在还不是将客户锁定在特定 CPU 和 GPU 比例的时候。

此外,从设计上讲,处于前沿的超级计算机是针对特定任务的高度专业化设计,针对架构的软件调整只是运行超级计算机的常规操作。 这些因素意味着 CPU/GPU 比率并不是英特尔从设计中移除 CPU 内核的唯一原因。

英特尔还指出,Falcon Shores允许其客户使用各种不同的 CPU,逻辑上包括 AMD 的 x86 和 Nvidia 的 Arm 芯片,以及他们的 GPU 设计,因此不会限制客户只选择英特尔的 x86 内核,CPU 和 GPU 的解耦将为具有不同工作负载的客户提供更多选择。

英特尔表示,使用CXL接口的目的是让其客户能够利用可组合的架构,在他们的定制设计中将各种 CPU/GPU 比率结合在一起。 然而,CXL 接口仅在芯片组合之间提供 64 GB/s 的吞吐量,而像 Nvidia 的 Grace Hopper 这样的定制 CPU+GPU 设计可以在 CPU 和 GPU 之间提供高达 1 TB/s 的内存吞吐量。 对于许多类型的工作负载——尤其是需要内存带宽的 AI 工作负载,这比 CXL 实现具有性能和效率优势。

Ponte Vechhio 还要再多坚持两年

一直到 2025 年的 Falcon Shores 出来前,Ponte Vechhio 仍是英特尔AI及 HPC 市场的最佳 GPU 方案。它将不得不与更先进的 HPC 架构竞争,例如 Nvidia 的 Grace Superchips 和 AMD 即将推出的CDNA3/Zen4 混合体(exascale APU) Instinct MI300,它们都会在 2023年推出。

英特尔数据中心 GPU Max 1550 (Ponte Vecchio) 与 NVIDIA H100 PCIe (Hopper)对比

此次更动 Falcon Shores 的原因主要是英特尔目前规划拥有 2 条产品线,而 Falcon Shores 的推出将大幅度提升产品的灵活性。至于 HPC 用的 XPU 部分仍在持续进行,但它不会是 Falcon Shores 最初发布的一部分。

原本用于虚拟、云加速市场的是Arcitic Sond M,按照之前的规划,它们应该在今年被Rialto Bridge和Lancaster Sound系列新品取代。但最新的路线图中,这两款产品的开发被终止了,转而直接开发下一代的产品,也就是Falcon Shores。

另一方面,AI 部分用的 Habana Gaudi 在进入第 3 代以后,将不会有任何更新,而后续也会被 Falcon Shores 替代。英特尔称,他们“计划整合 Habana 和 AXG 产品 (GPU)路线图”,但透露的整合细节很少。

Gaudi 计算架构与标准 GPU 有很大不同,因此其计算架构似乎无法完全集成到 GPU 中。 因此,英特尔可以将Gaudi设计的较小部分(例如其网络接口或其他 IP 块)整合到其 GPU 中。 

据悉,AMD的Instinct MI300和英伟达的 Grace Hopper均采用混合式CPU+GPU设计,这种做法的优势是可以降低成本并节省电力,但会将客户产品设计与供应商方案配置高度绑定。

与他们相比,英特尔的纯GPU+灵活搭配CPU方案对于某些工作负载来说很好,但它可能无法在某些应用程序的功率、成本或性能方面与对手竞争。

责编:Luffy
阅读全文,请先
您可能感兴趣
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
Intel刚刚发布了新一代桌面显卡Arc B580和B570,关键是还支持AI帧生成和低延迟...
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
人工智能(AI)功能已经在各种移动设备中变得至关重要。尤其是2024年,AI PC陆续推向市场,甚至可以称为“边缘设备AI元年”。 这次我们就来盘点一下2024年下半年发布的主要AI PC和处理器。
借着传说中Intel在中国举办的有史以来规模最大的生态大会,谈谈AI PC生态于2024收官之际大致发展到了哪儿...
台积电的1.6纳米芯片“A16”技术具有多项创新点,其中最显著的是其超级电源轨(SPR)背面供电网络。这一技术是台积电首创,专为高性能计算产品设计,旨在提高芯片的性能和降低功耗。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
有博主基于曝光的信息绘制了iPhone 17系列渲染图,对比iPhone 16系列,17系列最大变化是采用横置相机模组,背部DECO为条形跑道设计,神似谷歌Pixel 9系列,这是iPhone六年来的
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
点击蓝字 关注我们电网和可再生能源系统向着更智能、更高效的方向发展助力优化能源分配构建更加绿色和可靠的能源未来12 月 24 日 上午 9:30 - 11:302024 德州仪器新能源基础设施技术直播