至强6900P系列处理器最高配备128个内核,这让其在数据库、科学计算等关键应用负载领域实现了相比上一代产品2.31倍-2.5倍的“跨越式表现”;而在AI应用中,至强6900P平台则实现了1.83倍-2.4倍的提升。

今年6月,英特尔发布了有史以来最强大的至强处理器——至强6“能效核(E-Core)”和“性能核(P-Core)”,按照英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立的说法,尽管现在很多的AI负载并不是跑在CPU,而是跑在GPU上面,但是有一个事实是,现在所有的AI服务器或者加速系统,绝大部分的机头使用的都是英特尔CPU处理器。

英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立

因此,与主流GPU厂商、AI生态合作伙伴建立良好的合作关系,共同定义至强规格以提供最佳的机头体验,成为了英特尔和至强6处理器的“新使命”。

性能,可以更加“强悍”

英特尔® 至强® 6性能核处理器专为计算密集型工作负载而设计。已上市的至强6900P系列处理器(代号Granite Rapids-AP)最高配备128个内核,而在2年前,市场上一个主流服务器所搭配的至强处理器大约为24-48核。大幅提升的CPU内核数量和整体性能,让至强6900P平台在数据库、科学计算等关键应用负载领域实现了相比上一代产品2.31倍-2.5倍的“跨越式表现”;而在AI应用中,至强6900P平台则实现了1.83倍-2.4倍的提升。

除了内核数量外,至强6900P还支持高达每秒6400MT的DDR5内存、每秒8800MT的MRDIMM内存、6条UPI 2.0链路(速率高达每秒24GT),96条PCIe 5.0或64条CXL 2.0通道、504MB的L3缓存,支持FP16数据格式的英特尔®高级矩阵扩展(英特尔® AMX),可为AI和科学计算等内存带宽敏感型工作负载提供MRDIMM选择,且新增对CXL 2.0的支持。

这其中,对MRDIMM和CXL的支持尤其值得关注。据陈葆立介绍,MRDIMM利用数据缓冲区,实现了两个列的同步操作,从而允许一次向CPU传输128字节的数据;而传统DRAM 模块一次只能传输64字节。英特尔至强6性能核处理器通过使用标配6400MT/s和更快的MRDIMM内存结合的方式,可以处理对内存非常敏感的工作负载,包括科学计算、AI等。 

而继第五代至强正式引入CXL 2.0用以扩展内存容量和带宽以来,至强6已经可以支持3种CXL内存扩展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

芯片架构是至强6性能核处理器的独特之处,它采用了计算芯片单元(compute die)与I/O芯片单元(I/O die)解耦的分离式模块化设计,以Chiplet的形式封装在一起。计算单元中包含了x86内核、内存控制器和缓存,I/O单元中包含了PCle、CXL、UPI等通用协议,也包括了英特尔独有的加速器。通过不同的排列组合,使得它可以灵活组合不同数量的计算单元,实现核心数量的扩展及内存和I/O的同步强化,保证更优的整体性能和能效。

在AI加速方面,从第四代至强处理器开始,英特尔就为AI加速推出了专属指令集——高级矩阵扩展(英特尔AMX)。通过这个指令集,CPU能够更好地支持大模型推理计算。在最新一代的至强处理器中,该指令集也进行了升级。AI工作负载方面,至强6性能核处理器可运行12种工作负载,覆盖通用计算、数据库、科学计算等,其中包括Llama2、Llama3大模型等。

综合来看,在云计算领域,英特尔至强6处理器在每路核心数、单核性能、每瓦性能方面,相比上一代处理器均有显著提升。测试数据显示,与第五代英特尔®至强®可扩展处理器相比,至强6处理器拥有多达2倍的每路核心数,平均单核性能提升高达1.2倍,平均每瓦性能提升高达1.6倍,同等性能水平下平均节省30%的TCO。

生态,可以更加“丰富”

算力作为新型生产要素,结合数据和算法,通过智能化引发经济范式的转变,为新质生产力的爆发提供了关键驱动力,是新质生产力的重要构成。IDC数据显示,15个重点国家的计算力指数平均每提高一个点,国家的数字经济和GDP就分别会增长千分之3.6和千分之1.7,并且算力指数在发展到一定阶段后呈放大效应。

“作为算力的载体,数据中心在过去近20年中,通过不断地演进与重构见证和推动了科技的发展。”英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉表示,“英特尔通过平台和产品的迭代升级,不断优化数据中心架构。在算力需求日益多样化和海量化发展的当下,英特尔通过至强6性能核处理器的发布,与生态伙伴共同探索数据中心系统架构的升级,进一步释放算力价值。”

英特尔市场营销集团副总裁、中国区云与行业解决方案和数据中心销售部总经理梁雅莉

发布会上,一众生态伙伴分享了其基于英特尔至强6性能核产品的最新解决方案,并分别从计算密度、内存带宽、数据处理、能效优化四个方面阐述了其卓越的性能表现。其中:

  • 浪潮信息联合英特尔及客户伙伴发布了国内领先的服务器计算模组设计规范(OCM),基于最新至强平台率先推出松耦合开源架构,满足多样化算力部署需求。
  • 阿里云方升架构协同英特尔至强处理器持续迭代演进,推出最新一代磐久计算型服务器,以及基于至强6性能核的第九代阿里云英特尔平台企业级计算实例产品。
  • 超聚变则带来了其首款支持CXL2.0+的内存池,可通过灵活分配与共享内存以充分提升系统效能。
  • 火山引擎基于英特尔至强6性能核处理器进行了架构和性能优化,CPU核心数翻倍并采用双单路架构设计,使其第四代云服务器实例在保障稳定性的同时大幅提升了计算密度和应用性能。
  • 新华三与英特尔联合打造“G-Flow”油类单相浸没液冷技术,通过突破性设计大幅提高液体流速,在保持系统性价比的同时,提高整体冷却效率。

计算,可以更加“绿色”

如今,更强算力需求让数据中心面临着前所未有的能耗和散热挑战。立足于此,英特尔发起了英特尔中国数据中心液冷创新加速计划,不仅携手行业伙伴突破油类单相浸没散热能力有限的技术难题,也进一步推动冷板式液冷整体解决方案验证,同时还联合生态力量推动UQD互换验证测试,从技术创新、构建统一行业标准两方面“双管齐下”,降低数据中心液冷使用成本、增强可靠性,为液冷技术的规模化应用保驾护航。

新华三集团计算存储产品线的副总裁刘宏程分享了新华三携手英特尔推出的G-Flow油类单相浸没液冷方案。该方案使用臭氧消耗潜值ODP为0的绝缘油,并针对处理器设计了独特的流道,为高功耗部件增加了强制对流,这样所有由CDU(冷却分配单元)提供的流量都可以通过芯片散热器而不经过旁路,通过控制液面高度差,利用重力强制流体通过处理器区域。

目前,服务器的流道深度约为800mm,通过处理器的流速可以达到每秒3.95米,与自然对流引起的流量相比,即使受到流体粘性的影响,但散热器的流速得到了显著提升,从而极大的提升了散热效率。通过实测,G-Flow方案可以解决千瓦级的芯片散热需求,提升能效的同时让用户在选择冷却液方面具有更大的灵活性。

宁畅副总裁兼首席技术官赵雷谈到,随着CPU算力越来越强,核数从上一代64核升级到现在128核,它的能耗也相应从300瓦增加到500瓦,这也客观推动了液冷的发展和快速落地。以往350瓦以下的CPU可以通过风冷解决散热问题,但新一代CPU则需要更高效的散热方案,如液冷。这一转变不仅推动了液冷技术的进步,包括冷板、浸没式冷却等,还带动了整个液冷基础设施的发展。

他强调说,液冷技术的普及将对电力基础设施提出新的要求,因为随着散热系统的升级,供电能力可能成为新的瓶颈。因此,电力系统的改进也将成为必要。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
飞腾系列CPU广泛应用于政务、金融、电信、电力、能源、交通、医疗和教育等多个关系国计民生的领域,市场份额稳步递增,总体处于领先位置。
尽管预计AI和HPC将从2026年开始引领应用,但汽车和显示器应用也将受益于FOPLP。
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
谷歌认为,这种独家协议可能会限制市场竞争,导致其他公司无法自由地使用OpenAI的技术,从而增加了用户面临额外成本的风险,比如数据迁移和员工培训等。
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
短期全球芯片市场数据的上调反映了 2024 年第 2 季度和第 3 季度业绩的改善,尤其是在计算领域,受AI 芯片支持的需求推动。
本研究通过设计闪存存算一体架构,有效提升了计算效率和精度,为解决复杂计算任务提供了重要技术支撑。
日本两大全球汽车集团本田与日产于2024年12月23日宣布启动合并谈判,目标在2025年6月达成协议,三菱汽车也有望加入。若三家车厂顺利合并,当务之急将是整合各自的资源以节省开支,利用规模化生产降低成本,以及加快电动车相关计划......
芯联集成与广汽埃安共建联合实验室,将共同推动汽车半导体技术研发创新,为智能电动汽车注入新活力。
美芯晟最新推出全集成精确直接飞行时间测距的dToF传感器MT3801,基于单光子飞行时间进行精确测距,测距范围支持到5m,同时集成SPAD、算法处理模块、Cortex M0内核和940nm VCSEL及光学滤光片,可广泛应用于手机/Pad、扫地机、吹风机、水龙头、智能马桶、投影仪、无人机等领域。
点击左上角“锂电联盟会长”,即可关注!在锂离子电池中,正极材料是决定电池能量密度和安全性的主要因素。市场上常见的LIBs正极材料包括层状结构的LiCoO2和三元正极材料(LiNi1-x-yCoxMny
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,2025年1月2日,比亚迪正式对外公布了2024年的销量战报。数据显示,2024年比亚迪累计销售新车4272145辆,其中乘用车销售4250
在科技领域蓬勃发展的 2025 年伊始,洛微科技(LuminWave)正式宣布获得北京电控光电融合基金战略投资,并完成B1轮融资首关,成为本年度激光雷达行业以及光电融合产业领域的开篇力作,犹如一颗闪耀
EVH原创文章1.智新对于电动汽车主驱功率半导体模块的开发思考2.如何提升碳纤维转子在电驱动中的应用价值3.新能源重卡电驱桥产品力研究及架构创新4.舍弗勒全新电驱动桥集成方案一览5.面向扁线工艺的电机
点击上面↑“电动知家”关注,记得加☆“星标”!电动知家消息,北京时间2025年1月2日晚,特斯拉发布2024年第四季度及全年生产与交付报告。数据显示,特斯拉2024年全年销量为179万辆,较2023年
作为人工智能领域(AI)中文教材扛鼎之作,南京大学周志华教授所著的《机器学习》帮助无数AI从业者理清了机器学习的基本原理。在书中,周志华解释机器学习基本术语和问题时,贯穿全书用西瓜进行比喻讲解,因此该
好问题,你看见这个标题就觉得有意思是吧?我经常就想着能不能系统里面可以方便的添加硬件模块,然后系统马上就可以检测并使用。PS:后面一时兴起以CW32的MCU为例详细的解读了IIC协议的种种,如果读懂,
点击左上角“锂电联盟会长”,即可关注!科学背景由于锂离子电池比石墨具有更高的比容量,因此与锂离子电池相比,锂金属电池(lmb)具有更高的体积和重量能量密度。在液态下, 锂枝晶沉积和电池短路的问题一直难
直播报名入口电脑端复制到浏览器:https://www.fanyedu.com/live/275.html⇩手机端识别下方二维码报名直播⇩直播时间2025年1月3日 晚8点直播介绍在我们进行PCB设计
近日,由国家科学技术奖励工作办公室审核并备案(奖励编号:0319)的“云计算中心科技奖”正式揭晓,艾特网能高密智算风冷悬浮多联热管空调系统荣膺“云计算中心科技奖·卓越奖”,这是艾特网能继北斗iBloc