第四代英特尔至强“神器”深入解析:轻松提升数倍性能更节电节成本

原创 文Q聊硬件 2023-04-02 23:37

尽管在日常生活中,大多数普通用户都接触不到服务器和数据中心平台,但是一方面,我们使用的很多软件和互联网服务,背后就是数据中心在默默提供支撑,另一方面,大量先进的计算技术都首先应用于数据中心,并惠及消费级平台。

所以,数据中心看似遥远,其实就在我们身边。

今年1月11日,英特尔正式发布了代号Sapphire Rapids的第四代至强可扩展处理器(下文简称四代至强),还有集成HBM高带宽内存的至强Max系列,以及代号Ponte Vecchio的数据中心GPU Max系列。

虽然乍一看,四代至强的有些规格不如竞品,但事实上,英特尔现在追求的,已经不再是单一产品参数,而是打造更强大、更灵活、更适应未来的综合算力平台。

英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰指出,虽然传统上都认为Intel是一家CPU处理器公司,但在多元化的数字和数据时代,Intel提出了全新的“XPU”战略,通过提供CPU、GPU、FPGA、IPU等多种异构产品,为不同业务、应用场景提供定制化的算力解决方案。

除了硬件,Intel的软实力也不容小觑,旗下有着规模庞大的软件团队和研究院,毕竟,强大的软件是充分释放硬件潜力的关键。

尤其是在开源方面,英特尔一向毫不吝啬,为开源生态和社区贡献了大量的软件架构,这也有利于推动英特尔产品的应用和生态的扩展。

四代至强不仅拥有Intel 7先进工艺、全新架构,以及业界领先的DDR5、PCIe 5.0、CXL 1.1,更是在加速器方面引领了新潮流。

四代至强发布的时候,Intel强调它具备七大“神器”,包括高级矩阵扩展(AMX)、动态负载均衡器(DLB)、数据流加速器(DSA)、存内分析加速器(IAA)、数据保护与压缩加速技术(QAT)、安全引擎(Security)、至强Max高带宽内存(HBM)。

这些加速器不会改变已有的算法,仍是对算法的计算进行加速,从而提高效率、节约时间,也让客户进一步可以去设计新的算法。

根据官方数据,四代至强通过内置的丰富加速器,相比上代产品将目标工作负载的平均能效(每瓦性能)提升了多达2.9倍,而在优化电源模式下,每颗处理器可以节能高达70瓦且性能的影响极低,总体拥有成本也降低52-66%。

具体应用实例方面,比如腾讯借助AMX提升搜索、视频业务效率;比如京东利用IAA、DSA将天枢服务器性能提升超过1.7倍;比如阿里云第八代ESC实例整体算力提升60%、数据库读写性能提升15%、加解密和压缩解压性能提升4倍、AI推理性能提升4倍;比如火山引擎第三代弹性计算实例整机算力、单核算力、网络转发、存储IOPS、加解密、AI推理加速等全面明显提升……

英特尔技术专家也分享了四代至强加速器在多个具体应用场景中的体现:

- 阿里的“地址标准化”服务(如淘宝收货地址定位),使用AMX INT8加速和软件优化,单位时间查询性能提升2.48倍。

- 淘宝APP首页定制化推荐服务,使用AMX BF16、软件优化、AVX-512调优,性能提升3倍。

- 部署于腾讯云上的太极机器学习平台支撑的搜索和广告业务,使用AMX BF16/INT8,高精度实例性能提升3倍,低精度实例性能提升2倍,云服务实例所需CPU数量也大大减少。

- Stable Diffusion注意力机制,使用AMX BF16加速矩阵计算,使用AVX-512加速指数计算,搭配PyTorch插件,吞吐性能提升3.82倍。

- 亚信电信营业厅OCR方案,使用AMX软硬件优化,性能提升3.94倍。

- 用友企业ERP OCR服务使用AMX BF16/INT8加速,性能提升2.83倍。

- Clickhouse大数据分析数据库,使用IAA,Q4.1压缩解压性能提升40%。

- MongoDB数据库,使用IAA,性能提升47%。

- DML、DPDK、SPDK等软件库,均已集成DSA,性能可提升2.25倍,CPU资源可节省66%。

- 微软SQL Server,使用QAT加速,备份时间可缩短2/3,性能可提升1.34倍。

- Gbase 8a并行数据库,使用IAA,ZSTD压缩算法性能提升1.84倍,RapidZ压缩算法性能提升1.66倍。

四代至强发布之后,英特尔又加推了vRAN Boost,完全集成物理层加速功能,不再需要独立的加速卡,成为四代至强的新“神器”。

使用这一加速器,运营商可以在通用虚拟化平台上整合所有基站层,从而以通用处理器实现基站功能。

与上一代相比,vRAN Boost加速器能够在不增加功耗的情况下,提供两倍的容量,同时节省多达20%的能耗,满足关键的性能、扩展和能效要求。

英特尔技术专家指出,CPU处理器的发展趋势曾经就是单纯地提高频率、增加核心数量,但是对于互联网客户来说,特殊需求越来越多,比如压缩解压、加解密等等,更多核心、更高频率不一定能带来足够高的效率提升,提供一个专用加速器反而会有奇效,它相比异构计算距离内存也更近。

同时,随着客户和行业越来越重视能效,加速器也是提升能效比的有效途径。

当然,集成加速器会增加处理器的设计难度,影响验证上市时间,也会增加生态适配的难度,而这就体现了英特尔强大的业界影响力和号召力,可以推动生态支持,保证产品上市的时候就有大量软件服务可以支持到位。

值得一提的是,并不是每家客户都需要那么多的加速器,因此英特尔还提供了全新的On Demand服务,客户可以根据自己的实际需要,灵活选购不同的加速器,也可以按照使用量来开关付费。

庄秉翰还指出,随着“双碳”、新基建、“东数西算”的推进,对未来数据中心能耗的需求越来越严苛,绿色计算成为可持续发展的关键动力。

四代至强集成的众多加速器,能够以更高效率、更低能耗处理这种需求越来越大、越来越复杂的工作负载,换言之就是用更少能源消耗的完成更多的工作,同时还有一系列新的电源管理方案辅佐,进一步提高能效

在制造过程中,Intel使用的电力已经超过90%都是可再生能源,并且三代、四代至强提供一年的浸没式液冷方案保修服务,这在业界还是唯一一家。

如此种种,都让四代至强成为最具可持续性的数据中心处理器。

英特尔至强可扩展处理器诞生于2017年,迄今已经累计交付超过8500万颗,其中第三代产品在过去两年就出货了1500万颗。

最新的第四代产品已经完成了400多款不同设计方案,200多款已出货,前十大云服务提供商都会在今年部署基于新至强的云实例。

面向未来,随着算力市场需求的提高、应用的拓展,英特尔也在有针对性地开发新产品,都在顺利推进中。

比如2023年内推出下一代Emerald Rapids,2024年开始更是迎来全新变革,基于性能核的Granite Rapids、基于能效核的Sierra Forest,都会升级到Intel 3制造工艺,并集成更多核心,对于微服务、容器化场景非常适合。

总的来说,英特尔至强可扩展平台已经跳出来单纯拼参数的传统巢窠,进入了全新的加速器时代,通过针对特定负载和应用需求进行加速,以更灵活的方式、更低的能效实现更高的效率,更适应多元化的新算力时代。

如此,新至强既为客户实现更高的经济效益,又符合节能减排、绿色可持续发展的全球趋势,也让我们对至强可扩展平台未来的发展,有了更高的期待。


评论 (0)
  •   物质扩散与污染物监测系统:环境守护的关键拼图   一、物质扩散原理剖析   物质扩散,本质上是物质在浓度梯度、温度梯度或者压力梯度等驱动力的作用下,从高浓度区域向低浓度区域迁移的过程。在环境科学范畴,物质扩散作为污染物在大气、水体以及土壤中迁移的关键机制,对污染物的分布态势、浓度动态变化以及环境风险程度有着直接且重大的影响。   应用案例   目前,已有多个物质扩散与污染物监测系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润物质扩散与污染物监测系统。这些成功案例为物质
    华盛恒辉l58ll334744 2025-04-09 11:24 64浏览
  •   卫星图像智能测绘系统全面解析   一、系统概述   卫星图像智能测绘系统是基于卫星遥感技术、图像处理算法与人工智能(AI)技术的综合应用平台,旨在实现高精度、高效率的地理空间数据获取、处理与分析。该系统通过融合多源卫星数据(如光学、雷达、高光谱等),结合AI驱动的智能算法,实现自动化、智能化的测绘流程,广泛应用于城市规划、自然资源调查、灾害监测等领域。   应用案例   目前,已有多个卫星图像智能测绘系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润卫星图像智能测绘系统
    华盛恒辉l58ll334744 2025-04-08 15:04 103浏览
  •   卫星图像智能测绘系统:地理空间数据处理的创新引擎   卫星图像智能测绘系统作为融合卫星遥感、地理信息系统(GIS)、人工智能(AI)以及大数据分析等前沿技术的综合性平台,致力于达成高精度、高效率的地理空间数据采集、处理与应用目标。借助自动化、智能化的技术路径,该系统为国土资源管理、城市规划、灾害监测、环境保护等诸多领域输送关键数据支撑。   应用案例   目前,已有多个卫星图像智能测绘系统在实际应用中取得了显著成效。例如,北京华盛恒辉北京五木恒润卫星图像智能测绘系统。这些成功案例为卫星
    华盛恒辉l58ll334744 2025-04-08 16:19 88浏览
  • 在万物互联时代,智能化安防需求持续升级,传统报警系统已难以满足实时性、可靠性与安全性并重的要求。WT2003H-16S低功耗语音芯片方案,以4G实时音频传输、超低功耗设计、端云加密交互为核心,重新定义智能报警设备的性能边界,为家庭、工业、公共安防等领域提供高效、稳定的安全守护。一、技术内核:五大核心突破,构建全场景安防基座1. 双模音频传输,灵活应对复杂场景实时音频流传输:内置高灵敏度MIC,支持环境音实时采集,通过4G模块直接上传至云端服务器,响应速度低至毫秒级,适用于火灾警报、紧急呼救等需即
    广州唯创电子 2025-04-08 08:59 158浏览
  •   物质扩散与污染物监测系统软件:多领域环境守护的智能中枢   北京华盛恒辉物质扩散与污染物监测系统软件,作为一款融合了物质扩散模拟、污染物监测、数据分析以及可视化等多元功能的综合性工具,致力于为环境科学、公共安全、工业生产等诸多领域给予强有力的技术支撑。接下来,将从功能特性、应用场景、技术实现途径、未来发展趋势等多个维度对这类软件展开详尽介绍。   应用案例   目前,已有多个物质扩散与污染物监测系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润物质扩散与污染物监测系统。这
    华盛恒辉l58ll334744 2025-04-09 14:54 116浏览
  • HDMI从2.1版本开始采用FRL传输模式,和2.0及之前的版本不同。两者在物理层信号上有所区别,这就需要在一些2.1版本的电路设计上增加匹配电路,使得2.1版本的电路能够向下兼容2.0及之前版本。2.1版本的信号特性下面截取自2.1版本规范定义,可以看到2.1版本支持直流耦合和交流耦合,其共模电压和AVCC相关,信号摆幅在400mV-1200mV2.0及之前版本的信号特性HDMI2.0及之前版本采用TMDS信号物理层,其结构和参数如下:兼容设计根据以上规范定义,可以看出TMDS信号的共模电压范
    durid 2025-04-08 19:01 175浏览
  • 在人工智能技术飞速发展的今天,语音交互正以颠覆性的方式重塑我们的生活体验。WTK6900系列语音识别芯片凭借其离线高性能、抗噪远场识别、毫秒级响应的核心优势,为智能家居领域注入全新活力。以智能风扇为起点,我们开启一场“解放双手”的科技革命,让每一缕凉风都随“声”而至。一、核心技术:精准识别,无惧环境挑战自适应降噪,听懂你的每一句话WTK6900系列芯片搭载前沿信号处理技术,通过自适应降噪算法,可智能过滤环境噪声干扰。无论是家中电视声、户外虫鸣声,还是厨房烹饪的嘈杂声,芯片均能精准提取有效指令,识
    广州唯创电子 2025-04-08 08:40 194浏览
  • 文/郭楚妤编辑/cc孙聪颖‍伴随贸易全球化的持续深入,跨境电商迎来蓬勃发展期,物流行业 “出海” 成为不可阻挡的必然趋势。加之国内快递市场渐趋饱和,存量竞争愈发激烈。在此背景下,国内头部快递企业为突破发展瓶颈,寻求新的增长曲线,纷纷将战略目光投向海外市场。2024 年,堪称中国物流企业出海进程中的关键节点,众多企业纷纷扬帆起航,开启海外拓展之旅。然而,在一片向好的行业发展表象下,部分跨境物流企业的经营状况却不容乐观。它们受困于激烈的市场竞争、不断攀升的运营成本,以及复杂的国际物流环境,陷入了微利
    华尔街科技眼 2025-04-09 15:15 96浏览
  • 文/Leon编辑/侯煜‍就在小米SU7因高速交通事故、智驾性能受到质疑的时候,另一家中国领先的智驾解决方案供应商华为,低调地进行了一场重大人事变动。(详情见:雷军熬过黑夜,寄望小米SU7成为及时雨)4月4日上午,有网友发现余承东的职务发生了变化,华为官网、其个人微博认证信息为“常务董事,终端BG董事长”,不再包括“智能汽车解决方案BU董事长”。余承东的确不再兼任华为车BU董事长,但并非完全脱离华为的汽车业务,而是聚焦鸿蒙智行。据悉,华为方面寻求将车BU独立出去,但鸿蒙智行仍留在华为终端BG部门。
    华尔街科技眼 2025-04-09 15:28 95浏览
  • ## DL/T645-2007* 帧格式:* 帧起始字符:68H* 地址域:A0 A1 A2 A3 A4 A5* 帧起始字符:68H* 控制码:1字节* 主站:* 13H:请求读电能表通信地址* 11H:请求读电能表数据* 1CH:请求跳闸、合闸* 从站:* 91H:正常应答读电能表* 9CH:正常应答跳闸、合闸* 数据域长度:1字节* 数据域:DI0 DI1 DI2 DI3* 发送方:每字节+33H* 接收方:每字节-33H* 数据标识:* 电能量* 最大需量及发生时间* 变量* 事件记录*
    四毛打印店 2025-04-09 10:53 70浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦