Intel刚刚发布了至强W-2500与W-3500系列处理器,最高60个核心,面向工作站设备。现在的工作站,相比从前似乎已经大不一样了...

前不久英特尔网络与边缘计算行业大会期间,我们还说生成式AI进驻不同行业和企业的速度有些令人意想不到。在最近的至强W新品发布会上,Intel在现场介绍包括金融、媒体娱乐、地理信息采集、工业仿真等领域对于至强W处理器,和生成式AI技术的采用,令AI全面落地到现在的工作站设备上,进一步让我们感受到AI于不同行业落地的迅猛。

借着本次至强W-3500与至强W-2500系列处理器的发布,我们来看看现如今的工作站设备进化到了何种程度,AI在其中又发挥着怎样的作用。

 

进一步强调AI性能的至强W

熟悉Intel处理器不同品牌定位的读者应该知道,至强W是主要面向工作站的CPU产品,始于Skylake时代。去年的媒体会上,Intel就提过至强W承载着酷睿平台所无法达成的部分高性能应用场景,典型如工业仿真。

和酷睿产品线定位类似,至强W也有W3, W5, W7, W9不同型号。相比于去年更新代号Sapphire Rapids的至强W,这次发布的新版至强W架构为Sapphire Rapids-Refresh。所以CPU核心架构层面当为上代小改款,核心仍然是Golden Cove。

不过新一代至强W的核心数进一步增多,频率也略有提升:如至强W-3500系列最高配型号的W9-3595X,为60核心120线程,睿频4.8GHz;全系CPU相较上代同配增加4-8个核心;至强W-2500系列普遍增加2个核心,其中最高配的W9-2595X现有26个核心。

不过核心数增多,也让新款处理器的标称TDP略有增加(例如W9-3595X TDP功耗385W,相比W9-3495W提升35W)。

孙峪(英特尔中国区商用客户端产品总监)还在发布会上提到L3 cache容量至多提高1.5倍,达到最高112.5MB。此外,OEM/ODM及行业解决方案厂商,理论上在推服务器和工作站产品时,可以对CPU核心做进一步的超频——Intel在介绍行业方案时,就提到有服务器产品将核心超频到5.0GHz。

其他支持和规格理论上应该没什么变化,包括W-3500应当仍是基于EMIB封装的多die结构(Sapphire Rapids的XCC die,每片15核心,4片die就是60个核心全开);处理器管脚兼容性适配上代主板芯片组;支持至多8通道DDR5-4800(带ECC和更多RAS能力)——最高容量4TB;支持至多112 PCIe 5.0通道;另外面向商务企业客户对管理、安全和稳定性要求,也支持vPro技术。

这两个系列的处理器产品具体规格如下图:

尤为值得一提的是,Intel再度强调了Sapphire Rapids-Refresh的AI能力,包括对AVX-512以及AMX(高级矩阵扩展)扩展指令集的支持,实现CPU指令层面的AI加速——也就是让部分AI应用可以直接跑在CPU上,而不需要借助加速器。

与上代及更早至强W处理器做性能对比时,这一代产品基于更多的核心与cache、更高的频率,仍然在SPEC Workstation这类测试中表现出了不错的性能优势——对比包括媒体娱乐、产品开发、生命科学、金融服务、能源和通用计算几个维度的性能。

基于工作站更久的换代周期特性,比5年前的Cascade Lake,系统性能上的收益也是比较可观的。

所以如果单纯比较一些充分利用多核资源的测试项,如Blender、Arnoid,这一代核心数的优势还是可以拉满的。更重要的应当仍然在于Intel想要强调的指令级AI加速,所以特别给出了Topaz Labs Video AI的测试项,充分利用AMX扩展指令,达成了相比Cascade Lake大约4.3倍的性能优势。

所以在主要特性方面,孙峪强调这一代至强W的三大特点:可扩展的架构设计、专为AI开发而设计,以及vPro体现的商务性。

而从整场发布会上,Intel的发言与合作伙伴的展示来看,新发布的W-2500/W-3500强调的仍然是现在相当流行的AI能力。这一点也与Intel的网络与边缘、数据中心,乃至CCG业务的AI PC,现在的市场宣导达成了和谐统一。

 

工作站正扩张到更多领域

相较于更大众的PC端侧市场,工作站会显得更为特殊——与行业发展的紧密关联,令其市场与边缘和数据中心的发展模式存在某种相似性。IDC全球及中国副总裁王吉平给出了工作站市场未来几年的变化。IDC预测2025年工作站全球销量大约770万台,比今年增长5.6%;中国也会在经历此前两年的工作站市场下挫后,走向正向6.3%的价值增幅。

市场增长依据,我们大致总结为全社会数字化转型、各行各业走向数字化。在过往十多年的这一数字化进程里,工作站得以在更多的行业、领域内逐渐铺开。现在的工作站显然已经在教育、医疗、软件及信息服务、通信、金融等市场广泛应用了。

具体到应用场景,以前我们还习惯称其为“图形工作站”——主要是因为它当年的应用,大概率分布在计算机辅助设计与制造(CAD/CAM)、图形图像处理,以及工业自动化与控制、科学与模拟仿真。但现在,全社会数字化转型,让更多行业实现了数字化。所以工作站出现在了诸多新兴应用场景中,如医学影像处理、城市交通管理...

尤其AI近些年的发展,更是让AI与大数据处理相关应用,乃至远程会议和办公、直播/跨境电商需求数字人技术方案,都开始更广范围地采用工作站。王吉平特别列举了几个场景,比如说抢险救灾过程中,探测灾情的无人机与AI工作站连接,对灾情、所在地相关信息做出实时分析和判断,发现可能存在的潜在风险,为救援计划提供参考;

再比如金融机构用工作站,来支持复杂的金融交易系统和风险管理模型,对大量金融数据进行实时的AI分析预测...

尤为值得一提的是,赵朝卿(英特尔中国区解决方案部架构师)特别提到,不同行业、不同领域对工作站/服务器的需求可能差异很大。此前我们,更倾向于将“工作站”认定为性能高于传统PC的小型服务器——似乎从直觉来看,这类设备的通用性非常强。但实际上,从OEM企业、解决方案提供商,及Intel自身的表述来看,工作站的职能切分还是挺细的。

比如地理信息工程,也就是通过实景三维技术对目标对象做摄影数据采集,由计算机生成模型——这要求工作站具备便携性和灵活性;而且对存储容量、带宽明显要求更高;而用于工程仿真的工作站,在进行诸如石化领域流体力学仿真时,并行处理大量数据,要求设备的高可靠与稳定性,7x24小时长时间工作...

戴尔就在现场展示了采用新款至强W-3500系列的Precision 7960 Tower塔式工作站,强调“加速新能源汽车仿真设计”——具体的目标应用如达索Catia, Simens NX, SolidWorks, MATLAB等仿真模拟软件;用以按照特定工作流,在汽车设计过程中进行大量的建模、仿真,及前后数据处理与计算、数据整合与分析等。

而惠普Z系列AI一体机解决方案,甚至面向不同应用场景,细分到智能建筑、智慧金融、药物计算、数字人——且其中皆内置有特定行业的AI大模型,用以实现定制化需求。比如当面向建筑设计时,一方面要提供全品类素材库,满足实时渲染及团队3D协作工作流的需求;另一方面将AI加入其中,实现一键切换设计风格、一键切换材质表面等特性,乃至在设计原型展示中,用自然语言增减场景摆件。

还有联想搭载至强W-3500系列的“AI智能体开发和实训一体机”,旨在让AI开发人员快速学习、掌握智能体(AI agent)开发技术,为企业开发定制的智能体。结合其中预装的开发工具、框架、AI模型及相关服务,据说这套方案在清华大学iCenter做实训教学,获得了相当高的评价。

在更具体的应用场景列举中,Intel现场还提及金融领域基于至强W的高频交易方案(腾闪的极速高频交易服务器)、昱格用于地理信息采集的便携式存储服务器解决方案、航天联制用于工业仿真的工作站等等...

就这个角度来看,当代工作站针对不同应用场景的适配,似乎更有边缘市场的特性。

 

AI,AI,还是AI

虽然多场景工作站应用悉数登场,但毫无疑问这场发布会的主角仍然是AI。

现阶段的Intel在端侧、边缘、数据中心、网络多节点都在推行AI和生成式AI策略,不仅是硬件基础设施,还在于AI相关的软件——开发工具、框架、加速库、中间件等。Intel宣传自家AI解决方案是端到端的。工作站自然也不会例外。

比如融科联创在现场展示了基于至强W的液冷智算一体机,强调面向高校的AI科研教学需求;华栖云基于至强W所推的AIGC方案,强调用生成式AI来做文字与多媒体内容创作;还有超集用于量化交易的工作站,借助生成式AI来做量化回测、风险分析、策略制定…普遍都借助至强W的AI加速能力。

除了单纯仰仗AVX-512和AMX扩展指令集可实现CPU的AI加速之外,这次Intel在AI策略的实机演示中似乎也终于开始落实xPU策略了:即作为高算力工作站,Intel自家的Arc独显加速也可以放进来。

赵朝卿谈到的第一大类应用场景大语言模型,就在于结合至强W处理器和Arc独显,强调四个特点:高性能、高密度、适用多场景、更优TCO(总有拥有成本)。

至强W平台凭藉其扩展性,可接的Arc独显方案可选2卡、4卡、6卡。宝德和宁畅的工作站产品,都有初阶的2卡Arc A770,和高阶4卡Arc A770方案可选。两张Arc A770,显存共32GB,FP16理论峰值算力276TFLOPS;四卡理论上则做到性能翻番。

“这是性价比非常高的解决方案。”赵朝卿提到,价格仅2000+的消费级显卡Arc A770,是同价位显存容量最大的显卡产品。这也让Arc显卡搭建的AI工作站具备成本和性价比优势。

其中双卡方案支持9-20b参数量的AI模型,四卡方案则支持32b模型流畅运行——“我们尝试了通义千问Qwen-32b,完全没问题”。对国内外主流LLM、多模态大模型的支持,自然令其广泛适用于不同的场景。

加上Intel的开发工具让“用户从主流方案迁移过来做到硬件的透明无感“,也就实现了赵朝卿所说的四个特点。这才真正有了Intel的xPU实现全套AI解决方案的完整性。

王吉平认为,工作站市场预期在国内的增长,与中国现阶段强调加速发展新质生产力、寻求产业升级有很大的关系;孙峪则说,各行业高速发展、寻求创新,包括生成式AI、数字孪生、8K视频创作等热点的涌现,“有个共同的特点,就是对算力有着越来越高的要求”,故而对工作站有了需求。

至强W及其生态——包括面向不同应用场景打造的不同工作站及解决方案,就是Intel针对这一需求给出的答案。预计OEM/ODM的工作站产品将从下个月开始发售,AI在行业市场的发展大概也有机会更上一个台阶。

责编:Illumi
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
面对AI时代带来的差异化趋势、软件应用及开发时间长、软硬件协同难、高复杂度高成本等挑战,国产EDA仍需不断探索和创新。
股东诉讼指控英伟达的首席执行官黄仁勋隐藏了公司记录性收入增长主要由其旗舰产品GeForce GPU的挖矿销售驱动,而非游戏销售,导致投资者对公司的盈利来源和风险敞口产生错误认知。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
近日,华为终端BG CEO何刚在和紫牛基金创始合伙人张泉灵的对话中表示,华为Mate 70系列每一颗芯片都有国产的能力。此外,日前在深圳宝安中学的一场讲座中,华为终端BG 董事长余承东也自豪地宣布Mate70实现了芯片的100%国产化。
华为Mate 70系列中的Mate 70搭载了麒麟9010芯片,而Mate 70 Pro/Pro+/RS则首发了麒麟9020芯片。近日,百万粉丝的网红博主@杨长顺维修家 对华为Mate 70 RS进行了拆解……
常情况下,英特尔的CEO在65岁时退休,而现年63岁的基辛格突然被退休,让市场感到意外。为了确保平稳过渡,英特尔董事会立即着手寻找新的CEO人选……
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
12月18日,珠海京东方晶芯科技举行设备搬入仪式。插播:加入LED显示行业群,请加VX:hangjia188在10月31日,珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1