前不久英特尔网络与边缘计算行业大会期间,我们还说生成式AI进驻不同行业和企业的速度有些令人意想不到。在最近的至强W新品发布会上,Intel在现场介绍包括金融、媒体娱乐、地理信息采集、工业仿真等领域对于至强W处理器,和生成式AI技术的采用,令AI全面落地到现在的工作站设备上,进一步让我们感受到AI于不同行业落地的迅猛。
借着本次至强W-3500与至强W-2500系列处理器的发布,我们来看看现如今的工作站设备进化到了何种程度,AI在其中又发挥着怎样的作用。
进一步强调AI性能的至强W
熟悉Intel处理器不同品牌定位的读者应该知道,至强W是主要面向工作站的CPU产品,始于Skylake时代。去年的媒体会上,Intel就提过至强W承载着酷睿平台所无法达成的部分高性能应用场景,典型如工业仿真。
和酷睿产品线定位类似,至强W也有W3, W5, W7, W9不同型号。相比于去年更新代号Sapphire Rapids的至强W,这次发布的新版至强W架构为Sapphire Rapids-Refresh。所以CPU核心架构层面当为上代小改款,核心仍然是Golden Cove。
不过新一代至强W的核心数进一步增多,频率也略有提升:如至强W-3500系列最高配型号的W9-3595X,为60核心120线程,睿频4.8GHz;全系CPU相较上代同配增加4-8个核心;至强W-2500系列普遍增加2个核心,其中最高配的W9-2595X现有26个核心。
不过核心数增多,也让新款处理器的标称TDP略有增加(例如W9-3595X TDP功耗385W,相比W9-3495W提升35W)。
孙峪(英特尔中国区商用客户端产品总监)还在发布会上提到L3 cache容量至多提高1.5倍,达到最高112.5MB。此外,OEM/ODM及行业解决方案厂商,理论上在推服务器和工作站产品时,可以对CPU核心做进一步的超频——Intel在介绍行业方案时,就提到有服务器产品将核心超频到5.0GHz。
其他支持和规格理论上应该没什么变化,包括W-3500应当仍是基于EMIB封装的多die结构(Sapphire Rapids的XCC die,每片15核心,4片die就是60个核心全开);处理器管脚兼容性适配上代主板芯片组;支持至多8通道DDR5-4800(带ECC和更多RAS能力)——最高容量4TB;支持至多112 PCIe 5.0通道;另外面向商务企业客户对管理、安全和稳定性要求,也支持vPro技术。
这两个系列的处理器产品具体规格如下图:
尤为值得一提的是,Intel再度强调了Sapphire Rapids-Refresh的AI能力,包括对AVX-512以及AMX(高级矩阵扩展)扩展指令集的支持,实现CPU指令层面的AI加速——也就是让部分AI应用可以直接跑在CPU上,而不需要借助加速器。
与上代及更早至强W处理器做性能对比时,这一代产品基于更多的核心与cache、更高的频率,仍然在SPEC Workstation这类测试中表现出了不错的性能优势——对比包括媒体娱乐、产品开发、生命科学、金融服务、能源和通用计算几个维度的性能。
基于工作站更久的换代周期特性,比5年前的Cascade Lake,系统性能上的收益也是比较可观的。
所以如果单纯比较一些充分利用多核资源的测试项,如Blender、Arnoid,这一代核心数的优势还是可以拉满的。更重要的应当仍然在于Intel想要强调的指令级AI加速,所以特别给出了Topaz Labs Video AI的测试项,充分利用AMX扩展指令,达成了相比Cascade Lake大约4.3倍的性能优势。
所以在主要特性方面,孙峪强调这一代至强W的三大特点:可扩展的架构设计、专为AI开发而设计,以及vPro体现的商务性。
而从整场发布会上,Intel的发言与合作伙伴的展示来看,新发布的W-2500/W-3500强调的仍然是现在相当流行的AI能力。这一点也与Intel的网络与边缘、数据中心,乃至CCG业务的AI PC,现在的市场宣导达成了和谐统一。
工作站正扩张到更多领域
相较于更大众的PC端侧市场,工作站会显得更为特殊——与行业发展的紧密关联,令其市场与边缘和数据中心的发展模式存在某种相似性。IDC全球及中国副总裁王吉平给出了工作站市场未来几年的变化。IDC预测2025年工作站全球销量大约770万台,比今年增长5.6%;中国也会在经历此前两年的工作站市场下挫后,走向正向6.3%的价值增幅。
市场增长依据,我们大致总结为全社会数字化转型、各行各业走向数字化。在过往十多年的这一数字化进程里,工作站得以在更多的行业、领域内逐渐铺开。现在的工作站显然已经在教育、医疗、软件及信息服务、通信、金融等市场广泛应用了。
具体到应用场景,以前我们还习惯称其为“图形工作站”——主要是因为它当年的应用,大概率分布在计算机辅助设计与制造(CAD/CAM)、图形图像处理,以及工业自动化与控制、科学与模拟仿真。但现在,全社会数字化转型,让更多行业实现了数字化。所以工作站出现在了诸多新兴应用场景中,如医学影像处理、城市交通管理...
尤其AI近些年的发展,更是让AI与大数据处理相关应用,乃至远程会议和办公、直播/跨境电商需求数字人技术方案,都开始更广范围地采用工作站。王吉平特别列举了几个场景,比如说抢险救灾过程中,探测灾情的无人机与AI工作站连接,对灾情、所在地相关信息做出实时分析和判断,发现可能存在的潜在风险,为救援计划提供参考;
再比如金融机构用工作站,来支持复杂的金融交易系统和风险管理模型,对大量金融数据进行实时的AI分析预测...
尤为值得一提的是,赵朝卿(英特尔中国区解决方案部架构师)特别提到,不同行业、不同领域对工作站/服务器的需求可能差异很大。此前我们,更倾向于将“工作站”认定为性能高于传统PC的小型服务器——似乎从直觉来看,这类设备的通用性非常强。但实际上,从OEM企业、解决方案提供商,及Intel自身的表述来看,工作站的职能切分还是挺细的。
比如地理信息工程,也就是通过实景三维技术对目标对象做摄影数据采集,由计算机生成模型——这要求工作站具备便携性和灵活性;而且对存储容量、带宽明显要求更高;而用于工程仿真的工作站,在进行诸如石化领域流体力学仿真时,并行处理大量数据,要求设备的高可靠与稳定性,7x24小时长时间工作...
戴尔就在现场展示了采用新款至强W-3500系列的Precision 7960 Tower塔式工作站,强调“加速新能源汽车仿真设计”——具体的目标应用如达索Catia, Simens NX, SolidWorks, MATLAB等仿真模拟软件;用以按照特定工作流,在汽车设计过程中进行大量的建模、仿真,及前后数据处理与计算、数据整合与分析等。
而惠普Z系列AI一体机解决方案,甚至面向不同应用场景,细分到智能建筑、智慧金融、药物计算、数字人——且其中皆内置有特定行业的AI大模型,用以实现定制化需求。比如当面向建筑设计时,一方面要提供全品类素材库,满足实时渲染及团队3D协作工作流的需求;另一方面将AI加入其中,实现一键切换设计风格、一键切换材质表面等特性,乃至在设计原型展示中,用自然语言增减场景摆件。
还有联想搭载至强W-3500系列的“AI智能体开发和实训一体机”,旨在让AI开发人员快速学习、掌握智能体(AI agent)开发技术,为企业开发定制的智能体。结合其中预装的开发工具、框架、AI模型及相关服务,据说这套方案在清华大学iCenter做实训教学,获得了相当高的评价。
在更具体的应用场景列举中,Intel现场还提及金融领域基于至强W的高频交易方案(腾闪的极速高频交易服务器)、昱格用于地理信息采集的便携式存储服务器解决方案、航天联制用于工业仿真的工作站等等...
就这个角度来看,当代工作站针对不同应用场景的适配,似乎更有边缘市场的特性。
AI,AI,还是AI
虽然多场景工作站应用悉数登场,但毫无疑问这场发布会的主角仍然是AI。
现阶段的Intel在端侧、边缘、数据中心、网络多节点都在推行AI和生成式AI策略,不仅是硬件基础设施,还在于AI相关的软件——开发工具、框架、加速库、中间件等。Intel宣传自家AI解决方案是端到端的。工作站自然也不会例外。
比如融科联创在现场展示了基于至强W的液冷智算一体机,强调面向高校的AI科研教学需求;华栖云基于至强W所推的AIGC方案,强调用生成式AI来做文字与多媒体内容创作;还有超集用于量化交易的工作站,借助生成式AI来做量化回测、风险分析、策略制定…普遍都借助至强W的AI加速能力。
除了单纯仰仗AVX-512和AMX扩展指令集可实现CPU的AI加速之外,这次Intel在AI策略的实机演示中似乎也终于开始落实xPU策略了:即作为高算力工作站,Intel自家的Arc独显加速也可以放进来。
赵朝卿谈到的第一大类应用场景大语言模型,就在于结合至强W处理器和Arc独显,强调四个特点:高性能、高密度、适用多场景、更优TCO(总有拥有成本)。
至强W平台凭藉其扩展性,可接的Arc独显方案可选2卡、4卡、6卡。宝德和宁畅的工作站产品,都有初阶的2卡Arc A770,和高阶4卡Arc A770方案可选。两张Arc A770,显存共32GB,FP16理论峰值算力276TFLOPS;四卡理论上则做到性能翻番。
“这是性价比非常高的解决方案。”赵朝卿提到,价格仅2000+的消费级显卡Arc A770,是同价位显存容量最大的显卡产品。这也让Arc显卡搭建的AI工作站具备成本和性价比优势。
其中双卡方案支持9-20b参数量的AI模型,四卡方案则支持32b模型流畅运行——“我们尝试了通义千问Qwen-32b,完全没问题”。对国内外主流LLM、多模态大模型的支持,自然令其广泛适用于不同的场景。
加上Intel的开发工具让“用户从主流方案迁移过来做到硬件的透明无感“,也就实现了赵朝卿所说的四个特点。这才真正有了Intel的xPU实现全套AI解决方案的完整性。
王吉平认为,工作站市场预期在国内的增长,与中国现阶段强调加速发展新质生产力、寻求产业升级有很大的关系;孙峪则说,各行业高速发展、寻求创新,包括生成式AI、数字孪生、8K视频创作等热点的涌现,“有个共同的特点,就是对算力有着越来越高的要求”,故而对工作站有了需求。
至强W及其生态——包括面向不同应用场景打造的不同工作站及解决方案,就是Intel针对这一需求给出的答案。预计OEM/ODM的工作站产品将从下个月开始发售,AI在行业市场的发展大概也有机会更上一个台阶。