Power10得益于三星制造的7纳米芯片,IBM称该服务器的单核性能提高了30%,在插座和系统级别的总容量提高了50%,总体而言,与980的前身相比,能耗降低了33%。得益于专用硬件,新芯片的AI推断速度比E980快5倍,在涉及AES加密的工作负载上比E980快2.5倍。集成了多达180亿个晶体管,核心面积602平方毫米。原生集成16个核心,但出于良品率考虑,只开启15个,每个都支持8线程,总计达到120线程,频率超过4GHz。
Power Satya Sharma的IBMCTO说:“为了在商业应用程序中实现AI,用户不需要使用单独的GPU加速系统。”
每个核心有自己的2MB二级缓存,总容量30MB(还有2MB随屏蔽核心关闭)。
三级缓存总容量原生128MB,但分成两个64MB,每个核心8MB,而且只开启120MB。
支持最多16路并行,也就是最多240核心1920线程,可以在水平、垂直两个方向实现不同芯片的全互联。
它还可以双芯封装,那就是30核心240线程,频率依然可以超过3.5GHz,此时支持最多4路并行,也就是最多120核心960线程。
CPU部分是全新的企业级微架构,号称对比Power9核心性能平均提升超过30%,单线程性能平均提升超过30%,核心能效提升2.6倍(单路最高3倍),整数、浮点、企业负载性能都可提升2倍左右。
同时,它还全面强化支持AI,集成四个矩阵SIMD加速单元、2个通用SIMD单元,加入新的AI指令集,另有2个载入、2个存储、4个MMU单元,强化分支预测。
Linpack、FP32、BFloat16、INT8数据格式的AI推理性能,相比Power9分别加速10倍、10倍、15倍、20倍。
连接首发支持PCIe 5.0,单芯最多32条通道,双芯封装就是64条。
四个角落集成四个PowerAXON单元,带宽1TB/s。左右两侧边缘集成两个OMI(开放内存接口)内存单元,支持DDR4/DDR5,带宽也是1TB/s,单位面积带宽是传统DDR4的6倍。它们可用于低功耗、低延迟、高带宽信号传输。
IBM Power10处理器的首发平台是IBM Power E1080,一套八路服务器系统。
具体配置没有公开,只列了一些性能提升:对比x86架构每核心吞吐提升4.1倍,对比Power9每核心加密性能提升2.5-4倍,对比上代Power E980高精度矩阵AI推理性能提升5倍,等等。
责编:editorAlice