AI浪潮之下,NVIDIA A100无疑是当下最为火爆的产品之一,其实还有更先进一代的H100,早在去年3月份就发布了,但不久前才全面投产,用上的还不多。
NVIDIA H100基于GH100 GPU核心,定制版台积电4nm工艺制造,800晶体管,集成18432个CUDA核心、576个张量核心、60MB二级缓存,支持6144-bit HBM高带宽内存,支持PCIe 5.0。
友媒极客湾最近搞到了四块PCIe版本的H100,目前价值高达30万元,我们就拉看看用它玩游戏会怎么样。
PCIe H100并不是满血的,只开放了14952个CUDA核心、456个张量核心、5120-bit位宽,搭配80GB HBM3,带宽高达2TB/s。
由于是面向数据中心,它自身没有风扇,而是需要依靠系统散热,为此不得不加装了一个特制的涡轮风扇来散热,足以对付350W TDP。
由于是专供AI、HPC计算用途,它也没有视频输出接口,为此不得不搭配第二块卡专门负责输出,让系统和驱动识别它也费了一番功夫。
顺带一提,H100只设计了24个ROP光栅单元(RTX 4090 160个),在处理图形渲染上很容易出现瓶颈。
经过测试,H100 3DMark Time Spy测试图形得分为2681,甚至还不如Radeon 680M这样的核显。
实际游戏里也经常出现个位数的帧率,即便一直100%满载也是如此,但功耗倒是不高,从未超过100W,温度也很低。
当然,这一切都在预料之中,毕竟,术业有专攻。
前几天的数据中心产品发布会上,AMD推出Instinct MI300A及Instinct MI300X两款加速显卡,其中前者是CPU+GPU首次合体的产品,后者则是纯GPU,主要用于AI、HPC高性能计算等领域。
MI300X拥有最多8个XCD核心,304组CU单元,8组HBM3核心,显存容量提升到了192GB,相当于NVIDIA H100 80GB的足足2.4倍,同时HBM内存带宽高达5.2TB/s,Infinity Fabric总线带宽也有896GB/s,同样远超NVIDIA H100。
MI300X的192GB显存不论性能还是容量都是史无前例的,尤其适合AI运算,单卡即可支持400亿参数大模型。
作为AMD当前最强显卡,MI300X当然也是最贵的,只不过显卡具体售价还没公布,消息人士称它对标的产品是英伟达的H100,后者的报价在3.6万美元或者25万元人民币左右。
考虑到市场竞争的因素,AMD的MI300X定价会比H100略低一些,这意味着它也会轻松超过20万元,但是192GB HBM3显存成本高不少,算下来AMD的利润率还是要比H100低的,性价比依然是AMD的优势。
目前高性能显卡主要是AMD及英伟达两家(新加入的英特尔影响还不够),N卡不仅是游戏及光追强,还有个优势是A卡没法比的,那就是GPU计算,特别是这两年火爆的AI应用。
现在AI画图应用几乎一水的支持N卡,这些GPU加速任务也被网友戏称为炼丹,也会影响很多人选显卡的选择,N卡的CUDA因为支持的最好,导致N卡几乎成为首选。
AMD的显卡不是没有GPU加速能力,但是配套的ROCm生态问题很多,之前只支持Linux平台,而且只支持部分专业卡,游戏玩家用的Radeon显卡都没法跑。
这个问题也让不少往网友抱怨,AMD CEO苏姿丰倒是听到了,日前在她在推上确认他们正在致力于跟社区合作,让更多的Radeon显卡支持ROCm,很快会有好消息。
苏姿丰说的这事其实就是4月份宣布过的ROCm重大改进,支持Windows系统,支持Radeon游戏显卡,不过当时支持的型号有限,现在过去两三个月了,AMD应该很快会发布RCOm能支持绝大多数游戏卡的。
如果能让Radeon显卡完整支持ROCm生态,那意味着玩家买A卡的理由更多,因为ROCm还是兼容CUDA环境的,所以A卡炼丹能力也会大幅加强,跟N卡最强的优势直接正面刚了。