英伟达的B300系列处理器采用了经过大幅调整的设计,仍将采用台积电的4NP制造工艺(一种为英伟达调优的4纳米级节点)。但报道称,它们的计算性能将比B200系列处理器高出50%。这一性能提升是以高达1400W的TDP为代价的,仅比GB200高出200W。SemiAnalysis声称,B300将在B200推出后大约半年上市。
英伟达B300系列处理器的第二项重大改进是使用了12层高的HBM3E内存堆叠,将提供288GB的内存和8TB/s的带宽。增强的内存容量和更高的计算吞吐量将实现更快的训练和推理,由于B300能够处理更大的批次大小并支持更长的序列长度,同时解决用户交互中的延迟问题,因此推理成本将降低至多三倍。
除了更高的计算性能和更大的内存外,英伟达的第二代Blackwell机器还可能采用该公司的800G ConnectX-8网络接口控制器(NIC)。这款NIC的带宽是当前400G ConnectX-7的两倍,并且拥有48条PCIe通道,而前一代只有32条。这将为新服务器提供显著的横向扩展带宽改进,对大型集群来说是一个利好。
B300和GB300的另一项重大增强是,据报道,英伟达将相比B200和GB200重新打造整个供应链。该公司将不再尝试销售整个参考主板或整个服务器机架。相反,英伟达将只在SXM Puck模块、Grace CPU和Axiado的主机管理控制器(HMC)上销售B300。因此,更多公司将有机会参与Blackwell供应链,预计这将使基于Blackwell的机器更易获得。
通过B300和GB300,英伟达将为其在超大规模数据中心和原始设备制造商(OEM)中的合作伙伴提供更多设计Blackwell机器的自由度,这将影响它们的定价,甚至可能影响性能。
================================
一种大幅提升AI SoC芯片设计的方法
SoC 设计优化相关资料推荐