3月21日晚,NVIDIA春季GTC技术大会召开。值得关注的是,NVIDIA宣布推出cuLitho软件加速库,可以将计算光刻的用时提速40倍。
所谓计算光刻就是为芯片生产制作光掩模的技术,掩膜是一种平面透明或半透明的光学元件,上面有芯片加工所需的图案,按照是否需要曝光将图案转移到光刻胶层上。光刻加工过程开始后,通过控制光刻机的曝光和开关操作,可以将光束根据掩膜上的图案进行分割和定位,使得光束只照射到需要曝光的区域,从而将芯片上的图案转移到光刻胶层上,实施芯片光刻。
因为每种芯片都要经历多次曝光,所以光刻中使用的掩膜数量不尽相同。NVIDIA H100(台积电4N工艺,800亿晶体管)需要89张掩膜,Intel的14nm CPU需要50多张掩膜。
此前“精雕细琢”的计算光刻依赖CPU服务器集群,现在NVIDIA表示,500套DGX H100(包含4000颗Hopper GPU)可完成与4万颗CPU运算服务器相同的工作量,但速度快40倍,功耗低9倍。
这意味着,GPU加速后,生产光掩模的计算光刻工作用时可以从几周减少到八小时。
黄仁勋透露,NVIDIA已经和ASML(荷兰阿斯麦)、台积电以及新思科技签署技术合作,新思甚至已经将该技术集成到其EDA工具中,将服务2nm甚至更高精度的制程。
按照NVIDIA预估,未来几年高NA EUV光刻机应用后,掩膜制作的计算数据量将提升10倍以上,目前cuLitho软件加速库已经支持高NA EUV光刻可能用到的曲线掩膜、亚原子光致抗蚀剂掩膜等制造。
另外,整整一年前的GTC 2022图形技术大会上,NVIDIA发布了首款数据中心CPU Grace、新一代高性能计算GPU Hopper,同时利用它们打造了两颗“超级芯片”(Super Chip),一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。
一年时间过去了,新一届GTC 2023大会上,黄仁勋亲手拿出了超级CPU+GPU,这也是我们第一次看到它的实物。
和渲染图的精美不同,实物显得有点朴实无华。
小小的PCB电路板上安排了两颗芯片与大量供电元件,异常紧凑,其中基板较大、芯片较小的是Grace CPU,基板较小、芯片较大的则是Hopper GPU,后者整合封装了六颗HBM内存。
同时,黄仁勋还放出了配备超级CPU+GPU的服务器节点效果图,但没有做进一步解释,也没有透露更多规格、性能,只是提了一句CPU、GPU之间的通信带宽是传统PCIe总线的多达10倍。
黄仁勋也没有说这种产品到底什么时候出货。
同时,黄仁勋也拿出了超级CPU二合一,基板加芯片占据了PCB的大部分面积。
封装好的计算模组也第一次亮相,长宽尺寸为8x5英寸(20.3×12.7厘米),两个一组可以放入1U风冷服务器机架。
黄仁勋称,Grace相比传统x86 CPU,性能可领先30%,能效可领先70%,数据中心吞吐能力可领先1倍。
Grace CPU目前已经出样,合作伙伴正在设计系统方案,但何时出货上市暂无时间表。
根据此前公布的资料,Hopper GPU采用定制版台积电4nm工艺、全新架构,集成多达800亿个晶体管、18432个CUDA核心、576个Tensor核心,支持6144-bit位宽的80GB HBM3/HBM2e高带宽内存,并支持PCIe 5.0、第四代NVLIink,性能号称四倍于上代A100,功耗最高700W。
Grace CPU采用双芯合体设计,共计144个Arm架构核心,集成396MB缓存,支持LPDDR5X ECC内存,同样支持PCIe 5.0,内部带宽3.2TB/s,芯片间带宽1TB/s,功耗500W。