·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发
前言:
数据中心正在成为人工智能工厂,将处理和提炼大量数据以产生智能。随着新芯片推动AI计算向前发展,英伟达的市场机会将可达约一万亿美元,覆盖游戏、芯片、系统以及企业业务等领域。
英伟达首席执行官黄仁勋刚刚结束了他2022年的第一个GTC主题演讲,宣布了英伟达的下一代Hopper架构。
这是英伟达第二次拆分其消费者和数据中心产品,这有点权宜之计,英伟达在其数据中心产品上转向小型制造工艺,为下一代消费产品做准备。
第一次拆分将其两个产品系列统一在Ampere架构下。
在时隔两年之后,英伟达终于推出全新一代的Hopper架构核心,首先自然是应用于HPC高性能计算、加速计算卡等专业领域。
从官方公布的性能来看,Hopper架构的性能较Ampere有大幅提升,也让GeForce显卡更值得期待。
GTC大会上发布的产品主要面向HPC高性能计算、AI人工智能,对应核心编号为[GH100];
英伟达同时还发布了基于新核心的[H100]加速计算卡、AI计算系统[DGXH100]。
面向消费市场的RTX40系列显卡,将在第三季度进行发布。
性能大幅提升的核心原因在于引入FP8后的张量核心和针对NLP任务的Transformer引擎,特别是TMA技术减少了SM单元在数据复制时的无用功。
H100的FP8算力是4PetaFLOPS,FP16则为2PetaFLOPS,TF32算力为1PetaFLOPS,FP64和FP32算力为60TeraFLOPS。
虽然比苹果M1Ultra的1140亿晶体管数量要小一些,但H100的功率可以高达700W,上代A100还是400W。
在AI任务上,H100的FP8精度算力是A100上FP16的六倍,这是历代最大的性能提升。
针对服务器实际应用,H100也可以虚拟化为7个用户共同使用,每个用户获得的算力相当于两块全功率的T4 GPU。
而且对于商业用户来说更好的是,H100实现了业界首个基于GPU的机密计算。
Hopper还引入了DPX指令集,旨在加速动态编程算法。动态编程可将复杂问题分解为子问题递归解决,HopperDPX指令集把这种任务的处理时间缩短了40倍。
借助NVLink网络连接技术,可达到近5TB每秒的外部数据传输速度,进一步加速数据处理。
在半精度、单精度、双精度浮点等人工智能常用计算模型上,性能可达前代产品A100的3倍。
英伟达CEO黄仁勋认为数据中心的变革方向:企业以工业化规模提高数据中心AI算力,持续提炼数据,进行训练和完善AI模型,实现AI能力大规模输出。
英伟达也对其自研CPU产品进展进行重点介绍,黄仁勋称其为Grace超级芯片,是英伟达首款高性能计算用途CPU。
Grace CPU采用Armv9架构,内含144个Arm核心,提供最高的单线程核心效能,支持Arm新一代的向量扩充指令集。
在服务器上,Grace CPU还可搭配英伟达DPU、GPU、智能网卡等产品,构成整体解决方案。
至此,基于CPU、GPU两大新品,英伟达在数据中心的计算架构得以完整呈现。
目前,在服务器CPU领域,市场仍为英特尔、AMD的x86新品所支配。
①ArmIP架构仍可使用:虽然暂停了收购Arm的交易,英伟达仍然获得了20年的Arm IP架构许可,这也使该公司能够在各种技术和市场中拥有完整的选择范围和灵活性。
该公司表示将继续寻求使用Arm计开发其首个服务器中央处理单元,这将挑战英特尔使用的标准x86服务器技术。
②英伟达对台积电的依赖严重:2月24日,英伟达曝光的今年九月份发布的RTX40显卡是台积电代工生产的,用的是台积电5纳米工艺。
3月22日,英伟达曝光了新一代H100 Hopper显卡,也是台积电代工生产的,用的还是台积电的5纳米工艺。
③与英特尔合作压制台积电:目前英伟达考虑想要和英特尔合作代工芯片,是为了尽可能让英伟达的芯片供应产业链多元化。
黄仁勋想让英特尔芯片产业链实现多元化是假,想要分散晶圆代工风险,想要通过和英特尔的合作压制台积电先进制程芯片代工的涨价才是真的。
在英特尔和台积电在先进芯片制程代工方面都有合作的情况下,在英特尔有时候都需要台积电帮忙代工生产的情况下,英伟达还想要通过和英特尔的合作迫使台积电的降价,可能性不大。
当然,英伟达和英特尔合作,促进自己产品供应链的多元化,至少可以帮助英伟达减少对台积电的依赖。
从产品布局方面,依托GPU加速卡、DGX系统、NVLink技术、Switch系统、CPU产品等,实现了产品模块的布局,在很大程度上降低了定制化开发的研发成本及应用场景有限的弊端。
从数据中心方面,其完成了[底层芯片、加速堆栈、行业垂直方案、具体应用的全栈式产品线]的布局。
从中长期来看,千行百业数字化转型是未来发展趋势,推动AI训练、AI推理、HPC等并行计算相关的需求快速爆发;
从竞争格局来看,英伟达凭借丰富的产品矩阵以及强大的AI能力,应用场景不断丰富,系统级竞争优势突出。
部分资料参考:金融界:《英伟达2022GTC:全新架构GPU,硬件、软件能力进一步升级》,机器之心Pro:《英伟达新架构发布,AI芯片上限提升九倍,20块带宽等于全球互联网》,界面新闻:《时隔两年英伟达再推新架构GPU,拓展数据中心战场》
推荐阅读:
商务合作请加微信勾搭:
18948782064
请务必注明:
「姓名 + 公司 + 合作需求」