2024年台北电脑展(Computex 2024)将于6月4日至7日举办,今年的展会主题为“AI串联、共创未来”。而在该展会开幕前夕,英伟达首席执行官黄仁勋的一场题为“AI时代如何带动全球新产业革命的发展”的演讲不仅为展会进行了预热,其演讲内容也引起了各方关注和讨论。
每台PC都是AI
AI PC一直是近期的热点,诸多PC厂商也在致力于将AI功能集成到传统的PC中。黄仁勋在其演讲中表示,电脑行业发展至今已经有60年左右,PC革命让人人都可以进行运算,每个人都有PC可用。
黄仁勋强调,AI促成新的工业革命,他提出了‘数字人’(Digital Humans)的概念,可应用在客服、广告已经电玩等产业。他表示:“数字人类是我们的愿景,”未来所有的PC都将成为AI,帮助人们执行多种任务。
黄仁勋提到,Microsoft和英伟达正在一起帮助开发者将新的生成式AI功能加入到他们的Windows原生和Web应用程序中,使开发者能够通过API轻松访问由RTX加速的SLM,作为Windows Copilot Runtime的一部分实现在设备上运行的RAG功能。
搭载RTX技术的NVIDIA RTX AI PC将通过200多款RTX AI笔记本电脑和500多款采用AI技术的应用和游戏彻底改变消费者的体验。
另外,RTX套件和为NVIDIA ACE数字人平台最新推出的基于PC的NIM(NVIDIA Inference Microservice,它是一个预训练模型,也是一个AI)推理微服务,将进一步提高AI的可访问性。
加速计算实现可持续增长
众所周知,数据中心以及生成式AI等都需要消耗大量的资源,尤其是对于电力的消耗。根据国际能源署的预测,到啊2026年,数据中心、人工智能和加密货币消耗的电力可能会达到2022年的两倍,这些技术加起来约占2022年全球电力需求的2%。
黄仁勋认为,目前有两件基本的事情正在发生。首先是处理器,即计算机行业运行的引擎,中央处理单元的性能提升显著放缓。然而,我们需要进行的计算量却在迅速增长,且呈指数级增长,在这种情况下,将会发生‘计算通货膨胀’。事实上,现在就看到了这一点。全球数据中心使用的电力量正在大幅增长,计算成本也在增长。
当然,这种情况不能继续下去。数据量将继续以指数级增长,而CPU性能提升将永远不会恢复。因此英伟达开发了加速运算,降低将数据转化为智能的成本。
他表示,GPU就是这样一个利器,它有助于把这些过去的损失弥补回来。GPU可帮助节省更多的成本,“买的越多,省的越多。”
他举例称,花10亿美元打造数据中心,用一半也就是5亿美元采购GPU,打造AI工厂,就能将能效增加60倍,而电力消耗只增长3倍,速度则加快了100倍,从而节省更多的成本,也就能将过去的损失弥补回来了。
他强调:“加速计算能够实现可持续增长。”
英伟达下一代数据中心GPU架构
同时,黄仁勋也在其演讲中确认了下一代数据中心GPU架构,名为“Rubin”,它采用了新的HBM4。其中,Rubin产品配备8个HBM4堆栈,而Rubin Ultra产品配备12个HBM4堆栈。
下一代CPU则名为“Vera”,未来将会与“Rubin”配对,会带来Vera Rubin来代替现有的Grace Hopper和Grace Blackwell产品。此外,英伟达下一代数据中心平台还将支持速度高达3600GB/s的全新NVLink 6 Switch,以及速度达到1600Gb/s的CX9 SuperNIC。
但英伟达没有提供“Rubin”GPU和“Vera”CPU的具体架构信息,具体发布时间和上市时间也暂时也不清楚。
另外,黄仁勋也分享了英伟达的新半导体技术路线图,据悉,该路线图今后将每年更新。
“我们公司的更新节奏是以年为单位。我们的基本理念非常简单:打造数据中心规模,以每年的节奏分步骤实现,并向客户交付产品,在各个领域实现技术突破。”黄仁勋解释到。
写在最后
可以看出,AI时代的英伟达可谓意气风发,但在花团锦簇之下,也有很多隐忧在产生。对于英伟达在GPU市场的一家独大,肯定不是其它厂商愿意看到的,近期就有包括谷歌、微软、Meta、AMD、博通、思科系统、慧与科技和英特尔的八大科技巨头宣布结盟,成立“Ultra Accelerator Link”(UALink)联盟,以对抗英伟达。
另外,对于美国对中国市场的禁售令也会是英伟达的一个增长隐患,这可以从起不断开发符合规定的特定芯片就可以看出。黄仁勋也在之前接受访问时指出,即便有新规的压制,英伟达仍未放弃中国市场,中国市场占英伟达销售额的20%左右,所以会继续“完美”遵守贸易法规,并在中国市场上推出一套完全符合美国新规的产品。
但上述两方面目前看来都还不会对英伟达产生什么影响,英伟达目前仍是处于人工智能浪潮顶端的那个领导者。
END