我们现在说英伟达GPU或显卡支持HPC(高性能计算)与AI(人工智能)是相当稀松平常的事了。但实际上从GPU(图形处理单元)的称谓来看,GPU在设计之初都没有考虑过对于通用计算乃至AI计算加速的问题,就更不用说在“GPU”一词出现以前的图形加速卡了。
有关到底是谁最早将GPU用于数据中心的问题已经不大可考。但有几个关键事件,令GPU在游戏、专业视觉之类的图形应用之外,广泛用在通用计算加速、数据中心领域。
其一是2007年英伟达正式发布CUDA,让GPU开始能够用于通用计算加速——这一年英伟达GeForce显卡所用的Tesla架构首次开始采用一种“统一着色架构(unified shader architecture)”——GPU通用计算加速实现的基础。
其二在于2012年英伟达特别针对数据中心市场发布了Kepler架构的Tesla K10显卡。这应该是真正意义上英伟达在数据中心市场着力的开端,即便在此之前的Fermi架构已经在这方面初露端倪。比较凑巧的是,这一年也是当代AI爆发标志性事件AlexNet借助英伟达GPU做加速的一年。
其三为2016年的Pascal架构上,英伟达为Tesla P100显卡引入了Tensor core,也就是相对专用的AI加速单元,在深度计算方面明显下了功夫。当代GPU的使命也在此之后发生了越来越大的变化。或者说我们进入了某种“后GPU时代”。
不过如果追本溯源去看GPU的“初心”,用于图形渲染的GPU又发展到哪儿了呢?它和通用计算乃至AI计算的GPU市场比起来如何?这是本期封面故事期望探讨的。
图1:图形加速卡的最初
图形渲染GPU vs 通用计算GPU
基于市场分析机构给的数据还是太抽象了。我们先来看看英伟达的财报,从中可以知晓很多GPU相关的市场故事。截至2024年1月28日英伟达的Q4 FY24季报显示,这家公司季度营收221.03亿美元,其中游戏(Gaming)业务占比13.0%,专业视觉(Professional Visualization)业务占比2.5%。
这两个与图形渲染最为强相关的业务加起来营收占比也不过15.5%。而数据中心(Data Center)业务目前在英伟达季度总营收中的占比已经高达83.3%。这是个何其恐怖的数据。
要知道早在2020年我们说此前5年是英伟达的黄金时光,当时游戏+专业视觉业务在整个公司的营收占比还高达65%,数据中心则刚走到了25%。短短3、4年间,GPU的价值大头似乎已经从图形渲染明确地偏移到了通用计算、HPC与AI。如果把时钟再往回拨,英伟达的PC业务方向营收占比曾高达近80%,其中超九成都来自游戏与专业视觉市场。
当然这个数据还是太过粗粒度了,毕竟英伟达的数据中心业务也有相当一部分是图形加速卡。只不过这样的趋势还是显得十分明晰。
那么是不是包括游戏在内的图形渲染GPU市场在萎缩呢?也还真不是这么回事。Q4 FY24季度,英伟达游戏业务营收28.65亿美元。这个数字和数据中心业务的184.04亿美元当然是完全不能比的。但28.65亿美元已经是英伟达历史上游戏业务获得的最好成绩。如果拉长时间线至4年,那么英伟达的游戏业务营收实际增幅是超过了1倍的。
比较遗憾的是,我们未能从统计机构的数据中找到图形渲染GPU与通用计算GPU的现有市场价值切分数字。但我们认为,英伟达的财报已经是对这一问题的生动阐释了。只不过如果将AI算作一种特殊的通用计算类型,那么图形渲染与通用计算的确很难做切分,毕竟广大的PC端侧GPU未来可是既要做图形渲染,又要做AI推理加速的;数据中心领域的某些视觉类应用亦如是。
有个八卦数据值得参考,2月份媒体普遍在报道Sam Altman(OpenAI首席执行官)提及发展满足算力需求的AI芯片需要7万亿美元。虽然这个数字大有媒体后期加工的成分,但前不久Intel的Direct Connect活动上,Altman在与Pat Gelsinger(Intel首席执行官)炉边对谈时说,他虽然并不清楚要达成AI技术发展目标究竟需要多少钱,但一定是“很多很多钱”,创造属于半导体的价值也远多于产业此前估计2030年的万亿美元量级。
基于统计机构普遍预测GPU作为AI芯片的某一个大类,虽然未来其市场占比将会下降,但也仍然是主流;很显然在接下来的这10年里,GPU作为涵盖AI加速的通用计算职责及市场价值,将显著高于其图形渲染的目标市场。
真的是这样吗?
图2:游戏显卡
为什么会有那么多新玩家
如果说“GPU”是指广义的专用图形相关电路,那么GPU从诞生至今可能有50年了。单说PC及工作站图形渲染GPU,自上世纪90年代至本世纪初,这个市场不说彻底成型,也基本达成了高度成熟,最终以英伟达、AMD的双寡头市场形成为标志。这一点我们在去年相关GPU的封面故事中提过。
在社会整体的数字化转型过程里,GPU和图形渲染加速的蛋糕又被做大了,而且出现了一些新的应用场景——不单是游戏和影视。不谈GPU通用计算、AI崛起造就新的市场机遇;数字化转型、万物互联对海量IoT设备提出了图形应用需求。
另外从英伟达的营收数字来看,游戏业务本身也在不断增值,即便没有数据中心那么快。可能很多读者并不知道,游戏产业的市场价值是电影产业的2倍以上,是音乐产业的将近10倍,且每年还在增长——虽然芯片并不是其中唯一的组成部分。
换句话说,这个市场是在持续做大的。而且游戏本身作为现阶段图形学应用的核心,其涉及的门类庞杂且多样,绝不单是游戏本身。要不然微软为什么要花那么多钱收购动视暴雪?
再加上地缘政治(包含信创市场的GPU需求)及全球市场不确定性提出的技术自主化、本地化需求,GPU市场过去两三年算得上十分热闹。如果算上GPU IP供应商,那么全球现有的GPU企业可能不少于20家,尤以中国市场最为集中。就算抛开景嘉微这类中国老牌显卡企业不谈,这些年在图形渲染GPU领域的新晋市场参与者也至少包括了摩尔线程、沐曦、瀚博、芯动科技等——其中有一些既做GPGPU,也做图形渲染GPU。
Imagination去年干脆直接推出了面向PC桌面端的GPU IP,主流图形API、光线追踪等新特性的支持还一应俱全。则Imagination的GPU IP覆盖了从IoT嵌入式应用,到汽车、到手机、到PC、到工作站、到数据中心等不同场景。在我们看来,这是市场需求显著提升,以及技术自主化、地域化需求的共同作用。
即便大家普遍在质疑Imagination杀入桌面端GPU的红海究竟为了什么,Imagination首席产品官James Chapman在接受我们采访时就提到,推出面向桌面PC的GPU IP是因为“客户看到了市场需求”,同时“他们的客户也期望找到替代方案”,不仅是中国客户,“我们也看到全球市场的客户在寻求英伟达、AMD以外的产品”。
所以总的来说,图形渲染GPU市场之所以会有这么多新玩家入局,其一是原有市场的扩大,其二是技术自主与本地化趋势——以及供应链的弹性化需求,促成市场的发展——即便这一市场和AI还是不能比。
但我们认为,还有一点更重要:元宇宙。元宇宙作为一个数字化的虚拟世界,其外在构建是严重依赖于渲染的。
可能在很多人看来,元宇宙这个概念早就退热了。Meta这样的企业几乎All In元宇宙这两年烧钱烧得十分惨烈。这样的东西还真能带来什么收益和产业影响力吗?
此前瀚博半导体在WAIC上宣布准备推出支持图形渲染的GPU时,我们问过瀚博半导体CEO钱军为什么要进驻这一市场。瀚博半导体此前是AI芯片领域的一员,尤其着力在图像、视频处理与计算上。“像素世界如果只能看,而不能产生,那不是完整的拼图。”钱军说。图形渲染显然就是“产生”“像素”的。
这家公司一直以来的口号是“致力于为像素世界提供浩瀚算力”。大概前期切入于像素的处理与理解,后续则追求像素的产生了。这可能某种程度体现了AI与图形渲染的和谐统一,以及瀚博半导体有意于元宇宙方向的潜在规划——虽然这家公司从未明确说过。
老掉牙的“元宇宙”?
PC游戏领域有个很流行的技术:游戏画面的AI超分与补帧。英伟达、Intel之类的企业都有对应的技术方案。这类技术追求的是,GPU渲染一部分像素,AI基于这些像素再生成一部分像素。其价值在于显著减少游戏过程中GPU图形渲染压力,将更多的工作交给AI完成。
黄仁勋(英伟达创始人兼CEO)甚至说,现在(支持DLSS)的游戏有75%的像素和一半的帧是由AI生成的。这类有趣的技术既体现了AI的价值,及其对图形渲染技术的侵门踏户,而且也展示了图形渲染与AI的和谐共生,在渲染与生成像素上的协力。元宇宙对于算力的贪婪需求,是图形渲染技术的暴力发展所无法达成,以及必然要求AI参与的。
但这些还不足以表明元宇宙真的有多大市场,以及它能为图形渲染带来多大价值。另一件挺有趣的事情是去年的SIGGRAPH顶会上,根据我们自己的统计,黄仁勋1小时20分的演讲,平均一分钟就要提一次生成式AI。SIGGRAPH可是个图形技术顶会,拼命聊AI是怎么回事?
黄仁勋在这次的SIGGRAPH上有个令人印象深刻的演示,给生成式AI输入一张工厂的二维CAD平面图PDF文档,提出一句话的简单需求,最终由AI转成了3D虚拟工厂(图3)。这一基于AI得到的工厂数字孪生基本是物理级精准的。这个过程明确结合了生成式AI与图形技术。
图3:基于生成式AI将一份PDF文档转为3D虚拟工厂
当然这套流程远没有我们形容得那么简单。它涉及到好几个具体的模型,以及光线追踪、USD格式图形标准等——USD最早是由皮克斯提出广泛应用于3D动画、CG等领域的标准格式。而且起码现阶段,我们还不大相信工厂数字孪生可以无人为干预的方式这么简单地做出来。但这个方向及可行性是得到了最基本的验证的。
工厂数字孪生本质上就是一种狭义的元宇宙,或者说得更明确一些,具备逻辑且越来越达成物理级精准的游戏世界,就是元宇宙的雏形。基于未来经济的虚拟化发展需求,以及AI辅助下,无论工业元宇宙还是生活元宇宙的构建,GPU图形渲染都是基本与核心能力。
要知道,工厂数字孪生是未来生产力发展的必要组成部分。至此多少应该能够理解“产生像素”作为“完整拼图”的重要性了吧。而AI作为一种数字世界的技术,令其更多地在现实世界发挥作用,很多时候还是需要借助虚拟世界的。AI与图形也就成为未来人类数字生活两大基础技术。
其实此刻再回头看本文第一部分列举英伟达的数据中心业务营收占比远超游戏+专业视觉,此间忽略了一个重要事实:英伟达的数据中心业务里,有相当一部分芯片、系统、软件与解决方案是面向Omniverse(全宇宙)的——也就是英伟达版本的元宇宙。
虽然我们并不清楚其中占比多少,且明确它现阶段必然低于纯粹的AI数据中心业务构成,但在我们看来,以Omniverse为代表的虚拟世界,将会是AI、生成式AI发展的高级应用阶段,并在未来表现出难以估量的潜在价值。
新晋市场参与者的困境
无论是图形还是AI生态,都需要长时间的积累。似乎这两部分,英伟达都有着毫无疑问的先发优势。这一切的缘起都是游戏,而且未来的很多技术大概率还会受惠于游戏。所以即便游戏业务不再是英伟达赚钱的主力,相信这家公司也会坚持将这部分持续做下去——因为它涉及的图形技术旁支实在是太丰富了。
这也事实上形成了对新晋市场参与者的门槛。我们知道摩尔线程早就开售了自家的消费级桌面显卡,标称的算力水平已经接近于英伟达GeForce RTX 3060,更是将中国老一批GPU市场先驱远远甩在身后。但真的跑起游戏来,效率还是差了一大截的。
Imagination即便也积极地参与到桌面GPU市场的竞争中来,图形API的支持也就刚到了DirectX 11_0。目前也没有可真正验证其高性能特性的GPU芯片问世。
就连Intel这样有长期集显设计经验、这两年决心角逐桌面显卡市场的国际巨擘,也在第一轮独显产品竞争中相距英伟达甚远:即便拥有看起来相当不错的理论性能,具体到实际的游戏与视觉类应用里也就一言难尽了。从显卡产品问世至今,驱动更新了30+个大版本,才让游戏效率逐渐合格。
可见在图形卡市场,英伟达、AMD的优势地位还将长期存在。当然桌面PC未必是未来图形技术竞争的主战场,这里也只是举了个例子。但在以后合作设计、数字孪生、元宇宙需求AI+图形技术的场景中,英伟达显然还将基于生态上的积累保持长时间的优势地位。
这将是一众新晋市场参与者都需要面对的问题和困境。
图4:英伟达的图形卡
最后值得一提的是:图形技术的价值直观体现在游戏和影视作品中,但实际上我们见到过上层建筑基于民用领域的图形技术——尤其是物理级精准的游戏,来做相关国家安全高度特定场景的仿真与模拟。那么技术自主化大潮趋势之下,寻找英伟达、AMD的替代方案可能是必由之路。
本文为《电子工程专辑》2024年4月刊杂志文章,版权所有,禁止转载。免费杂志订阅申请点击这里。