近日,NVIDIA 创始人兼首席执行官黄仁勋做客知名播客栏目—— “Acquired Podcast” ,在节目中与主持人 Ben Gilbert 和 David Rosenthal 一起回顾了 NVIDIA 从图形处理器到数据中心再到人工智能的发展历程,介绍了 NVIDIA 平台战略背后的故事,也总结了 NVIDIA 的成功之道。
本期节目将分三期讲述,敬请期待后续精彩内容!
NVIDIA 的关键时刻 —— RIVA 128
黄仁勋首先回顾了公司早期发展面临的挑战。其中,谈到了一次关键转折 —— RIVA 128,这个项目重塑了公司的发展道路。
作为第一家消费级 3D 图形公司,NVIDIA 在构建 RIVA 128 时面临了许多挑战。并且由于涌现了大量的竞争对手,市场格局发生了巨大变化。然而,正是这段逆境时期,促使 NVIDIA 做出了一系列关键战略决定,而这些决定对 NVIDIA 的未来发展至关重要。
当时,NVIDIA 将精力重新集中于构建全球第一款加速的 3D 渲染硬件,即 RIVA 128,不遗余力地最大化其功能。包括实施纹理缓存,推动总线和帧缓冲的极限,并使用最快的存储器创建一个异常庞大的芯片,确保产品在市场上有足够的竞争力。
技术为王,PC 发展初期的制胜之道
此外,黄仁勋还谈到了 NVIDIA 选择使用模拟技术的决策。当时,在 ICOS 公司即将倒闭之时,NVIDIA 买下了其全部库存。对于当时的 NVIDIA 而言,相较于一般发布芯片的流程,公司只有仅仅六个月的时间,因此没有试错的机会。他们必须要发布一款完美的芯片。当被问到如何能确定是一款完美的芯片时,黄仁勋说:“我知道这一定会是一款完美的芯片,因为如果不是的话,我们就要关门大吉了。我们只有一次机会。”
由于采购了 ICOS 公司的模拟器,NVIDIA 可以在虚拟环境中测试芯片。软件团队编写了整个软件堆栈,将其运行在这个模拟器上,并等待 Windows 系统的反应。他回忆说,当决定发布芯片的那一天,芯片被认为是完美的。NVIDIA 提前测试了所有可能的情况,并向每个人宣布:NVIDIA 要发布芯片!这肯定是完美的芯片!“当你知道自己要发布芯片,并且是一款完美的芯片,那么下一步显然就是量产了。”
CUDA 也是如此。NVIDIA 一直在思考如何在 GPU 上创建一个高级别的抽象层,以更高级别的编程语言和表达方式进行操作。这个抽象层的概念是为了将 GPU 用于更广泛的应用,如 CT 重建和图像处理。当时,NVIDIA 的这一想法获得了一些积极的反馈,他们认为通用计算是可行的。这是一个高度并行的、大规模线程的处理器,也是世界上唯一能做到这一点的处理器。通过观察可编程着色器的管线结构,团队认为 GPU 拥有大规模并行处理的能力,这使得 CUDA 平台的成功变为可能。
对于世界上许多问题而言,NVIDIA 更关注其可预测性,这种方法适用范围极为广泛,包括预测购物趋势、音乐选择,甚至天气预测。黄仁勋指出,这种方法可能影响很多产业,因为几乎每一款软件都可以通过这种方式进行编程,因此构建计算机和芯片的方式将彻底改变。明白这些道理后,剩下的就是是否有勇气投入资源加速创新。
OpenAI 和大语言模型的故事
黄仁勋表示,虽然他没有参与创建 OpenAI,但和该公司许多重要人员都保持密切联系。黄仁勋强调,最初研发的 DGX 即现在的 Hopper,重 70 磅,有 35,000 个零件,10,000 安培。由于了解 OpenAI 对大型计算机的需求,所以黄仁勋亲自将第一版 DGX 交付给 OpenAI,这一刻成为了他的美好回忆。
黄仁勋认为与研究人员的讨论和交流是 NVIDIA 所需要的积极反馈方式,因为 NVIDIA 初期的成功就主要集中在协助研究人员提高工作水平。尽管深度学习在当时的情况下并不十分实用,但他始终坚信,只需一些改进,这项技术将会变得非常卓越。这种信念源于他与该领域杰出研究人员的互动,以及他所见证的渐进性的进步。黄仁勋还特别提到研究论文的发表速度从最初每三个月一篇增加到了如今的每天都有新作。这也表明,深度学习领域的进步正在以指数级增长。
在谈及大型语言模型时,黄仁勋指出最初的印象是它能够在屏蔽一些词汇的情况下巧妙地预测下一个词,他认为这展现了自我监督学习的最佳实践。黄仁勋强调大家都有文本,并且都知道答案是什么,只需要进行猜测,因此他最初对 BERT 的印象是它非常聪明。然而,黄仁勋同时指出现在的挑战在于如何将这项技术扩展到更广泛的范围。他认为对于几乎所有事物的首次观察都是令人着迷的,随后则需要努力理解其原理。所以接下来的步骤是基于第一原则出发,思索如何将这项技术应用到更广泛的领域。他预测 BERT 在未来会变得更为庞大。
数据中心之旅
黄仁勋在节目中提到,NVIDIA 的数据中心之旅从 2017 年前开始。他总是被问,公司可能会面临什么挑战?
黄仁勋认为,如果一项技术需要部署到计算机,那这台计算机必须放在你身边。因为它必须连接显示器,这将在未来限制发展机会。当时,可插入 GPU 的台式电脑非常有限,同时可以驱动的 CRT 显示器和液晶显示器也很有限。所以如果计算机不需要连接显示设备,就可以在其他地方进行计算。
GeForce NOW 是 NVIDIA 的第一个数据中心产品。NVIDIA 的第二个数据中心产品是用于远程图形计算,它将 NVIDIA 的 GPU 置于全球企业数据中心。接着 NVIDIA 推出了第三款产品,它将 CUDA 和 GPU 结合起来,成为一台超级计算机。
随后 NVIDIA 朝着更多方向努力。这一切之所以如此重要,是因为 NVIDIA 分离了计算和产品使用的地点。黄仁勋认为如果能将二者分离,市场机会将会迅速扩大。这种分离意味着不再受制于台式电脑所带来的物理限制,也不再受限于每人一块 GPU 的局限。换句话说,无论计算发生在哪里都不再重要。