ChatGPT 引爆 AI 时代
2022年11月,ChatGPT的推出再次把AI推向时代的高点,彻底引爆了人工智能的应用,AI行业再度迎来新的节点,生成式人工智能(AIGC)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。ChatGPT的用户数量也在短短2个月内快速增长至一个亿。
来源:英伟达

来到2023年,在GPT-4的催化下,由AIGC引发的热度继续席卷全球,而在这场浪潮中,英伟达成为了AI时代的芯片宠儿。
NVIDIA GTC 2023
2023年3月,英伟达举办了第14次GTC大会。会上,英伟达发布了ChatGPT设计的推理GPU、AI超级计算服务DGX Cloud、突破性的光刻计算库cuLitho、加速企业创建大模型和生成式AI的云服务NVIDIA AI Foundations等,以及与Quantum Machines合作推出了全球首个GPU加速量子计算系统。
英伟达在此次大会上“软硬兼施”,向AI时代吹响了冲锋号角。
为了支持像ChatGPT这样的大语言模型推理,英伟达直接发布专用GPU芯片H100 NVL 。它是基于去年已经发布的H100的改进版本,配备双GPU NVLink,将两张拥有94GB HBM3显存的PCIe H100 GPU拼接在一起。基于NVIDIAHopper 架构的H100配有一个Transformer引擎。
黄仁勋称,相较于目前唯一可以实时处理ChatGPT的HGX A100,一台搭载四对H100和双NVLINK的标准服务器能将速度提升10倍,并且还可以将大语言模型的处理成本降低一个数量级。黄仁勋也将NVIDIA DGX H100称作全球客户构建AI基础设施的蓝图。
据英伟达公布信息,H100 AI 超级计算机现已开始上线。Oracle Cloud Infrastructure 宣布配备H100 GPU 的新OCCompute 裸机 GPU 实例在一定条件可用。亚马逊云科技发布了即将推出的P5实例EC2 UltraClusters,其规模可扩展到2万个互连的H100 GPU;微软Azure发布了其H100虚拟机ND H100 v5的私人预览版;Meta 现已为其内部的AI生产和研究团队部署了由 H100 驱动的 Grand Teton Al 超级计算机;OpenAl 也将在其Azure超级计算机上使用H100来支持其持续进行的AI研究。
Grace Hopper超级芯片
此外,英伟达还发布了用于AI视频生成的通用GPUL4,以及针对图像生成的L40和为推荐系统和大型语言模型的AI数据库所设计Grace Hopper超级芯片。
黄仁勋指出这是处理超大型数据集的理想选择,比如可以用于推荐系统的AI数据库和大型语言模型。据介绍,通过900GB/s高速芯片对芯片的接口,英伟达Grace Hopper超级芯片可以连接Grace CPU和Hopper GPU。
AI Foundations云服务
为了加速生成式AI的工作,在软件方面英伟达还发布了AI Foundations云服务系列,为需要构建、完善、运行自定义大型语言模型和生成式AI的客户提供服务。
同时,英伟达自己也打造了大模型突破背后的引擎,即为最新版DGX超级计算机。
2016年8月,英伟达将制造出来的第一台超算DGX-1捐给了OpenAI,并亲自题字“致Elon和OpenAI 团队,为了计算和人类的未来”。
英伟达最新版本的DGX搭载8个NVIDIA H100 GPU,它们连接成为一个巨大的GPU。黄仁勋透露,该款DGX现已全面投入生产。
英伟达 拥有关键的 AI 和 GPU 软件和硬件能力,在过去两年中受到 metaverse 的增长和最近出现的 ChatGPT 的推动,一直备受关注。
英伟达的AI时代
“我们正处于AI的‘iPhone时刻’。” GTC演讲过程中,黄仁勋三次提出这一观点。
英伟达长期涉足AI领域。近年来取得了优秀的技术和应用成果,进一步拉大了与AMD的差距。英伟达也在增加其在汽车和数据中心市场的市场份额和收入。
在过去的 20 年里,英伟达遭遇了数次挫折,包括退出 PC 芯片和移动设备市场,不过在首席执行官黄仁勋的领导下,一一义克服了这些挑战。
英伟达很早就确立了自己在游戏市场的领先地位,其在数据中心的 GPU 性能持续增长。英伟达在 2017 年至 2021 年的加密货币挖矿热潮期间也经历了快速增长。
至今,在ChatGPT掀起的浪潮中,英伟达成为了当之无愧的AI时代芯片之王。
关于英伟达的数次起伏以及在AI行业中的崛起,可以关注我们或作者,看后续报道。
