在全球最大的超级计算机之一 Perlmutter 上运行的应用表明,NVIDIA GPU 在能效方面处于领先地位。
人们一致认为:加速计算就是高能效计算。
作为美国能源部面向开放科学的主要设施,美国国家能源研究科学计算中心(NERSC)测量了其四个关键高性能计算和 AI 应用上的结果。
他们记录了这些应用程序的运行速度,以及在 Perlmutter 上仅 CPU 节点和 GPU 加速节点上的能耗。Perlmutter 是世界上最大的使用 NVIDIA GPU 的超级计算机之一。
结果很明显,使用 NVIDIA A100 Tensor Core GPU 加速时,能效平均提高了 5 倍。一款天气预报应用程序的能效提高了 9.8 倍。
GPU 节省大量电力
NERSC 发现,与一台双插槽 x86 服务器相比,一台配备四个 A100 GPU 的服务器的速度提升了高达 12 倍。
这意味着,在相同的性能水平下,GPU 加速系统每月的能耗比仅使用 CPU 的系统少消耗 588 兆瓦时的能源。与仅使用 CPU 的系统相比,在四路 NVIDIA A100 云实例上运行相同的工作负载一个月,科研人员可以节省 400 多万美元。
测量真实的应用程序
这些结果意义重大,因为测量中使用了真实的应用程序,而不是合成基准测试。
能耗降低意味着 8000 多名使用 Perlmutter 的科学家可以应对更大的挑战,为取得更多突破打开了大门。
Perlmutter 超级计算机配备了 7100 多颗 A100 GPU,被用于众多科研项目。例如,科学家们正在用它探索亚原子相互作用,以寻找新的绿色能源。
全面推动科学进步
NERSC 测试的应用程序涉及分子动力学、材料科学和天气预报。
例如,MILC 模拟了将原子中的粒子结合在一起的基本力。它被用于推进量子计算、研究暗物质和寻找宇宙起源。
BerkeleyGW 帮助模拟和预测材料与纳米结构的光学特性,这是开发更高效的电池和电子器件的关键步骤。
图片说明:NERSC 应用程序通过加速计算提高了能效。
EXAALT 解决了分子动力学中的一个基础性挑战,它在 A100 GPU 上运行时把能效提高了 8.5 倍。它让科研人员能够模拟原子运动的短视频,而不是像其他工具那样提供一系列快照。
第四个被测应用 DeepCAM 用于检测气候数据中的飓风和大气河流。当使用 A100 GPU 加速时,它的能效提高了 9.8 倍。
图片说明:整体 5 倍加速是基于一组 HPC 和 AI 应用程序的混合。
通过加速计算节约更多
NERSC 的测量结果呼应了早期推算的加速计算潜在的节能效果。例如,在 NVIDIA 进行的一项单独分析中,GPU 在 AI 推理方面的能效是 CPU 的 42 倍。
这意味着,如果将全球所有运行人工智能的仅使用 CPU 的服务器切换到 GPU 加速系统,每年可以节省 10 万亿瓦时的能源,相当于 140 万个家庭一年的能源使用量。
加速企业发展
不是只有科学家才能通过加速计算提高能效。
制药公司正在使用 GPU 加速的模拟和人工智能来加快药物发现的进程。宝马集团等汽车制造商正在用它为整个工厂建模。
NVIDIA 创始人兼首席执行官黄仁勋曾表示,加速计算和 AI 正在推动行业高性能计算的革命,而这些企业正处于这场革命的最前沿。