SC23|新型加速节能AI系统开创超级计算的新时代

原创 英伟达NVIDIA中国 2023-11-15 18:35

世界各地的研究人员将在配备最新 NVIDIA Hopper GPU 和 NVIDIA Grace Hopper 超级芯片的系统上,借助生成式 AI 和 HPC 来应对科学和工业领域的重大挑战。



11 月 13 日,NVIDIA 在 SC23 上发布了一系列新技术,将全球各地的科学和工业研究中心推向性能和能效新高。


NVIDIA 高性能计算和超大规模数据中心业务副总裁 Ian Buck 在 SC 大会发表的特别演讲中提到:“NVIDIA 的硬件和软件创新正在创造一种新型 AI 超级计算机。”


其中一些超级计算机将配备内存增强的 NVIDIA Hopper 加速器,另一些则采用全新 NVIDIA Grace Hopper 系统架构。它们都将使用扩展的并行结构来运行面向生成式 AI 、HPC 和混合量子计算的全栈加速软件。


Buck 将全新 NVIDIA HGX H200 称为“世界领先的 AI 计算平台”。


它配备高达 141 GB 的 HBM3e,是首款使用这项超快技术的 AI 加速器。在运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的性能比上一代加速器高出 18 倍。


NVIDIA H200 Tensor Core GPU 配备 HBM3e 内存,

可运行不断增长的生成式 AI 模型


在其他生成式AI基准测试中,它们在一个 Llama2-13B 大语言模型(LLM)上每秒可快速通过 12,000 个 token 。


Buck 还展示了一个服务器平台,该平台在一个 NVIDIA NVLink 互联下连接了四个 NVIDIA GH200 Grace Hopper 超级芯片。这一四组芯片的配置使得在一个计算节点内有高达 288 个 Arm Neoverse 核心,以及 2.3 TB 的高速内存 ,实现了 16 petaflops 的 AI 性能。


基于四个 GH200 超级芯片的服务器节点,提供 16 petaflops 的 AI 性能


采用 NVIDIA TensorRT-LLM 开源库的单个 GH200 超级芯片比一个双插槽 x86 CPU 系统快 100 倍,比一台 x86 + H100 GPU 服务器节能近 2 倍,展现了卓越的节能效果。


Buck 说:“加速计算是可持续的计算。通过充分利用加速计算和生成式 AI,我们可以推动各行各业的创新,同时减少对环境的影响。”


新上榜 TOP500 的 49 个系统中

有 38 个采用了 NVIDIA 技术


最新发布的全球最快的超级计算机 TOP500 榜单显示,人们正在转向加速、节能的超级计算。


由于诸多新建超级计算机采用了 NVIDIA H100 Tensor Core GPU,NVIDIA 目前在这些世界领先的系统中提供超过 2.5 exaflops 的 HPC 性能,相较此前 5 月榜单中的 1.6 exaflops 有了不少提升。仅在全球超级计算机 Top 10 中,NVIDIA 就提供近 1 exaflop 的 HPC 性能和 72 exaflops 的 AI 性能。


在新榜单中,采用 NVIDIA 技术的超级计算机数量再创新高,从 5 月份的 372 个增加到 379 个,其中包括 49 个新上榜超级计算机中的 38 个。


部署在 Microsoft Azure 中的 Eagle 系统是算力最高的新上榜超级计算机,其采用 H100 GPU,在 NDv5 实例中以 561 petaflops 的算力在总榜中排名第三。巴塞罗那的 Mare Nostrum5 排名第 8 ,而最近在 MLPerf 基准测试中创下 AI 训练新纪录的 NVIDIA Eos 排名第 9 。


在 Green500 的前 30 名中有 23 个采用了 NVIDIA GPU ,彰显了它们的节能优势。配备 H100 GPU 的 Henri 系统蝉联第一,它位于纽约 Flatiron 研究所,能效为每瓦 65.09 gigaflops 。


使用生成式 AI 探索新冠病毒


美国阿贡国家实验室展现了无限可能,它使用 NVIDIA BioNeMo(一个面向生物分子大语言模型的生成式 AI 平台)开发了 GenSLM 模型。这个模型可以生成与冠状病毒的现实变种非常相似的基因序列。使用 NVIDIA GPU 以及来自 150 万个新冠病毒基因组序列的数据,它还可以快速识别出新的病毒变种。


这项工作去年获得了戈登·贝尔特别奖,并在包括美国阿贡国家实验室的 Polaris 系统、美国能源部的 Perlmutter 和 NVIDIA 的 Selene 在内的超级计算机上进行了训练。


NVIDIA 医疗业务副总裁 Kimberly Powell 在此次特别演讲中提到:“这只是冰山一角。随着生成式 AI 不断重新定义科学探索,未来充满了无限可能。”


节约时间、金钱和能源


Buck 提到,使用最新技术为工作负载加速可以将系统的成本和能耗降低一个数量级。


例如,西门子与梅赛德斯合作为新其款 EQE 电动汽车分析空气动力学和相关声学。这类模拟此前在 CPU 集群上通常耗时数周时间,而借助最新的 NVIDIA H100 GPU ,其速度要快很多。此外,Hopper GPU 使成本降低了 3 倍,能耗降低了 4 倍(如下如所示)。



明年将开启 200 Exaflops 时代


在全球各地,部署这些最新系统将推动科学和工业领域不断取得进步。


Buck 说:“我们已经看到,2024 年将有基于 Grace Hopper 超级计算机的总计 200 exaflops AI 算力投入生产。”


其中包括德国于希利研究中心的大型 JUPITER 超级计算机。它可以为 AI 训练提供 93 exaflops 的性能,为 HPC 应用提供 1 exaflop 的性能,而能耗仅为 18.2 兆瓦。


GH200 为研究中心带来性能飙升


基于 Eviden 的 BullSequana XH3000 液冷系统,JUPITER 将使用 NVIDIA quad GH200 系统架构和 NVIDIA Quantum-2 InfiniBand 网络,用于进行气候和天气预测、药物发现、混合量子计算和数字孪生。JUPITER 所采用的 quad GH200 节点将配置 864 GB 的高速内存。


这是 NVIDIA 在 SC23 上宣布的数个使用 Grace Hopper 的新型超级计算机之一。


慧与(Hewlett Packard Enterprise)的 HPE Cray EX2500 系统将为明年投入使用的众多AI超级计算机配备 quad GH200。


例如,慧与建设的 OFP-II(一个由日本筑波大学和东京大学共享的先进 HPC 系统)以及 DeltaAI 系统(将使美国国家超级计算应用中心的算力提升三倍)均将采用 quad GH200。


HPE 正在为美国洛斯阿拉莫斯国家实验室建造 Venado 系统,这是在美国部署的首个 GH200,其还将在中东、瑞士和英国建设更多 GH200 超级计算机。


德克萨斯及更多地区采用 Grace Hopper


在德克萨斯高级计算中心(TACC),戴尔科技集团正在使用 NVIDIA Grace Hopper 和 Grace CPU 超级芯片建造 Vista 超级计算机。


Buck 表示,包括美国航空航天局艾姆斯研究中心(NASA Ames Research Center)和 Total Energies 在内的全球 100 多个企业和组织已经采购了 Grace Hopper 早期访问系统。


此前已宣布采用 GH200 的用户包括软银和布里斯托大学,以及配备 14000 个 NVIDIA A100 GPU 的大型 Leonardo 系统,后者为意大利 Cineca 联盟提供 10 exaflops 的 AI 性能。


超算中心的观点


来自世界各地超算中心的主管介绍了他们采用最新系统的计划及进展。


瑞士国家超级计算中心负责阿尔卑斯超级计算机的主任 Thomas Schultess 表示:“我们一直在与 MeteoWiss ECMWP 以及参与 ETH EXCLAIM 和 NVIDIA Earth-2 计划的科学家合作打造一个基础设施,以期在大数据分析和超大规模计算的各个方面取得突破。”


德克萨斯高级计算中心(TACC)的执行主任 Dan Stanzione 在谈到 Vista 时表示:“我们的各个堆栈都极大提升了能效。”


他说:“这真的是一块垫脚石,推动用户从过去使用的系统转向这种将 Grace Arm CPU 和 Hopper GPU 紧密配合的新系统,而且……我们希望在几年后部署 Horizon 时,其规模将是 Vista 的 10 或 15 倍。”


加速量子进程


研究人员们还在利用当今的加速系统开拓通往未来超级计算机的道路。


于利希研究中心量子信息处理研究小组负责人 Kristel Michelson 表示,在德国,JUPITER 超级计算机“将彻底改变气候、材料、药物发现和量子计算领域的科研工作”。


她说:“ JUPITER 的架构还允许量子算法与并行 HPC 算法无缝集成,这对于有效的量子 HPC 混合模拟来说是必需的。”


CUDA Quantum 推动进步


此次演讲还展示了 NVIDIA CUDA Quantum —— 一个用于编程 CPU、GPU 和 QPU(量子计算机)的平台,是如何推进量子计算研究的。


例如,全球最大的化工企业巴斯夫的研究人员开创了一种新的混合量子经典方法,用于模拟可以保护人类免受有害金属侵害的化合物。此外,美国布鲁克海文国家实验室和 HPE 的研究人员也分别在利用 CUDA Quantum 推动前沿科研工作。


NVIDIA 还宣布与量子编程工具开发商 Classiq 合作,在以色列最大的教学医院 Tel Aviv Sourasky Medical Center 创建一个生命科学研究中心。该中心将使用 Classiq 软件和运行于 NVIDIA DGX H100 系统之上的 CUDA Quantum 。


另外,Quantum Machines 公司将在以色列国家量子中心部署首个配备 Grace Hopper 超级芯片的 NVIDIA DGX Quantum ,旨在推动各个科学领域的进步。这个 DGX 系统将连接到一台 Quantware 的超导 QPU 和一台 ORCA Computing 的光子 QPU,两者均由 CUDA Quantum 驱动。



Buck 说:“在短短两年内,NVIDIA 的量子计算平台已经拥有 120 多个合作伙伴(如上图),这证明它是一个开放、创新的平台。”


总的来说,诸多科研领域的工作揭示了一种新趋势,那就是将数据中心规模的加速计算与 NVIDIA 的全栈创新相结合。


他总结道:“加速计算正在为可持续计算铺平道路,并且已经取得了诸多进步,不仅提供令人惊叹的技术,而且将开创更加可持续、更有影响力的未来。”



GTC 2024 将于 2024 年 3 月 18 至 21 日在美国加州圣何塞会议中心举行,线上大会也将同期开放。点击 “阅读原文” 扫描下方海报二维码,立即注册 GTC 大会


评论
  •                                                窗        外       年底将近,空气变得格外寒冷,估计这会儿北方已经是千里
    广州铁金刚 2024-12-23 11:49 169浏览
  • 耳机虽看似一个简单的设备,但不仅只是听音乐功能,它已经成为日常生活和专业领域中不可或缺的一部分。从个人娱乐到专业录音,再到公共和私人通讯,耳机的使用无处不在。使用高质量的耳机不仅可以提供优良的声音体验,还能在长时间使用中保护使用者听力健康。耳机产品的质量,除了验证产品是否符合法规标准,也能透过全面性的测试和认证过程,确保耳机在各方面:从音质到耐用性,再到用户舒适度,都能达到或超越行业标准。这不仅保护了消费者的投资,也提升了该公司在整个行业的产品质量和信誉!客户面临到的各种困难一家耳机制造商想要透
    百佳泰测试实验室 2024-12-20 10:37 274浏览
  • 光耦固态继电器(SSR)作为现代电子控制系统中不可或缺的关键组件,正逐步取代传统机械继电器。通过利用光耦合技术,SSR不仅能够提供更高的可靠性,还能适应更加复杂和严苛的应用环境。在本文中,我们将深入探讨光耦固态继电器的工作原理、优势、挑战以及未来发展趋势。光耦固态继电器:如何工作并打破传统继电器的局限?光耦固态继电器通过光电隔离技术,实现输入信号与负载之间的电气隔离。其工作原理包括三个关键步骤:光激活:LED接收输入电流并发出与其成比例的光信号。光传输:光电传感器(如光电二极管或光电晶体管)接收
    腾恩科技-彭工 2024-12-20 16:30 159浏览
  •         不卖关子先说感受,真本书真是相见恨晚啊。字面意思,见到太晚了,我刚毕业或者刚做电子行业就应该接触到这本书的。我自己跌跌撞撞那么多年走了多少弯路,掉过多少坑,都是血泪史啊,要是提前能看到这本书很多弯路很多坑都是可以避免的,可惜这本书是今年出的,羡慕现在的年轻人能有这么丰富完善的资料可以学习,想当年我纯靠百度和论坛搜索、求助啊,连个正经师傅都没有,从软件安装到一步一布操作纯靠自己瞎摸索,然后就是搜索各种教程视频,说出来都是泪啊。  &
    DrouSherry 2024-12-19 20:00 179浏览
  • //```c #include "..\..\comm\AI8051U.h"  // 包含头文件,定义了硬件寄存器和常量 #include "stdio.h"              // 标准输入输出库 #include "intrins.h"         &n
    丙丁先生 2024-12-20 10:18 134浏览
  • 汽车行业的变革正愈演愈烈,由交通工具到“第三生活空间”。业内逐渐凝聚共识:汽车的下半场在于智能化。而智能化的核心在于集成先进的传感器,以实现高等级的智能驾驶乃至自动驾驶,以及更个性、舒适、交互体验更优的智能座舱。毕马威中国《聚焦电动化下半场 智能座舱白皮书》数据指出,2026年中国智能座舱市场规模将达到2127亿元,5年复合增长率超过17%。2022年到2026年,智能座舱渗透率将从59%上升至82%。近日,在SENSOR CHINA与琻捷电子联合举办的“汽车传感系列交流会-智能传感专场”上,艾
    艾迈斯欧司朗 2024-12-20 19:45 304浏览
  • Supernode与艾迈斯欧司朗携手,通过Belago红外LED实现精准扫地机器人避障;得益于Belago出色的红外补光功能,使扫地机器人能够大大提升其识别物体的能力,实现精准避障;Belago点阵照明器采用迷你封装,兼容标准无铅回流工艺,适用于各种3D传感平台,包括移动设备、物联网设备和机器人。全球领先的光学解决方案供应商艾迈斯欧司朗(瑞士证券交易所股票代码:AMS)近日宣布,与国内领先的多行业三维视觉方案提供商超节点创新科技(Supernode)双方联合推出采用艾迈斯欧司朗先进Belago红
    艾迈斯欧司朗 2024-12-20 18:55 202浏览
  • 百佳泰特为您整理2024年12月各大Logo的最新规格信息。——————————USB▶ 百佳泰获授权进行 USB Active Cable 认证。▶ 所有符合 USB PD 3.2 标准的产品都有资格获得USB-IF 认证——————————Bluetooth®▶ Remote UPF Testing针对所有低功耗音频(LE Audio)和网格(Mesh)规范的远程互操作性测试已开放,蓝牙会员可使用该测试,这是随时测试产品的又一绝佳途径。——————————PCI Express▶ 2025年
    百佳泰测试实验室 2024-12-20 10:33 196浏览
  •         在上文中,我们介绍了IEEE 802.3cz[1]协议提出背景,旨在定义一套光纤以太网在车载领域的应用标准,并介绍了XMII以及PCS子层的相关机制,在本篇中,将围绕IEEE 802.3cz-MultiGBASE-AU物理层的两个可选功能进行介绍。EEE功能        节能以太网(Energy-Efficient Ethernet)是用于在网络空闲时降低设备功耗的功能,在802.3cz的定义中,链
    经纬恒润 2024-12-19 18:47 103浏览
  • ALINX 正式发布 AMD Virtex UltraScale+ 系列 FPGA PCIe 3.0 综合开发平台 AXVU13P!这款搭载 AMD 16nm 工艺 XCVU13P 芯片的高性能开发验证平台,凭借卓越的计算能力和灵活的扩展性,专为应对复杂应用场景和高带宽需求而设计,助力技术开发者加速产品创新与部署。随着 5G、人工智能和高性能计算等领域的迅猛发展,各行业对计算能力、灵活性和高速数据传输的需求持续攀升。FPGA 凭借其高度可编程性和实时并行处理能力,已成为解决行业痛点的关
    ALINX 2024-12-20 17:44 211浏览
  • 汽车驾驶员监控系统又称DMS,是一种集中在车辆中的技术,用于实时跟踪和评估驾驶员状态及驾驶行为。随着汽车产业智能化转型,整合AI技术的DMS逐渐成为主流,AI模型通过大量数据进行持续训练,使得驾驶监控更加高效和精准。 驾驶员监测系统主要通过传感器、摄像头收集驾驶员的面部图像,定位头部姿势、人脸特征及行为特征,并通过各种异常驾驶行为检测模型运算来识别驾驶员的当前状态。如果出现任何异常驾驶行为(如疲劳,分心,抽烟,接打电话,无安全带等),将发出声音及视觉警报。此外,驾驶员的行为数据会被记录
    启扬ARM嵌入式 2024-12-20 09:14 119浏览
  • 在强调可移植性(portable)的年代,人称「二合一笔电」的平板笔电便成为许多消费者趋之若鹜的3C产品。说到平板笔电,不论是其双向连接设计,面板与键盘底座可分离的独特功能,再加上兼具笔电模式、平板模式、翻转模式及帐篷模式等多种使用方式,让使用者在不同的使用情境下都能随意调整,轻巧灵活的便利性也为多数消费者提供了绝佳的使用体验。然而也正是这样的独特设计,潜藏着传统笔电供货商在产品设计上容易忽视的潜在风险。平板笔电Surface Pro 7+ 的各种使用模式。图片出处:Microsoft Comm
    百佳泰测试实验室 2024-12-19 17:40 289浏览
  • 光耦合器,也称为光隔离器,是用于电气隔离和信号传输的多功能组件。其应用之一是测量电路中的电压。本文介绍了如何利用光耦合器进行电压测量,阐明了其操作和实际用途。使用光耦合器进行电压测量的工作原理使用光耦合器进行电压测量依赖于其在通过光传输信号的同时隔离输入和输出电路的能力。该过程包括:连接到电压源光耦合器连接在电压源上。输入电压施加到光耦合器的LED,LED发出的光与施加的电压成比例。光电二极管响应LED发出的光由输出侧的光电二极管或光电晶体管检测。随着LED亮度的变化,光电二极管的电阻相应减小,
    腾恩科技-彭工 2024-12-20 16:31 214浏览
  • 国产数字隔离器已成为现代电子产品中的关键部件,以增强的性能和可靠性取代了传统的光耦合器。这些隔离器广泛应用于医疗设备、汽车电子、工业自动化和其他需要强大信号隔离的领域。准确测试这些设备是确保其质量和性能的基本步骤。如何测试数字隔离器测试数字隔离器需要精度和正确的工具集来评估其在各种条件下的功能和性能。以下设备对于这项任务至关重要:示波器:用于可视化信号波形并测量时序特性,如传播延迟、上升时间和下降时间。允许验证输入输出信号的完整性。频谱分析仪:测量电磁干扰(EMI)和其他频域特性。有助于识别信号
    克里雅半导体科技 2024-12-20 16:35 191浏览
  • 随着工业自动化和智能化的发展,电机控制系统正向更高精度、更快响应和更高稳定性的方向发展。高速光耦作为一种电气隔离与信号传输的核心器件,在现代电机控制中扮演着至关重要的角色。本文将详细介绍高速光耦在电机控制中的应用优势及其在实际工控系统中的重要性。高速光耦的基本原理及优势高速光耦是一种光电耦合器件,通过光信号传递电信号,实现输入输出端的电气隔离。这种隔离可以有效保护电路免受高压、电流浪涌等干扰。相比传统的光耦,高速光耦具备更快的响应速度,通常可以达到几百纳秒到几微秒级别的传输延迟。电气隔离:高速光
    晶台光耦 2024-12-20 10:18 225浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦