全球最快超级计算机们都采用什么加速技术？-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

随着最新一代超级计算机日益与人工智能和云计算相结合，衡量这些机器的方式也在发生变化。在本周SC21高性能计算大会上最新发布的TOP500榜单上，NVIDIA技术为355套超级计算机系统提供加速，占榜单的70%以上……

从科学模拟、可视化、数据分析再到机器学习，各种现代计算的工作负载正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。

仅靠处理器、网络或软件优化已经无法满足研究人员、工程师和数据科学家的最新需求。

数据中心取而代之，成为新的计算单元，因此企业必须关注整个技术堆栈。

全球最强系统的最新排名显示，在新一代超级计算机中，这种使用全栈方法的趋势还在持续。

在本周SC21高性能计算大会上最新发布的TOP500榜单上，NVIDIA技术为355套超级计算机系统提供加速，占榜单的70%以上，而新增系统中90% 以上都采用了NVIDIA 的技术。对比6月份发布的TOP500榜单上342个系统（占榜单68%）使用NVIDIA技术，增长趋势明显。

NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势，占据了榜单排名前25名系统中的23套，与6月份持平。平均来看，采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。

来自微软的GPU加速Azure超级计算机在榜单上排名第十。这是基于云的系统首次跻身前10名，新一代云原生系统就此崭露头角。

人工智能正带来一场科学计算的革命。近年来，研究高性能计算和机器学习的论文数量激增，从2018年的约600篇增长到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在内的新基准也强调了高性能计算和AI工作负载的持续融合。

作为一个融合了高性能计算和人工智能工作负载的新基准，HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算，同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。

MLPerf HPC基准适用于通过人工智能实现超级计算机模拟加速和增强的计算方式，主要被用来测试高性能计算中心天体物理学(Cosmoflow)、天气(Deepcam)和分子动力学(Opencatalyst)三大关键工作负载的性能表现。

NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现，并推动了科学突破。

让我们来具体看一看NVIDIA是如何助力超级计算机实现性能提升的。

加速计算

GPU的并行处理能力再加上超过2500个GPU优化应用程序，在多数情况下可以让用户把高性能计算任务的时间从几周减少到几个小时。

NVIDIA一直在优化CUDA-X库和GPU加速应用程序，所以用户如果发现自己的GPU架构性能突然有了提升也很正常。

因此，应用范围最广的科学应用程序（我们称之为“黄金套件”）的性能在过去6年里提高了16倍，而且还在不断提升。

图注：全栈创新带来顶级高性能计算、人工智能和机器学习应用程序的16倍性能提升。

为帮助用户快速提升性能，NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序即可。

高性能计算与人工智能融合

人工智能在高性能计算中的应用能帮助研究人员加快模拟速度，同时保持传统模拟方法的准确性。

为此，越来越多的研究人员开始利用人工智能来加快研究的速度，比如今年超算领域最有声望的戈登·贝尔奖（Gordon Bell prize）决赛的四组晋级团队。各大企业正在竞相建造E级人工智能计算机，以支持这种融合高性能计算和人工智能的新模式。

一些相对较新的基准（如HPL-AI和MLPerf HPC）也印证了这一趋势，强调了高性能计算和AI工作负载的持续融合。

为推动这一趋势，上周NVIDIA推出了一系列用于高性能计算的先进的新的库和软件开发工具套件。

图是现代数据科学中的一个关键数据结构。通过一个名为深度图库（DGL）的新型Python包，用户现在可以把图投影到深度神经网络框架中。

NVIDIA Modulus构建并训练了一个内嵌物理信息的机器学习模型，可以用来学习并遵循物理定律。

NVIDIA推出了三个新库:

ReOpt – 可提高规模高达10万亿美元的物流行业的运营效率。
cuQuantum – 可加速量子计算研究。
cuNumeric – 为Python社区的科学家、数据科学家、机器学习和人工智能研究人员加速NumPy。

NVIDIA的虚拟世界模拟和3D工作流协作平台NVIDIA Omniverse负责把一切整合到一起。

Omniverse可用来模拟仓库、工厂、物理和生物系统、5G边缘、机器人、自动驾驶汽车甚至是虚拟形象的数字孪生。

NVIDIA上周宣布，将利用Omniverse构建一台名为Earth-2的超级计算机，通过创建一个数字孪生地球来预测气候变化。

云原生超级计算

随着超级计算机在数据分析、人工智能、模拟和可视化方面承担越来越多的工作负载，CPU不得不在大型复杂的系统上支持更多的通信任务。

DPU（数据处理器）可以卸载多种操作，有效减轻这一压力。

作为一个完全集成的片上数据中心平台，NVIDIA BlueField DPU可以卸载和管理数据中心的基础设施任务，释放主机的处理器资源，从而实现更强的安全性和更高效的超级计算编排工作。

与NVIDIA Quantum InfiniBand平台相结合，该架构可提供最佳裸机性能，同时原生支持多节点租户隔离。

NVIDIA的Quantum InfiniBand平台提供可预测的裸机性能隔离。并且采用零信任安全防护，因而这些新系统也更加安全。

BlueField DPU将用户应用与基础设施任务隔离开来。最新的BlueField软件平台NVIDIA DOCA 1.2支持下一代分布式防火墙和更广泛的线速数据加密。而NVIDIA Morpheus则会假设入侵者已经进入数据中心，将利用基于深度学习的数据科学来实时检测入侵者的活动。

新的网络技术则会加速上述这些趋势场景。

上周NVIDIA还发布了NVIDIA Quantum-2。这是一个400Gbps InfiniBand平台，由Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU以及用于新网络架构的软件组成。

NVIDIA Quantum-2提供了裸机高性能和安全多租户优势，可以让下一代超级计算机实现安全性、云原生以及更高的效率。

**基准应用：Amber、Chroma、GROMACS、MILC、NAMD、PyTorch、Quantum Espresso;

Random Forest FP32、TensorFlow、VASP | GPU节点：双插槽CPU和4颗P100、V100或A100 GPU。

责编：Luffy Liu

阅读全文，请先

数据中心/服务器处理器/DSP 人工智能业界新闻

您可能感兴趣

独角兽沐曦启动A股IPO，国产GPU企业上市潮延续

美国政府近年来不断出台限制措施，阻止英伟达等企业将GPU产品出售给中国客户，国内互联网及AI大模型企业不得不寻求其他替代品。这对于国产GPU来说即是压力也是动力……

瞄准大模型：美国将25家中企列入实体清单，管制16nm以下AI芯片

此次被列入实体清单的中国企业涵盖了多个高科技领域，包括但不限于人工智能、半导体以及量子技术等。值得注意的是，这是美国首次将中国的大模型公司（智谱AI）列入实体清单。

英特尔前首席架构师加入高通任高级副总裁

英特尔前首席架构师赛莱什·科塔帕利在英特尔担任过多款 Xeon 服务器处理器的首席工程师以及数据中心流程架构的平台工程组总监，近年来高通也一直在寻求进军服务器市场，这预示着高通有望在服务器市场上的进一步发展......

OpenAI的经济蓝图：芯片、数据、能源和人才是关键

OpenAI认为，芯片、数据、能源和人才是赢得人工智能的关键，且建议美国政府大幅增加对这些领域的投资。

美国发布“人工智能扩散出口管制框架”临时最终规则

该举措标志着美国政府对先进计算集成电路和封闭式两用AI模型权重的出口控制力度进一步加大，并引入了全新的强制性全球许可制度。

英伟达AI芯片再出故障，微软等客户削减订单，股价一度重挫近5%

目前，这些故障主要影响了首批搭载Blackwell芯片的机架，从而引发了客户的担忧。其中，微软、亚马逊网络服务公司（AWS）、谷歌和Meta这四大主要客户已经削减了对Blackwell GB200机架的订单。

2025年中国PC显示器市场十大洞察

对于未来行业发展的增长趋势、行业特征和渠道特点等方面，IDC 总结并给出了2025年中国PC 显示器市场十大洞察……

中科院微电子所在SRAM存内计算领域取得新进展

该存内计算芯片采用全数字设计，能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效，团队提出了一种……

西门子获评IDC MarketScape制造执行系统领导厂商

西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商，该报告针对制造业的MES软件厂商进行了综合性评估。

Arm发布芯粒系统架构首个公开规范，加速芯片技术演进

Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范，进一步推动芯粒技术的标准化，并减少行业的碎片化。

中科院等高校团队联合开发超高分辨率MicroLED显示器

知识酷Pro 👆学显示行业知识找小酷！第1833篇推文据悉，Micro LED正作为光通信、增强现实与虚拟现实以及可穿戴设备的下一代显示技术崭露头角。金属卤化物钙钛矿因其高效的发光能力、长程载流子传输

比亚迪智驾总负责人杨冬生内部讲话曝光

点击上面↑“电动知家”关注，记得加☆“星标”！电动知家消息，比亚迪汽车新技术研究院院长近日在技术院内部，针对技术研发、管理、制度等话题谈了他的看法，并提出了新的工作要求或者方向。“晚点 Auto”披露

突破封锁！中国芯片出口达1.1万亿元，创新高！

1月24日消息，虽然美国在半导体芯片领域对中国厂商各种打压，但现实结果是他们并没有成功。海关总署数据显示，2024年我国集成电路出口1594.99亿美元（约11350亿人民币），一举超过手机的1343

IPC祝您蛇年大吉！

字节福利调整：2025发最后一次，但增加特需医疗报销、洗牙报销、子女流感疫苗报销。增加超级猩猩、乐刻，约课大部分由公司买单！

每到春节前夕，打工人就开始打听：“今年春节红包还发不发？”“会不会减半？”今天，字节的最新内部邮件，公布了答案：2025年还发，金额与去年持平。但是——2026年起，不再发了。这决定是为了明确区分“激

超越丰田，比亚迪又一国拿下销冠！

点击上面↑“电动知家”关注，记得加☆“星标”！电动知家消息，近日，新加坡陆路交通管理局发布的授权经销商新车注册数据显示，2024 年，比亚迪销量由前一年的 1416 辆大增至 6191 辆，市占率 1

三星代工投资遭腰斩！

据韩媒报道，三星电子宣布，今年其代工部门的设施投资将大幅减少，预算较去年削减超过一半。三星代工部门2025年的设施投资预算约为5万亿韩元（约35亿美元），较2024年投资的10万亿韩元大幅下降。此决定

专家：比亚迪成本是大众55%

点击上面↑“电动知家”关注，记得加☆“星标”！电动知家消息，2025年世界经济论坛年会将于1月20—24日在瑞士举行，年会召集世界各地、各行业的近3000名领袖，探讨“智能时代的合作”这一主题。谈及目

传台积电，6万片晶圆报废！

1月21日凌晨，中国台湾嘉义大埔地区发生里氏6.4的浅层地震，造成中科与南科部分半导体及面板厂一度停机与人员疏散，目前已逐步恢复。在地震发生当天，台积电曾对外表示，为确保人员安全，各厂区依照内部程序启

理想官宣：正式收费！

点击上面↑“电动知家”关注，记得加☆“星标”！电动知家消息，1月23日，理想汽车宣布，理想超充站超时占用费正式运营。理想汽车方面表示，理想超充站超时占用费试运营以来，试点场站的占位情况显著改善。即日起

文章评论

最新
热门

换一换

EE直播

更多>

全球最快超级计算机们都采用什么加速技术？

加速计算

高性能计算与人工智能融合

云原生超级计算

杂志声明