全球超级计算机TOP500排名及分析

智能计算芯世界 2022-11-08 00:00

第58届TOP500榜单前10名中仅有一台新系统上榜,为Voyager-EUS2。该系统是Microsoft Azure系统,排名第10位。日本超级计算机Fugaku位居榜首,其他系统排名也与上届相同,与上届相比有变化的是第5的系统Perlmutter,性能从之前的64.6Pflop/s提升至70.9Pflop/s。

文章内容参考自“《第58届全球超级计算机TOP500排名及分析》”和“《第57届全球超级计算机TOP500排名及分析》”。

1、AIPerf:大规模人工智能算力基准测试程序

2、AI高性能:云边端硬件部署实践

TOP10榜单情况介绍及分析

系统Fugaku保持第一位,拥有7630848个核心,性能达到442Pflop/s,为排名第2的Summit(顶点)Linpack性能的3倍。该系统采用富士通定制的ARM A64FX处理器。
Summit(顶点)是美国田纳西州橡树岭国家实验室(ORNL)由IBM构建系统,它仍然是美国最快的系统,在 HPL 基准测试中的性能为148.8Pflop/s,在全球排名第二。它拥有 4,356 个节点,每个节点包含两个Power9CPU,每个CPU有22个内核,六个NVIDIA Tesla V100 GPU。这些节点通过Mellanox双轨 EDR InfiniBand 网络连接在一起。
美国加利福尼亚州劳伦斯利弗莫尔国家实验室(LINL)的  Sierra  系统排名第3。其架构与#2系统Summit非常相似。它由4,320个节点构成,具有两个Power9CPU和四个NVIDIA Tesla V100GPU。HPL性能达到了94.6Pflop/s。
由中国国家并行计算机工程与技术研究中心(NRCPC)开发并安装在中国江苏省无锡国家超级计算中心的系统神威太湖之光以93Pflop/s排名第四。
Perlmutter为本届TOP10中新上榜系统,该机器基于HPE Cray“ Shasta”平台,配置AMD EPYC 7763 处理器和NVIDIA A100加速部件,相比上一届性能有所提升,实现了70.9 Pflop/s的Linpack性能,依旧排名第5位。
Selene现在排名第6,是美国NVIDIA内部安装的 NVIDIA DGX A100 SuperPOD。该系统基于AMD EPYC处理器,采用NVIDIAA100加速,MellanoxHDR InfiniBand作为网络互连,实现了63.4Pflop/s。
由中国国防科技大学(NUDT)开发并部署在中国广州国家超级计算机中心的系统天河2A(Milky Way-2A)以61.4Pflop/s的性能排名第7,配备英特尔至强处理器和定制的Matrix-2000加速器。
名为“ JUWELS  Booster  Module”的系统排名第8。由Atos构建的Bull  Sequana系统安装在德国的Forschungszentrum  Juelich  (FZJ)。该系统采用AMD EPYC处理器和NVIDIA A100进行加速,并使用网络,类似于Selene系统。这个系统是欧洲最强大的系统,性能达到44.1Pflop/S。
排名第9位的HPC5是戴尔构建、意大利Eni S.p.A公司安装的PowerEdge系统,由于使用NVIDIA TeslaV100作为加速器,使用Mellanox HDR InfiniBand作为网络,实现了35.5 PFlop/s的性能。
微软的Voyager-EUS2系统新上榜排名第10,性能为30.05Pflop/s,采用48核心的AMD EPYC处理器,配置80GB显存的NVIDIA A100 GPU加速卡和Mellanox HDR InfiniBand网络。

榜单总体分析

中国系统保有量再居第一,美国系统装机量上升。本届榜单500台系统中,中国的超级计算系统装机数量为173台,占34.6%,位居第一位;美国其次,系统保有量为149台,第三名为日本32台。
从近2年榜单来看系统装机量各国的变化,如图2,中国的系统装机量2年内有减少趋势,最高时为55届的226台美国的装机数量本届榜单相比上一届增加了27台。美国装机总性能保持第一,且新上榜系统数量最多(32台);日本装机系统的平均性能因为Fugaku继续保持第一位。

中国系统制造商的装机总量领先,联想居首位500台系统中有273台系统采用中国系统制造商的产品,包括了联想Lenovo(180台)、浪潮Inspur(50台)、曙光Sugon(36台)、华为Huawei(7台),其中联想装机总量排名众多厂商第一,美国的HPE居第二位,装机数量为84台。与上一届相比,中国的总装机数量有所下降(21台)。

英特尔(Intel)继续保持TOP500处理器最大供应商地位。英特尔继续保持着TOP500处理器最大提供商,份额占比从之前的86.40%下降到81.6%;AMD处理器的占比则从9.6%上升至14.6%。在新上榜的70台系统中,配备Intel处理器的系统42台,高于配备AMD处TOP500系统保有量变化理器的数量(28台),但从总体来看,安装Intel处理器的系统数量已有半年前的459台,下滑至现今的408台。使用ARM架构处理器的系统与上届相同(5台)。

加速卡提升总体性能,NVIDIA成主要加速部件提供商。本届榜单中151台系统使用加速部件/协处理器技术,占总份额的30.2%,比6个月前的147台略有增加。其中,84台系统使用NVIDIA  Volta芯片,43台使用NVIDIA Ampere, 8台使用NVIDIA Pasca, 共计135台。新上榜的70台系统中,25台系统采用NVIDIA 加速卡技术,最高排名为第10位的Microsoft Azure系统在TOP100中,34台系统采用了加速部件而在TOP10中,80%采用了加速卡来提升总体性能。
高速以太网为主流互联技术,InfiniBand互联系统总性能最高。在超级计算机系统中,高速以太网是目前采用最多的互联技术,500台系统中有242台系统采用此种方式互联,占比为48.4%;而InfiniBand互联则助力更大规模超级计算系统,178台系统提供了总体性能的44.5%,且在前100名系统中,61台系统采用InfiniBand互联。

超算正向着基于大数据、人工智能(AI)的“ 数据密集型科学”演进。近年,超算应用不再仅限于建模和计算仿真等传统的科学和工程计算业务,涌现出新的数据密集型应用,如人工智能、机器学习、大数据分析等,要求更多的HPC资源来满足日益增长的工作负载和新型用户。随着要处理的数据量的暴增,高性能计算正从以计算为核心向以数据为核心的计算演进,数据密集型超算成为未来发展的主流方向之一。近几年的戈登贝尔奖的应用趋势也彰显出,人工智能+大数据+超算的融合正成为主流趋势。
2021年HPC  China学术年会公布了最新的国内TOP100榜单中,新增“算力服务“(以算力为资源向用户提供计算服务)领域,占据系统份额为46%,其次是超算中心占24%、人工智能应用占9%。此外,100台系统中有一批实现商业化转型的超算系统上榜,以超级云计算服务的模式向用户提供算力。

文章小结

本届榜单E级计算系统仍未出现,日本的Fugaku 富岳从55届上榜以来继续保持第一位。处理器和加速部件/协处理器方面仍是Intel和NVIDIA占据主要份额;约半数系统采用高速以太网互联,但InfiniBand 仍为性能高的系统采用的主要互联技术;中国保持着装机量领先的地位,中国的联想成为超级计算系统的最大供应商,美国的装机总性能保持第一,日本的平均性能为最高。新兴技术(大数据、人工智能)与传统高性能计算的融合,推动着该行业的多元化发展,从科学型(计算为主)的应用向计算+数据型应用的演进。

下载链接:
《服务器系列报告合集》
1、服务器系列(1)下游需求多点开花,行业拐点即将来临
2、服务器系列(2)从白牌崛起、品牌求变,探究云计算厂商核心需求
如何看待ARM架构芯片在服务器端的发展前景
集成电路技术简介
中国电信云网融合2030技术白皮书
《第58届全球超级计算机TOP500排名及分析》
《第57届全球超级计算机TOP500排名及分析》
《国海证券:元宇宙系列深度报告》
1、元宇宙深度报告之一:下一代互联网前瞻 2、元宇宙深度报告之二:数字虚拟人赋能产业起点 3、元宇宙深度报告之三:NFT的本质思考及破圈之路
《OCP China Day 2022资料合集(3)》
《OCP China Day 2022资料合集(2)》
1、突破存储边界,赋能开放计算(2022)
2、OCP v2 & v3 Rack介绍(2022)
3、开放整机柜简史(2022)
4、浪潮开放网络软件创新与实践(2022)
《OCP China Day 2022资料合集(1)》
《主流CPU处理器合集》
1、Intel Xeon CPU
2、Intel IPU
3、Intel GPU 
4、Intel Alderlake CPU 
5、IBM Telum
6、Infineon英飞凌 
7、AMD Zen3 
8、AMD RDNA2 

9、ARM Neoverse N2

基于IPU的云基础设施:数字业务的支点
中国移动DPU技术白皮书(2022)
国产高端处理器,实现CPU+DCU齐赋能
海光:国产处理器产业领军者
HarmonyOS 2 安全技术白皮书
2022中国智造观察报告
人工智能治理与可持续发展实践白皮书(2022)
通信行业算力革命:泛在、绿色与生态(2022)
算网一体网络架构及技术体系展望白皮书(2022)
可信密态计算白皮书(2022)
全球开源生态研究报告(2022年)


免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



电子书<服务器基础知识全解(终极版)>更新完毕。

获取方式:点击“阅读原文”即可查看182页 PPT可编辑版本和PDF阅读版本详情。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。



智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 69浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 45浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 101浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 136浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 44浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 73浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 70浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 66浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 84浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 78浏览
  •         在有电流流过的导线周围会感生出磁场,再用霍尔器件检测由电流感生的磁场,即可测出产生这个磁场的电流的量值。由此就可以构成霍尔电流、电压传感器。因为霍尔器件的输出电压与加在它上面的磁感应强度以及流过其中的工作电流的乘积成比例,是一个具有乘法器功能的器件,并且可与各种逻辑电路直接接口,还可以直接驱动各种性质的负载。因为霍尔器件的应用原理简单,信号处理方便,器件本身又具有一系列的du特优点,所以在变频器中也发挥了非常重要的作用。  &nb
    锦正茂科技 2024-12-10 12:57 76浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 105浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦