据最新消息,继天河2号之后,国产超级计算机“神威太湖一号(Sunway TaihuLight)”再次登顶世界TOP500,成为世界上运算速度最快的计算机。需要特别指出的是,这次神威太湖一号所使用的CPU也完全是国产的。
相比天河2号的理论性能54.9PFLOPS(1PFLOPS=每秒1千万亿次),神威太湖一号的理论浮点性能达到了125.4PFLOPS,虽然TOP500没提,不过太湖一号应该是全球首个理论性能超过每秒10亿亿次的超级计算机了。
更为重要的是,神威太湖一号可不仅仅是性能强大。在美帝对我国高性能计算CPU实施封锁禁售策略之后,国内获得高性能计算芯片的来源基本被截断了(此前天河2号使用的是英特尔的Xeon系列处理器),由此神威太湖一号使用的全部是国产的CPU进行运算。据官方表示,中国是继美国、日本之后全球第三个采用自主CPU建成千万亿级别超级计算机的国家。
此外,TOP500排名第二的是此前已经连续6年蝉联冠军的天河2号,第三位的是美国的“泰坦”,第四到第十位分别是美国IBM公司的Sequoia红杉、日本K京、Mira、Trinity、Piz Daint、Hazel Hen及Shaheen II,他们都是老面孔了,只不过因为半路杀出的太湖一号而使得排名顺次下滑了一位。
最后需要指出的是:中国在TOP500超级计算机的总数方面也超过了美国,这次中国有167台入围TOP500,美国165台,欧洲105台,日本则只有29台。
先来简单说说神威太湖太湖之光计算机,它坐落于太湖之滨的无锡市国家超算中心内,此前大出风头的天河2号则是在中国广州的国家超算中心。神威计算机的研发单位是中国国家并行计算机工程技术研究中心,在太湖之光之前该中心研发过神威蓝光计算机,2012年安装于济南的国家超算中心内,当年的浮点性能为1千万亿次,现在来看性能早已经不算领先了,不过当时蓝光也是国内自主研发的HPC,使用的就是国产处理器。
在TOP500官网上可以找到太湖之光计算机的详细规格,其Linpack浮点性能为93PFLOPS,理论性能是125.4PLFOPS,而此前最强的天河2号性能分别是33.86LFOPS、54.9PFLOPS,也就是说太湖之光的实用性能几乎是天河2号的3倍,理论性能则是后者的2倍多,性能效率达到了74.2%,而天河2号只有55.8%。
更关键的是,在性能大幅飙升的情况下,太湖之光的功耗反而从天河2号的17.8MW降低到了15.37MW,计算下来其单位性能功耗达到了6GFLOPS/W,而以能效比著称的“泰坦”单位性能不过是2.1GLOPS/W。太湖之光的能效就算放到以节能而非性能为指标的Green500计算机中也是拔尖的,后者最新榜单中排名第一的单位性能不过是7GFLOPS/W,第二名的是5.3GLOPS/W,太湖之光能成为第二,而这两台计算机的性能与太湖一号差太远了,最强的Shoubu也不过605TFLOPS(0.65PFOPS)。
神威计算机使用的处理器来源于上海江南计算所,神威蓝光计算机使用的是申威SW1600处理器,2010年问世,架构体系源于DEC Alpha(这个是喷点啊,喷子要注意了,申威指令集不是国产的),根据资料来看它使用的还是65nm工艺,16个RISC 64位核心,频率在975MHz到1200MHz之间,1.1GHz频率下浮点性能140.88GFLOPS。
▲太湖之光使用的是申威SW26010处理器
太湖之光显然不可能再使用神威1600处理器了,这次使用的是江南计算所研发的申威SW26010处理器,架构体系还是Alpha 64位RSIC,乱序执行,频率1.45GHz,260个核心,整个处理器包括4个MPE(Management Processing Element)管理单元、4个CPE(Computing Processing Element)计算单元及4个MC内存控制器单元组成,其中CPE单元又由8x8阵列的64核心组成,所以总计是260个核心(4x64+4=260)。
这样1个处理器就是1个节点,每个节点8GB DDR3内存,256个节点组成1个超级节点,160个超级节点互联连接,因此总计是40960个节点,10649600个核心,内存容量1.3PB。
▲每张计算卡上有2个节点
▲每块主板上可以布置上下4张计算卡
▲32张卡组成1个超级节点,或者说256个节点
▲4个超级节点组成1组机柜
▲太湖之光的整体布局
关注最前沿的电子设计资讯,请关注“电子工程专辑微信公众号”。