随着最新一代超级计算机日益与人工智能和云计算相结合,衡量这些机器的方式也在发生变化。在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上……

从科学模拟、可视化、数据分析再到机器学习,各种现代计算的工作负载正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。

仅靠处理器、网络或软件优化已经无法满足研究人员、工程师和数据科学家的最新需求。

数据中心取而代之,成为新的计算单元,因此企业必须关注整个技术堆栈。

全球最强系统的最新排名显示,在新一代超级计算机中,这种使用全栈方法的趋势还在持续。

在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上,而新增系统中90% 以上都采用了NVIDIA 的技术。对比6月份发布的TOP500榜单上342个系统(占榜单68%)使用NVIDIA技术,增长趋势明显。

NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势,占据了榜单排名前25名系统中的23套,与6月份持平。平均来看,采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。

来自微软的GPU加速Azure超级计算机在榜单上排名第十。这是基于云的系统首次跻身前10名,新一代云原生系统就此崭露头角。

人工智能正带来一场科学计算的革命。近年来,研究高性能计算和机器学习的论文数量激增,从2018年的约600篇增长到2020年的近5000篇。

包括HPL-AI和MLPerf HPC在内的新基准也强调了高性能计算和AI工作负载的持续融合。

作为一个融合了高性能计算和人工智能工作负载的新基准,HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算,同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。

MLPerf HPC基准适用于通过人工智能实现超级计算机模拟加速和增强的计算方式,主要被用来测试高性能计算中心天体物理学(Cosmoflow)、天气(Deepcam)和分子动力学(Opencatalyst)三大关键工作负载的性能表现。

NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现,并推动了科学突破。

让我们来具体看一看NVIDIA是如何助力超级计算机实现性能提升的。

加速计算

GPU的并行处理能力再加上超过2500个GPU优化应用程序,在多数情况下可以让用户把高性能计算任务的时间从几周减少到几个小时。

NVIDIA一直在优化CUDA-X库和GPU加速应用程序,所以用户如果发现自己的GPU架构性能突然有了提升也很正常。

因此,应用范围最广的科学应用程序(我们称之为“黄金套件”)的性能在过去6年里提高了16倍,而且还在不断提升。

图注:全栈创新带来顶级高性能计算、人工智能和机器学习应用程序的16倍性能提升。

为帮助用户快速提升性能,NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序即可。

高性能计算与人工智能融合

人工智能在高性能计算中的应用能帮助研究人员加快模拟速度,同时保持传统模拟方法的准确性。

为此,越来越多的研究人员开始利用人工智能来加快研究的速度,比如今年超算领域最有声望的戈登·贝尔奖(Gordon Bell prize决赛的四组晋级团队。各大企业正在竞相建造E级人工智能计算机,以支持这种融合高性能计算和人工智能的新模式。

一些相对较新的基准(如HPL-AI和MLPerf HPC)也印证了这一趋势,强调了高性能计算和AI工作负载的持续融合。

为推动这一趋势,上周NVIDIA推出了一系列用于高性能计算的先进的新的库和软件开发工具套件。

图是现代数据科学中的一个关键数据结构。通过一个名为深度图库(DGL)的新型Python包,用户现在可以把图投影到深度神经网络框架中。

NVIDIA Modulus构建并训练了一个内嵌物理信息的机器学习模型,可以用来学习并遵循物理定律。

NVIDIA推出了三个新库:

  • ReOpt – 可提高规模高达10万亿美元的物流行业的运营效率。
  • cuQuantum – 可加速量子计算研究。
  • cuNumeric – 为Python社区的科学家、数据科学家、机器学习和人工智能研究人员加速NumPy。

NVIDIA的虚拟世界模拟和3D工作流协作平台NVIDIA Omniverse负责把一切整合到一起。

Omniverse可用来模拟仓库、工厂、物理和生物系统、5G边缘、机器人、自动驾驶汽车甚至是虚拟形象的数字孪生。

NVIDIA上周宣布,将利用Omniverse构建一台名为Earth-2的超级计算机,通过创建一个数字孪生地球来预测气候变化。

云原生超级计算

随着超级计算机在数据分析、人工智能、模拟和可视化方面承担越来越多的工作负载,CPU不得不在大型复杂的系统上支持更多的通信任务。

DPU(数据处理器)可以卸载多种操作,有效减轻这一压力。

作为一个完全集成的片上数据中心平台,NVIDIA BlueField DPU可以卸载和管理数据中心的基础设施任务,释放主机的处理器资源,从而实现更强的安全性和更高效的超级计算编排工作。

与NVIDIA Quantum InfiniBand平台相结合,该架构可提供最佳裸机性能,同时原生支持多节点租户隔离。

NVIDIA的Quantum InfiniBand平台提供可预测的裸机性能隔离。并且采用零信任安全防护,因而这些新系统也更加安全。

BlueField DPU将用户应用与基础设施任务隔离开来。最新的BlueField软件平台NVIDIA DOCA 1.2支持下一代分布式防火墙和更广泛的线速数据加密。而NVIDIA Morpheus则会假设入侵者已经进入数据中心,将利用基于深度学习的数据科学来实时检测入侵者的活动。

新的网络技术则会加速上述这些趋势场景。

上周NVIDIA还发布了NVIDIA Quantum-2。这是一个400Gbps InfiniBand平台,由Quantum-2交换机、ConnectX-7网卡、BlueField-3 DPU以及用于新网络架构的软件组成。

NVIDIA Quantum-2提供了裸机高性能和安全多租户优势,可以让下一代超级计算机实现安全性、云原生以及更高的效率。

**基准应用AmberChromaGROMACSMILCNAMDPyTorchQuantum Espresso;

Random Forest FP32TensorFlowVASP | GPU节点双插槽CPU4P100V100A100 GPU

责编:Luffy Liu

阅读全文,请先
您可能感兴趣
CXL的目标主要是为了解决CPU和设备、设备和设备之间的内存鸿沟,解决内存分割造成的较大浪费、不便和性能下降。目前来看,高性能计算、存储加速、AI加速、大规模虚拟化,是最适于CXL应用的领域。
对于股价波动的原因,寒武纪表示,除了公司经营层面的因素外,还可能受到其他因素的影响。寒武纪还提醒投资者,应甄别信息来源,具体情况以公司公告为准。
Xockets认为,英伟达凭借侵犯该企业专利的DPU产品垄断了AI GPU服务器市场,而微软则垄断了支持GPU的AI平台领域。此外,Xockets还称这两家科技公司就授权费建立了垄断同盟。
OpenAI认为,在美国建设更多基础设施对于推进人工智能并使其优势广泛普及至关重要。
英伟达的CUDA生态系统和高性能AI GPU仍将作为核心竞争力,但要支撑其像以往那样的飞速的发展态势,必然要面临更大的挑战,或者已到增长的天花板。
CXL的内存缓存一致性不但允许CPU和加速器共享内存资源,还能实现部署新的内存层,帮助弥合主内存和固态硬盘存储之间的延迟差距。这些新内存层会增加带宽的容量,提供更高效率,并降低总拥有成本。这就是业界正在坚定地将CXL作为处理器、内存和加速器的高速缓存一致性互连技术的根本原因所在。
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
文|沪上阿YI路特斯如今处在一个什么样的地位?吉利控股集团高级副总裁、路特斯集团首席执行官冯擎峰一直有着清晰的认知:“这个品牌的挑战依然非常大。首先,整个中国市场豪华汽车整体数据下滑了30%~40%,
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
‍‍近期,IC 设计大厂联发科宣布了2024年上半年度的员工分红计划,与8月份薪资一起发放。据外界估算,按照上半年税前盈余约648.66亿新台币(约 144.42 亿元人民币)进行估算,此次分红总额接
天眼查信息显示,天津三星电子有限公司经营状态9月6日由存续变更为注销,注销原因是经营期限届满。该公司成立于1993年4月,法定代表人为YUN JONGCHUL(尹钟撤),注册资本约1.93亿美元,
会议预告向世界展示中国最具创新力、领导力和品牌化的产品与技术!9月27号,“第6届国际移动机器人集成应用大会暨复合机器人峰会”将在上海举行,敬请关注!逐个击破现有痛难点。文|新战略半导体行业高标准、灵
点击蓝字 关注我们准确的图像深度和细节对于安保摄像头、人脸识别设备和机器视觉设备至关重要,可以提供更真实且高保真的观看体验。为在具体应用中达到这一效果,需要具备某些图像传感器功能,其中之一就是自适应局
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金
在苹果和华为的新品发布会前夕,Counterpoint公布了2024年第一季度的操作系统详细数据,数据显示, 鸿蒙操作系统在2024年第一季度继续保持强劲增长态势,全球市场份额成功突破4%。在中国市场