官宣丨Marvell ThunderX 平台成功整合NVIDIA CUDA-X AI 与 HPC 软件框架

Marvell美满 2019-11-22 00:00

Marvell 近日宣布公司旗下基于 Arm® 的 ThunderX® 系列服务器处理器已实现对 NVIDIA GPU 的支持。继 6 月份 NVIDIA 宣布将 CUDA 引入 Arm 架构相之后,Marvell 着手与NVIDIA协作,开始 将 CUDA-X AI™ 与 HPC 库、GPU 加速型 AI 框架和软件开发工具引入 ThunderX 平台。Marvell 基于 Armv8-A 的 64 位服务器处理器 ThunderX2®,其计算性能与内存带宽,与 NVIDIA GPU 并行处理能力相结合,开辟出了惊人的高能效百万兆级运算路径。


人工智能 (AI) 与机器学习 (ML) 继续成为满足云计算与网络边缘计算数据中心服务器需求的关键技术。为解决人工智能与机器学习日益增长的工作负载,以及科研领域最具挑战性和复杂的问题,超级计算机需配备经过优化的处理器,提供领先的吞吐量、应用程序时延和功耗。 

Nvidia CEO黄仁勋在本周超级计算大会SC19的主题演讲中,谈到Nvidia GPU为Arm超级计算加速的最新进展,其中对基于Marvell处理器的服务器平台给予了重要认可,并现场展示了基于Marvell Thunder X2处理器的高性能参考设计平台。

ThunderX2 起初专注于 GROMACS、NAMD、MILC 与 LAMMPS 等计算科学应用程序,其配置就已展现出超乎意料的性能。 此次它又获得 GPU 的支持,使其能够更加快速、高效的体现出联合优势。

“ThunderX2 服务器处理器对 NVIDIA GPU 的支持,创造出了显著的差异化价值,充分满足百万兆级运算时代对性能和功耗的要求。”Marvell 半导体公司副总裁兼服务器处理器事业部总经理 Gopal Hegde 说道,“NVIDIA GPU 加速对 Arm 架构的支持将进一步拓展 ThunderX2 生态系统在 HPC、云计算和边缘计算市场的应用,促进底层固件,系统软件以及独立商业软件等各类商业应用程序。”


“CUDA 加速在 ThunderX2 对处理器的支持是一个重大里程碑,标志着 高能效和高性能的 Arm 架构正式进军软件基础架构市场 。”Arm 高级副总兼基础架构事业部总经理 Chris Bergey 说道,“对于整个行业生态系统的创新,其广度和深度将为现有或者未来的边缘计算、云计算等 GPU 负载提供一个轻松的迁移路径和强有力的支持。”


经NVIDIA GPU 加速的Arm计算架构为全球客户在构建下一代 AI 赋能超级计算机提供更多的选择 。”NVIDIA 副总裁兼加速计算总经理 Ian Buck 表示,“NVIDIA 无与伦比的 AI 与 HPC 平台和 Marvell 强大的基于 Arm 的 ThunderX2 服务器处理器的结合已展现出备受瞩目的应用程序性能。”


生态系统支持


ThunderX2 服务器处理器是应用范围最广的基于 Armv8-A 的服务器处理器,其生态系统覆盖超过 100 家合作伙伴企业,涉及商业、开源和行业标准等各个领域。 借由 NVIDIA 的完整软件套件支持,部署在ThunderX2 系统上超过 600 个 HPC 应用程序和 AI 框架将得以提速。


“与 Marvell 合作,通过 SC8000 计算加速扩展平台为业界提供具备行业领先性能的 ThunderX2 处理器,将数据中心的 AI 功能应用于各类边缘应用程序。”One Stop Systems 首席执行官 Steve Cooper 称,“ SC8000 是业内首个将基于 NVLink 的 NVIDIA Tesla GPU 与 Arm 服务器整合的解决方案。 将基于 Arm 的架构并入我们的解决方案,将扩展针对客户的 AI on the Fly 边缘设备的应用场景。”


“Red Hat 与 Marvell 在 Arm 服务器生态系统方面的合作历史源远流长,有助于 为企业 Arm 架构提供开放的全行业标准 。”Red Hat 高级副总裁兼首席技术官 Chris Wright 表示,“将 NVIDIA GPU 用于配备有 CUDA-X 软件开发工具包与库的 ThunderX 系统,方便客户在 Red Hat 平台上选择运行 HPC、人工智能与机器学习应用程序架构。”


“在近期的 Catalyst UK 部署中,SUSE 与 Marvell 在 HPC 方面的强强联手取得了显著成功。”SUSE 副总裁兼产品及解决方案管理者 Daniel Nelson 说道,“在本次合作中,我们很高兴看到Marvell ThunderX2 增加了对 NVIDIA GPU 和 HPC 套件、人工智能与机器学习应用程序的支持。 SUSE 期待推动 Arm 生态系统的进一步优化和软件基础架构支持 ,并将在丹佛市举办的 SC19 行业会议上展出 GPU 支持系统。”

配备 NVIDIA GPU 支持系统的 Marvell ThunderX 平台目前正在科罗拉多州丹佛市举办的“高性能计算、网络、存储和分析国际会议 (SC19)”上展出,Marvell 摊位号:349


戳“阅读原文”,了解关于Marvell ThunderX2的更多信息。


微信ID:Marvell20
长按左侧二维码关注
Marvell美满 Marvell公司、产品、业务进展以及相关行业信息的发布与分享。
评论
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 106浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦