Xilinx 推出专为 HPC 与大数据工作负载打造的史上最强大加速器卡—— Alveo U55C

FPGA开发圈 2021-11-17 12:07

突破性的 HPC 集群解决方案与简化的可编程性,支持在现有客户基础架构和网络上实现前沿计算的大规模性能扩展

自适应计算的领先企业赛灵思公司今日在SC21 全球超级计算大会上宣布,推出 Alveo™ U55C 数据中心加速器卡,以及一款基于标准、API-driven 的集群解决方案,用于大规模部署 FPGA。Alveo U55C 加速器可为高性能计算( HPC )和数据库工作负载提供卓越的单位功耗性能,同时还能通过赛灵思® HPC 集群解决方案简便扩展。

Xilinx Alveo™ U55C 数据中心加速器卡


全新 Alveo U55C 卡专为 HPC 和大数据工作负载而构建,是赛灵思史上最强大的 Alveo 加速器卡,能够提供 Alveo 加速器产品系列中的最高计算密度和 HBM 容量。结合赛灵思基于 RoCE v2 的全新集群解决方案,可令运行大规模计算工作负载的各类客户大获裨益,支持其利用现有数据中心基础架构和网络,实现强大的基于 FPGA 的 HPC 集群。


赛灵思执行副总裁兼数据中心事业部总经理 Salil Raje 表示:“现在,针对目标 HPC 工作负载扩展 Alveo 计算能力比以往更简单、更高效、更强大。在架构层面,以 Alveo 卡为代表的 FPGA 加速器,能够以最低成本为众多计算密集型工作负载提供最高性能。我们引入了基于标准的方法,其支持利用客户的现有基础架构和网络创建 Alveo HPC 集群。借助这一方法,我们正将这些主要优势大规模应用于任意数据中心。这是实现 Alveo 和自适应计算在数据中心更广泛应用的一次重大飞跃。”


专为 HPC 和大数据应用打造

Alveo U55C 卡融合了当前 HPC 工作负载所需的众多关键特性。它能提供更高的数据流水线并行度、卓越的存储器管理、优化的整个流水线的数据迁移,以及 Alveo 产品系列中最高的单位功耗性能。


Alveo U55C 卡采用单插槽、全高半长( FHHL )外形尺寸,最大功耗低至 150W。与前一代双插槽 Alveo U280 卡相比,Alveo U55C 提供了优异的计算密度,还将 HBM2 容量翻倍至 16GB。U55C 以更小的外形尺寸提供了更高的算力,有助于创建基于 Alveo 加速器的密集集群。它专为需要性能扩展的高密度流式数据、高 I/O 数学和大型计算问题而开发,例如大数据分析和 AI 应用。


通过利用 RoCE v2 和数据中心桥接技术,再结合 200 Gbps 带宽,这款 API-driven 的集群解决方案使 Alveo 网络可在性能和时延方面媲美 InfiniBand 网络,且无需对厂商加锁。MPI (信息传递接口)集成功能使 HPC 开发人员能以赛灵思 Vitis™ 统一软件平台.扩展 Alveo 数据流水线。利用现有开放标准和框架,现在能跨数百张 Alveo 卡上进行性能扩展,无需考虑服务器平台和网络基础架构,同时还能共享工作负载和存储器。


借助面向应用和集群的高层次编程,软件开发者和数据科学家能够运用 Vitis 平台,解锁 Alveo 和自适应计算的优势。赛灵思大力投入于 Vitis 开发平台和工具流程,旨在令不具备硬件专业知识的软件开发者和数据科学家,也能更容易地使用自适应计算。Vitis 平台支持 Pytorch 和 Tensorflow 等主流 AI 框架,还支持 C、C++ 和 Python 等高层次编程语言,使开发者能利用特定 API 和库来构建领域解决方案,或者使用赛灵思软件开发套件,从而在现有数据中心内轻松加速关键 HPC 工作负载。


HPC 客户用例

CSIRO 是澳大利亚的国立研究机构,拥有全球最大的射电天文望远镜天线阵列。CSIRO 现正使用 Alveo U55C 卡,用于其平方公里阵列( Square Kilometer Array )射电望远镜的信号处理。将 Alveo 卡部署为配备 HBM 的网络附加加速器,能够在整个 HPC 信号处理集群中实现大规模吞吐量。基于 Alveo 加速器的集群使 CSIRO 能够处理海量计算任务,从 13.1 万根天线中实时聚合、过滤、准备和处理数据。420 张 Alveo U55C 卡通过支持 P4 语言的 100Gbs 交换机实现完全联网,在整个信号处理集群中提供了 460GBs 的 HBM2 带宽。Alveo U55C 集群的处理性能可达 15Tb/s 的总吞吐量,功耗更低且更具成本效益,显著节省了成本。CSIRO 现正完成一项 Alveo 参考设计,以助力其他射电天文学或相邻产业获得同样的成功。


Ansys LS-DYNA 碰撞仿真软件几乎用于全球所有的汽车公司。安全性和结构系统的设计往往取决于模型性能,因其能以计算机辅助设计有限元方法( FEM )仿真来降低物理碰撞测试的成本。FEM 求解器是驱动具备数亿个自由度仿真的主要算法,而这些庞大的算法可以细分为更基本的求解器,如 PCG、稀疏矩阵、ICCG。与 x86 CPU 相比,利用超并行数据流水线在大量 Alveo 卡上进行性能扩展,LS-DYNA 能够实现超过 5 倍的性能加速。这能在一个 Alveo 流水线中提高单位时钟周期的工作效率,令 LS-DYNA 客户受益于突破性的仿真时间。


Ansys 战略合作伙伴总监 Wim Slagter 表示:“秉持不懈创新的精神,我们很高兴与赛灵思展开合作,在我们的 LS-DYNA 仿真应用中大幅加速有限元求解器,表征隐式有限元方法 90% 的负载特性。我们期待在赛灵思加速的助力下,实现支持创新者设计未来的使命。”


TigerGraph 是一家领先的图分析平台提供商,正使用多张 Alveo U55C 卡为两种最高效算法进行集群与加速,以驱动基于图的推荐和集群引擎。对于数据科学家而言,图数据库可谓一种颠覆性平台。图从信息孤岛中采集数据并重点关注数据间的关系。图领域的下一个前沿是实时查找答案。Alveo U55C 将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与基于 CPU 的集群相比,使用多张 U55C 卡扩展分析所提供的出色计算能力和存储器带宽,可将图查询速度提升高达 45 倍。质量评分也提升高达 35%,从而显著提升置信度,将误报几率降至低个位数。


产品供货与轻松评估

Alveo U55C 卡目前可通过 China.xilinx.com 和赛灵思授权分销商购买。该产品还可通过基于公有云的 FaaS( FPGA-as-a-Service,FPGA 即服务 )供应商进行简便评估,也可以通过选定的托管数据中心进行专属预览。集群解决方案现已提供专属预览,预计将于明年第二季度全面问世。


赛灵思将于本周举办的全球超级计算大会( SC21 )上展示 Alveo U55C 加速器卡及合作伙伴解决方案。欢迎注册 SC21,访问赛灵思虚拟展台。


关注我们

FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 188浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 212浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 679浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 211浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 165浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 65浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 337浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 87浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 150浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 126浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 684浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 141浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 199浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦