Xilinx 推出专为 HPC 与大数据工作负载打造的史上最强大加速器卡—— Alveo U55C

FPGA开发圈 2021-11-17 12:07

突破性的 HPC 集群解决方案与简化的可编程性,支持在现有客户基础架构和网络上实现前沿计算的大规模性能扩展

自适应计算的领先企业赛灵思公司今日在SC21 全球超级计算大会上宣布,推出 Alveo™ U55C 数据中心加速器卡,以及一款基于标准、API-driven 的集群解决方案,用于大规模部署 FPGA。Alveo U55C 加速器可为高性能计算( HPC )和数据库工作负载提供卓越的单位功耗性能,同时还能通过赛灵思® HPC 集群解决方案简便扩展。

Xilinx Alveo™ U55C 数据中心加速器卡


全新 Alveo U55C 卡专为 HPC 和大数据工作负载而构建,是赛灵思史上最强大的 Alveo 加速器卡,能够提供 Alveo 加速器产品系列中的最高计算密度和 HBM 容量。结合赛灵思基于 RoCE v2 的全新集群解决方案,可令运行大规模计算工作负载的各类客户大获裨益,支持其利用现有数据中心基础架构和网络,实现强大的基于 FPGA 的 HPC 集群。


赛灵思执行副总裁兼数据中心事业部总经理 Salil Raje 表示:“现在,针对目标 HPC 工作负载扩展 Alveo 计算能力比以往更简单、更高效、更强大。在架构层面,以 Alveo 卡为代表的 FPGA 加速器,能够以最低成本为众多计算密集型工作负载提供最高性能。我们引入了基于标准的方法,其支持利用客户的现有基础架构和网络创建 Alveo HPC 集群。借助这一方法,我们正将这些主要优势大规模应用于任意数据中心。这是实现 Alveo 和自适应计算在数据中心更广泛应用的一次重大飞跃。”


专为 HPC 和大数据应用打造

Alveo U55C 卡融合了当前 HPC 工作负载所需的众多关键特性。它能提供更高的数据流水线并行度、卓越的存储器管理、优化的整个流水线的数据迁移,以及 Alveo 产品系列中最高的单位功耗性能。


Alveo U55C 卡采用单插槽、全高半长( FHHL )外形尺寸,最大功耗低至 150W。与前一代双插槽 Alveo U280 卡相比,Alveo U55C 提供了优异的计算密度,还将 HBM2 容量翻倍至 16GB。U55C 以更小的外形尺寸提供了更高的算力,有助于创建基于 Alveo 加速器的密集集群。它专为需要性能扩展的高密度流式数据、高 I/O 数学和大型计算问题而开发,例如大数据分析和 AI 应用。


通过利用 RoCE v2 和数据中心桥接技术,再结合 200 Gbps 带宽,这款 API-driven 的集群解决方案使 Alveo 网络可在性能和时延方面媲美 InfiniBand 网络,且无需对厂商加锁。MPI (信息传递接口)集成功能使 HPC 开发人员能以赛灵思 Vitis™ 统一软件平台.扩展 Alveo 数据流水线。利用现有开放标准和框架,现在能跨数百张 Alveo 卡上进行性能扩展,无需考虑服务器平台和网络基础架构,同时还能共享工作负载和存储器。


借助面向应用和集群的高层次编程,软件开发者和数据科学家能够运用 Vitis 平台,解锁 Alveo 和自适应计算的优势。赛灵思大力投入于 Vitis 开发平台和工具流程,旨在令不具备硬件专业知识的软件开发者和数据科学家,也能更容易地使用自适应计算。Vitis 平台支持 Pytorch 和 Tensorflow 等主流 AI 框架,还支持 C、C++ 和 Python 等高层次编程语言,使开发者能利用特定 API 和库来构建领域解决方案,或者使用赛灵思软件开发套件,从而在现有数据中心内轻松加速关键 HPC 工作负载。


HPC 客户用例

CSIRO 是澳大利亚的国立研究机构,拥有全球最大的射电天文望远镜天线阵列。CSIRO 现正使用 Alveo U55C 卡,用于其平方公里阵列( Square Kilometer Array )射电望远镜的信号处理。将 Alveo 卡部署为配备 HBM 的网络附加加速器,能够在整个 HPC 信号处理集群中实现大规模吞吐量。基于 Alveo 加速器的集群使 CSIRO 能够处理海量计算任务,从 13.1 万根天线中实时聚合、过滤、准备和处理数据。420 张 Alveo U55C 卡通过支持 P4 语言的 100Gbs 交换机实现完全联网,在整个信号处理集群中提供了 460GBs 的 HBM2 带宽。Alveo U55C 集群的处理性能可达 15Tb/s 的总吞吐量,功耗更低且更具成本效益,显著节省了成本。CSIRO 现正完成一项 Alveo 参考设计,以助力其他射电天文学或相邻产业获得同样的成功。


Ansys LS-DYNA 碰撞仿真软件几乎用于全球所有的汽车公司。安全性和结构系统的设计往往取决于模型性能,因其能以计算机辅助设计有限元方法( FEM )仿真来降低物理碰撞测试的成本。FEM 求解器是驱动具备数亿个自由度仿真的主要算法,而这些庞大的算法可以细分为更基本的求解器,如 PCG、稀疏矩阵、ICCG。与 x86 CPU 相比,利用超并行数据流水线在大量 Alveo 卡上进行性能扩展,LS-DYNA 能够实现超过 5 倍的性能加速。这能在一个 Alveo 流水线中提高单位时钟周期的工作效率,令 LS-DYNA 客户受益于突破性的仿真时间。


Ansys 战略合作伙伴总监 Wim Slagter 表示:“秉持不懈创新的精神,我们很高兴与赛灵思展开合作,在我们的 LS-DYNA 仿真应用中大幅加速有限元求解器,表征隐式有限元方法 90% 的负载特性。我们期待在赛灵思加速的助力下,实现支持创新者设计未来的使命。”


TigerGraph 是一家领先的图分析平台提供商,正使用多张 Alveo U55C 卡为两种最高效算法进行集群与加速,以驱动基于图的推荐和集群引擎。对于数据科学家而言,图数据库可谓一种颠覆性平台。图从信息孤岛中采集数据并重点关注数据间的关系。图领域的下一个前沿是实时查找答案。Alveo U55C 将推荐引擎的查询和预测时间从数分钟缩短至数毫秒。与基于 CPU 的集群相比,使用多张 U55C 卡扩展分析所提供的出色计算能力和存储器带宽,可将图查询速度提升高达 45 倍。质量评分也提升高达 35%,从而显著提升置信度,将误报几率降至低个位数。


产品供货与轻松评估

Alveo U55C 卡目前可通过 China.xilinx.com 和赛灵思授权分销商购买。该产品还可通过基于公有云的 FaaS( FPGA-as-a-Service,FPGA 即服务 )供应商进行简便评估,也可以通过选定的托管数据中心进行专属预览。集群解决方案现已提供专属预览,预计将于明年第二季度全面问世。


赛灵思将于本周举办的全球超级计算大会( SC21 )上展示 Alveo U55C 加速器卡及合作伙伴解决方案。欢迎注册 SC21,访问赛灵思虚拟展台。


关注我们

FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 47浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 60浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 33浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 41浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 32浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 40浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 44浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 47浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 81浏览
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 40浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦