对于大规模数据处理,最佳性能不仅取决于原始计算能力,还取决于高存储器带宽。因此,全新 AMD Alveo™ V80 计算加速卡专为具有大型数据集的内存受限型应用而设计,这些应用需要 FPGA 硬件灵活应变能力以实现工作负载优化。Alveo V80 加速卡现已量产出货,其能提供较之上一代加速卡至高 2 倍的带宽与计算密度1,并为使用 AMD Vivado™ 设计套件的 FPGA 设计人员提供简化的开发流程。
图1:Alveo V80 计算加速卡
这款全新加速卡采用全高、3/4 长( FH¾L )尺寸规格,由 AMD Versal™ HBM 自适应 SoC 提供支持,具备 2,600,000 个 LUT 逻辑单元的 FPGA 架构、10,848 个 DSP 计算逻辑片以及 820 GB/s 的存储器带宽,从而助力克服性能瓶颈。
与前代产品 AMD Alveo U55C 计算加速卡相比,Alveo V80 的逻辑密度至高翻倍、存储器带宽至高翻倍且网络带宽可高至 4 倍1,可以实现强大的计算集群,同时还能优化卡、服务器数量以及机架空间。
Alveo V80 卡的硬件灵活性允许跨不同的自定义工作负载进行广泛应用。作为一款 4x200G 网络附接加速卡,该卡可以实时处理大量传入数据,避开 GPU 遇到的 PCIe® 连接限制。
图 2:大规模加速计算密集型内存受限工作负载
Alveo V80 加速卡可通过以太网扩展到数百个节点实现计算集群,非常适合一系列高性能计算应用,包括基因组测序、分子动力学和传感器处理。在网络安全方面,内置 400G 加密引擎和 600G 以太网硬块,加之 FPGA 的硬件灵活性,令 Alveo V80 加速器适用于线速数据包检测和 AI 支持的异常检测。
该加速卡还非常适合计算存储和数据分析,能够在同一张卡上集成压缩和查询加速,从而增加有效存储容量,同时更快获得洞察。此外,它还适合于各种金融科技应用,包括策略回测、期权定价以及金融建模与仿真。
联邦科学与工业研究组织( CSIRO )是澳大利亚的国立研究组织,其参与建造了世界上最大的射电天文学天线阵列,该天线阵列目前包含 420 张 Alveo U55C 加速器卡用于处理无线电波,以研究早期宇宙并探索星系演化。
CSIRO计划借助 Alveo V80 加速卡缩减占板面积与成本,并将所需加速卡的数量精简多达 66%,同时应对来自望远镜 131,000 个天线的新信号处理任务。考虑到卡、服务器、机架空间和功耗的潜在减少,每卡算力的跃升预计可带来至高 20% 总拥有成本( TCO )下降2。
CSIRO 空间与天文学部研究工程师 Grant Hampson 表示:“我们起初采用 Alveo 产品线是因为它能够实时处理大量传感器数据。对于我们的下一代波束成形器和相关器来说,降低总拥有成本势在必行。Alveo V80 加速卡是对上一代 Alveo U55C 卡的技术阶跃提升,以经济高效的占板面积提供了紧凑、节能的解决方案2。”
图 3:AMD Alveo V80 加速卡实现的预估传感器处理和 TCO 节省2(参见尾注 ALV-162)
Alveo V80 加速卡经由 Alveo Versal 示例设计( AVED )完全可为传统硬件开发人员使用,现已在 GitHub 上提供。AVED 利用传统 FPGA 和 RTL 流程简化了硬件启动,并且基于常见的 Vivado 工具流程。示例设计采用在 AMD Versal 自适应 SoC 上实现并专门针对 Alveo V80 加速器卡的预构建子系统,提供了高效的起点。
在系统层面,Alveo V80 计算加速卡简化了系统集成并提供了快速的量产路径。通过使用预先验证的部署卡,设计团队可以避开 PCB 集成、库存管理和产品生命周期管理任务。
Alveo V80 已投入量产,现可从 AMD 和授权经销商处购买。敬请访问 www.amd.com/v80,了解全新加速卡如何为您的基础设施重新定义计算;阅读产品简介和数据一览以了解详细规格,或联系专家以获取更多信息。
1:基于截至 2024 年 4 月公开发布的 AMD Alveo 产品选型指南中发布的规格。(ALV-13)。
2:基于 CSIRO 在 2023 年 10 月进行的独立“早期试用体验”性能和成本分析估算,比较了 420 张 Alveo U55C 加速卡的现有实施与 140 张 AMD Alveo V80 加速卡的预期实施。预计总拥有成本以三年期计算,包括电力和冷却运营支出的预计成本。所有性能和成本节省声明均为 CSIRO 提供的估算值,未经 AMD 验证。性能和成本效益受各种假设和变量影响,且可能基于系统配置和其他因素而发生变化。结果仅针对 CSIRO,可能不具典型性。有关更多详细信息,请参见图 (3) (ALV-16)。