与前代产品AMD Alveo U55C计算加速卡相比,Alveo V80的逻辑密度至高翻倍、存储器带宽至高翻倍,且网络带宽可高至4倍,可以实现强大的计算集群,也不再需要DDR4或其他外部芯片,从而优化了卡、服务器数量以及机架空间。

对于“大型数据集和内存密集型工作负载”处理来说,最佳性能不仅取决于原始计算能力,还取决于高存储器和网络接口带宽。

那么,什么是“大型数据集和内存密集型工作负载”呢?目前来看,主要是指高性能计算应用,包括基因组测序、分子动力学和传感器处理;网络安全领域的线速数据包检测和AI支持的异常检测;金融科技应用,包括策略回测、期权定价以及金融建模与仿真;AI计算领域,包括推荐引擎和大语言模型等等。

AMD自适应和嵌入式计算事业部(AECG)高级产品线经理Shyam Chander日前在Alveo™ V80计算加速卡发布会上,用下图对“大数据集工作负载通常受限于内存和网络访问”进行了形象的比喻。可以看到,在传统处理器架构中,CPU+FPGA和PCIe的带宽远高于DDR内存和网络接口可以提供的带宽,导致无论是内存还是网络,都会出现瓶颈。

大规模加速计算密集型内存受限工作负载

大型数据集和内存密集型工作负载打造

Alveo™ V80计算加速卡是AMD提供的破局之道。该卡采用全高、3/4长(FH¾L)尺寸规格,由AMD Versal™ HBM自适应SoC提供支持,具备2,600,000个LUT逻辑单元的FPGA架构、10,848个DSP计算逻辑片以及820GB/s的存储器带宽,专为具有大型数据集的内存受限型应用而设计。此外,V80还包括一个32GB的DDR4 DIMM扩展插槽,并支持PCle Gen5接口,64G传输速率是第四代的2倍。整卡功率300W,采用被动散热,总热设计功耗TDP则取决于器件和服务器。

与前代产品AMD Alveo U55C计算加速卡相比,Alveo V80的逻辑密度至高翻倍、存储器带宽至高翻倍,且网络带宽可高至4倍,可以实现强大的计算集群,也不再需要DDR4或其他外部芯片,从而优化了卡、服务器数量以及机架空间。

了解加速卡的人士应该比较清楚,通常情况下使用加速卡时都需要和本地CPU进行连接,但这会限制加速卡的数量。而如果采用类似V80这样的网络附接加速卡,相较于传统加速器,能够在以下四方面带来优势:低时延处理传入的网络数据、避开至加速器的瓶颈、消除分立式网络接口卡、并实现每服务器的卡数和计算密度最大化。

如果映射到架构层面,这其实就是CPU/GPU拥有的传统架构和自适应计算拥有的灵活应变架构之间的不同。“传统架构是固定的缓存层次结构,用于数据的读写和输入,在这个过程中不规则的访问模式会引起潜在的低效率。”Shyam Chander指出,灵活应变的存储器层次架构是在计算附近分配内存,实现降低延迟和低功耗,而且可以灵活适应自定义的数据设计和数据建议。

从“射电天文天线阵列”到“金融建模”

联邦科学与工业研究组织(CSIRO )是澳大利亚的国立研究组织,其参与建造了世界上最大的射电天文学天线阵列,该天线阵列目前包含420张Alveo U55C加速器卡用于处理无线电波,以研究早期宇宙并探索星系演化。

CSIRO计划借助Alveo V80加速卡缩减占板面积与成本,并将所需加速卡的数量精简多达66%,同时应对来自望远镜131,000个天线的新信号处理任务。考虑到卡、服务器、机架空间和功耗的潜在减少,每卡算力的跃升预计可带来至高20%总拥有成本(TCO)下降。

下图呈现了总拥有成本降低的估算情况——左侧是420张AMD Alveo U55C加速卡,需要21台服务器,每年约是520千瓦时;右侧是140张AMD Alveo V80加速卡,服务器数量缩减为14台,每年大概是236千瓦时。加速器数量减少至高66%,服务器减少至高33%,功耗降低至高55%,总拥有成本也降低至高21%。

AMD Alveo V80加速卡实现的预估传感器处理和TCO节省

另外一个用例来自压缩与数据分析功能的服务器存储节点,主要功能就是利用FPGA架构和AMD压缩IP可扩展存储节点,并可解压缩,查询加速等。从总拥有成本的角度来分析,比如10Pb数据存储,没有压缩时需要55台服务器,1303个SSD驱动器,每年约427千瓦时的功耗。如果进行压缩,同样是10Pb数据只需要21台服务器,504个SSD驱动器,每年能耗约233千瓦时,使用42张AMD AlveoTM V80卡进行压缩,总拥有成本三年以上至高可以达到56%的降低,而且服务器的数量、服务器成本以及功耗也都有非常显著的降低。

金融科技领域的金融建模和算法交易,是现在很多企业趋之若鹜的一种用例。简单而言,用户在建模、仿真与回测的用例场景中,主要依靠FPGA架构和DSP用于密集计算,HBM用于大数据集、历史定价数据。而在低时延算法交易中,752Mb的RAM用于定价数据、交易记录,HBM则用于订单信息。

一切为了简化开发

Alveo V80加速卡经由Alveo Versal示例设计(AVED)完全可为传统硬件开发人员使用,现已在GitHub上提供。AVED利用传统FPGA和RTL流程简化了硬件启动,并且基于常见的Vivado工具流程。示例设计采用在AMD Versal自适应SoC上实现并专门针对Alveo V80加速器卡的预构建子系统,提供了高效的起点。

在系统层面,Alveo V80计算加速卡简化了系统集成并提供了快速的量产路径。通过使用预先验证的部署卡,设计团队可以避开PCB集成、库存管理和产品生命周期管理任务。 

总体而言,与其它类型的加速卡相比,Alveo系列主要针对内联网络、实时处理类型的应用,低时延、灵活应变、各个节点的可扩展性是主要诉求,FPGA的自适应SoC就是极好的解决方案,用户可以像面对乐高玩具一样,对非常丰富的存储器架构资源进行自定义拼装和使用。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣
随着先进芯片设计格局的迅速演变,新的验证和确认方法变得至关重要。众多前沿设计由系统公司在先进的工艺节点下完成,具有大量的逻辑门,并依赖于复杂的片上网络、SRAM池以及精密的电源、时钟和测试架构。
Altera正式宣布从英特尔分拆,并升起了象征独立的公司旗帜。Altera的独立对于整个FPGA行业来说是一个重要的里程碑事件,这将使Altera能够更加专注于技术创新和产品开发,从而推出更多符合市场需求的新产品,独立后的Altera也将有机会与其他FPGA厂商展开更激烈的市场竞争......
据台湾工商时报报道,英伟达(Nvidia)已正式成立ASIC(应用特定集成电路)部门,并计划在中国台湾招募上千名芯片设计、软件开发及AI研发人员。
莱迪思在最近的开发者大会上发布了最新的Nexus 2平台和对应的小型FPGA产品。这次我们有机会看看相比竞品,Nexus 2是怎么做到低功耗和高性能的...
莱迪思(Lattice)正在考虑对英特尔旗下的FPGA业务Altera发起收购要约,对于国产FPGA行业而言,这一消息无疑带来了新的挑战和机遇。尽管在技术实力、产品性能及市场份额等方面与国际巨头尚有一定差距,但近年来国产FPGA的发展势头不容小觑……
继今年4月AMD宣布推出第二代Versal AI Edge系列和Versal Prime系列之后,日前,该公司又宣布推出第二代Versal Premium系列,使得第二代Versal系列的版图更趋完整。
TEL宣布自2025年3月1日起,现任TEL中国区地区总部——东电电子(上海)有限公司高级执行副总经理赤池昌二正式升任为集团副总裁,同时兼任东电电子(上海)有限公司总裁和东电光电半导体设备(昆山)有限公司总裁。
预计在2025年,以下七大关键趋势将塑造物联网的格局。
领域新成果领域新成果4月必逛电子展!AI、人形机器人、低空飞行、汽车、新能源、半导体六大热门新赛道,来NEPCON China 2025一展全看,速登记!
本次股东大会将采取线上和线下相结合的混合形式召开,股东们可选择现场出席或线上参会。
小米宣布全球首发光学预研技术——小米模块光学系统,同时发布官方宣传视频。简单来说,该系统是一个磁吸式可拆卸镜头,采用定制M4/3传感器+全非球面镜组,带来完整一亿像素,等效35mm焦段,配备f/1.4
千万级中标项目5个,百万级中标项目12个。文|新战略根据公开信息,新战略移动机器人产业研究所不完全统计,2025年2月,国内发布35项中标公告,披露总金额超15527.01万元。(由新战略移动机器人全
倒计时1天,『2025年行家说开年盛会(第8届)取势行远·LED显示屏及MLED产业链2025年蓝图峰会』明天正式启幕。本届开年盛会特设「2025年产品/技术/市场蓝图计划」、「COB」、「MiP及玻
回顾2024年,碳化硅和氮化镓行业在多个领域取得了显著进步,并经历了重要的变化。展望2025年,行业也将面临新的机遇和挑战。为了更好地解读产业格局,探索未来的前进方向,行家说三代半与行家极光奖联合策划
市值一夜蒸发2900亿”作者|王磊编辑|秦章勇特斯拉陷入一个怪圈。马斯克的权力越来越大,但特斯拉的股价却跌得越来越惨。就在昨天,特斯拉股价又下跌了4.43%,一天之内蒸发406亿美元,约合人民币295
从上表可知,2024年前三季度全球40强PCB企业总营收约416.7亿美元,同比增长7.6%。其中,营收排名第一位的是臻鼎科技(36.05亿美元),排名第2~5位的分别是欣兴电子(26.85亿美元)、
‍‍近几年,随着Mini/Micro LED技术的高速发展,LED产业呈现几大发展趋势,如LED显示间距持续缩小、LED芯片持续微缩化、产品、工艺制造环节更为集成,以及RGB 封装与COB 降本需求迫
前不久,“行家说三代半”报道了长安汽车采用氮化镓OBC车载电源(点击查看)。近期,比亚迪、广汽埃安两家车企又相继公布了氮化镓应用进展:比亚迪&大疆:车载无人机采用氮化镓技术3月2日,比亚迪、大疆共同发
高通又放大招了!3月3日,也就是MWC世界移动通信大会的第一天,高通正式宣布,推出自家的最新5G调制解调器及射频解决方案——高通X85。高通X85对于高通X85的发布,行业早有关注。因为高通的手机So
2025年3月11-13日,亚洲激光、光学、光电行业年度盛会的慕尼黑上海光博会将在上海新国际博览中心-3号入口厅N1-N5,E7-E4馆盛大召开。本次瑞淀光学展示方案有:■ MicroOLED/Min