身材虽小，却为数据中心加速提供大智慧-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

在当前的超大规模数据中心中广泛部署FPGA产品并不是什么新鲜事。得益于自身所特有的可重配置和可重编程特性，FPGA能为复杂多变的超大规模数据中心应用提供所需的灵活性、应用广度和功能速度，而这些正是传统CPU和定制ASIC所无法企及的，也是阿里巴巴、亚马逊、百度、Facebook、谷歌、微软和腾讯这些超大型数据中心公司最为敏感的问题。

继2018年底推出面向数据中心加速的自适应计算加速卡Alveo U250/U280后，赛灵思(Xilinx)持续扩展产品组合的步伐一直没有停歇，最新推出的Alveo U50系列，则被赛灵思数据中心业务部产品规划和市场营销总监Jamon Bowen称之为“业界首款可支持第四代PCIe(PCIe Gen 4)的轻量级自适应计算加速卡。”

赛灵思Alveo产品阵容

快速、灵活应变和方便易用是U50的核心特征。与U200/U250/U280系列相同，Alveo U50卡同样采用赛灵思UltraScale+架构，支持第四代PCIe和CCIX互联标准，并率先使用半高半长的外形尺寸和低于75瓦的低包络功耗。8GB高带宽存储器(HBM2)和QSFP端口则分别提供了超过400Gbps的数据传输速率和高达每秒100Gbps的网络连接速率。此外，高速网络I/O还支持包括NVMe-oF解决方案(NVM Express over Fabrics)、解耦计算存储(Computionial Storage)和专业金融服务在内的各种前沿应用。

Alveo U50系列加速卡

为什么加速在计算、网络和存储领域受到越来越多的重视？Jamon Bowen对此解释称，一方面是因为以AlexNet、GoogleNet、DenseNet为代表的领域专用架构，需要不同的硬件架构和对应的算法来实现高吞吐量、低时延和高效率；另一方面，数据中心要优化性能，需要定制数据路径、定制精度和定制存储器层级，可编程硬件在定制化加速方面具备天然优势。

以GZIP压缩为例，ZS、ZT、LZ、微软Zipline等标准层出不穷，这就需要硬件不但能够加速，还可以实现编程，一旦出现新的算法迭代，厂商就能够充分利用 FPGA的灵活性实现快速部署。

不过，数据中心开发者对FPGA编程始终带有抱怨。为此，Alveo提供了开放的平台和开发环境，让开发者能够更加便捷地使用。这意味着，Alveo平台上的开发者越多，带来的云和相关产品就会越多，从而逐步形成一个全堆栈的解决方案，继而实现原来只有在软件部分才有可能实现的硬件IP的灵活应变能力。数据显示，自2018年10月推出Alveo以来，目前已发布的应用和培训开发者数量分别是当初的2倍和4倍。

Alveo解决方案堆栈

具体来说，Alveo U50的加速解决方案具体可应用于广泛领域，其中包括以下5个领域：

1、深度学习推理加速(如语音翻译)：与纯GPU相比，Alveo U50在语音翻译的性能可降低多达25倍的延迟，提高10倍的吞吐量，并能显著提高每节点的功耗效率。

2、数据分析加速(如数据库查询)：运行TPC-H查询基准时，Alveo U50与存储器内的CPU相比，它每小时的吞吐量可提升4倍，还可将运营成本降低3倍。

3、计算存储加速(如压缩)：与仅使用CPU的节点相比，Alveo U50将每个节点的成本降低了40%，同时它还可将压缩/解压的吞吐量提高20倍，实现更快的Hadoop(分布式计算)和大数据分析。

4、网络加速(如电子交易)：与仅使用CPU的10微秒延迟相比，Alveo U50能将延时降低20%，交易时间低于500纳秒。

5、财务建模(网格计算)：运行蒙特卡罗模拟(Monte Carlo simulation)时，Alveo U50的功耗效率与GPU相比提高7倍，具有更快的分析和判断效率、确定性延时和更低的运营成本。

“提供充分商业化的标准化产品，是调动IT行业积极性最重要的因素之一。”Jamon Bowen说Alveo是一个非常标准化的产品，所以开源框架很容易与Kubernetes和docker这类免费的微服务内容平台实现对接，比如Kubernetes中就直接有插件可以在系统内部反映出有Alveo加速硬件，开发者也可以把Alveo和docker配合起来，通过对Alveo进行编程而在系统中体现出加速应用。

为大规模部署而打造的堆栈

反之，如果没有这样一个标准化的产品配置，客户可能需要花费大量的投资才能够实现这样一个功能，这对于一些超大规模数据中心的应用来说是非常有必要的，既可以在云端，也可以用Alveo在本地进行加速，而且是一个非常开放式的框架，可以进行全面的加速。

本文为EET电子工程专辑原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

也出芯片也出应用卡，Xilinx 和 NVIDIA 殊途同归，争相推出自家的终端产品卡，作为上游芯片商，原则上一般不跟下游品牌厂商抢生意，这是个界限，貌似现在这个界限没了

阅读全文，请先

处理器/DSP

您可能感兴趣

日本Rapidus将与博通合作试制2纳米芯片，最快6月提供芯片原型

Rapidus将与博通合作分享其2纳米制程芯片原型，并推动芯片生产的外包。一旦博通确认了芯片性能，Rapidus将能够向博通的客户提供芯片。

传Imagination停止RISC-V处理器核心开发，增强GPU和AI产品投资

尽管Imagination在RISC-V领域取得了一定的成就，但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作，并将重心转向其擅长的GPU和AI领域......

美国AI出口管制草案被批评：过度监管将把芯片市场拱手让给中国

Ken Glueck认为，美国2800亿美元的芯片法案所取得的成就，将被出口管制框架夺走，“因为在一项IFR中，它成功地将美国公司的全球芯片市场缩小了80%，并将其交给了中国。”

笔记本高性能CPU来了：酷睿Ultra二代处理器产品线补全

Intel在CES上发布了面向笔记本的酷睿Ultra 200H, 200HX, 200U系列，基本完善了这一代酷睿Ultra处理器产品线...这也是面向高性能笔记本的酷睿Ultra二代处理器初次亮相。

英特尔在CES 2025亮相首款Intel 18A芯片，2025年下半年量产

英特尔临时联席CEO Michelle Johnston还表示，“英特尔会在2025年及以后继续增强AI PC产品组合，向客户提供领先的英特尔18A产品样品，并在2025年下半年量产”。

GeForce RTX 50系显卡发布：三倍于40系GPU的算力

NVIDIA刚才在CES上发布了GeForce RTX 50系显卡，据说这一代的5070就能达到上代4090的性能水平...

为什么翻新机的价格在上涨？

• 目前，iPhone在翻新市场中是最热门的商品，并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展，其平均销售价格（ASP）现已超过新手机。 • 新兴市场是增长的最大驱动力，消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年，这些翻新机平均销售价格将首次超过新手机。

2024三季度全球扫地机器人市场出货增长持续，卷势不减

从全球厂商竞争来看，三季度凭借多个新品发布，石头科技市场份额提升至16.4%,连续两季度排名全球第一……

摩尔斯微电子推出MM8108：全球体积最小、速度最快、功耗最低、传输距离最远的Wi-Fi芯片

最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准，配套USB网关，可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成

移远通信再扩短距离通信模组版图：Wi-Fi 7/6、Wi-Fi Halow等六款新品助力无线连接升级

其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……

亚化咨询推出《中国半导体大硅片年度报告2024》，欢迎索取目录！

来源：《中国半导体大硅片年度报告2024》2016 年至 2023 年间，全球半导体硅片（不含 SOI）销售额从 72.09 亿美元上升至121.29 亿美元，年均复合增长率达 7.72%。2016

小米15Ultra渲染图出炉：独一无二四摄模组辨识度拉满

小米15 Ultra目前已经三证齐全，静待2月份发布了，大概率会是2025年第一款超大杯旗舰。博主定焦数码最新公布了一张该机的渲染图，后摄区域是根据内部结构绘制，展示了全新的排列方式。四摄呈L形排列，

曝三星将推出三折叠手机

1月7日，据韩媒 sisajournal-e 消息，三星计划 2025 年下半年推出三折叠手机，采用 G 形双内折设计，完全展开后尺寸为 12.4 英寸。据称，有别于华为的 S 形折叠屏方式（In&O

奥康皮鞋：终止收购芯片公司！

1月8日消息，奥康国际发布公告称，终止发行股份购买资产，公司股票将于1月8日开市起复牌。至此，奥康国际谋划的跨界收购芯片公司事项告一段落。奥康国际在公告中介绍，公司于2024年12月24日披露了《关于

OpenAI宣布计划转型为一家营利性公司

点击蓝字关注我们SUBSCRIBE to USImage: The Verge据悉，OpenAI已经制定了成为一家营利性公司的计划。在近日发布的一篇博客文章中，OpenAI的董事会表示，将把公司现有

TCL华星携印刷OLED等技术，亮相全球

‍‍美国拉斯维加斯当地时间1月7日，第58届国际消费类电子产品展(CES2025)在拉斯维加斯开幕。本届展会，TCL华星携涵盖电视、车载、显示器、笔电、平板、手机、VR等显示领域的多款重磅展品亮相，其

闻泰科技解析出售ODM业务决策背后的考量

近日，闻泰科技在一场电话会议中阐述了其出售ODM（原始设计制造）业务的战略考量。闻泰科技表示，基于地缘政治环境变化，考虑到 ODM 业务稳健发展和员工未来发展利益最大化，公司对战

聚飞光电MLED超高清显示屏系统入选工信部公示名单

近日，由工业和信息化部、国家广播电视总局、国家知识产权局联合评选的“2024年度视听系统典型案例”公示名单正式发布。聚飞光电自主研发的大尺寸 Micro LED 超高清显示屏系统经专家评审及公示程序，

极氪、长城、小鹏等中国电动车惊艳CES！美国记者看傻了：我就像个乡巴佬

这届CES，几乎成了半个车展。尤其是今年多个中国电动车品牌参展，凭借各种华丽的车载科技大放异彩，直接让美国记者看傻了。在体验完极氪001 FR之后，美国知名电动车媒体InsideEVs记者Patric

消息称Arm寻求收购半导体设计公司AmpereComputing

据彭博社报道，软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司，致力于塑造云计算的未来,并推出了

身材虽小，却为数据中心加速提供大智慧

杂志声明