作为目前业界带宽最高、计算密度最高的自适应平台,赛灵思最新推出的Versal Premium系列可提供比当前主流FPGA高3倍的吞吐量和2倍的计算密度,它是如何做到的?性能如此之高的产品,会不会因为昂贵的价格限制了市场的应用规模?

自适应计算加速平台(ACAP)是赛灵思(Xilinx)在2018年推出的一个高度集成的多核异构计算平台,能根据各种应用与工作负载的需求从硬件层对其进行灵活修改。ACAP历经四年研发,累积研发投资逾10亿美元,超过1500名软硬件工程师参与其中,公司上下对其寄予了极高的期望。

赛灵思CEO Victor Peng此前在接受媒体采访时称,虽然FPGA与Zynq SoC技术当前仍然是公司业务的核心,但赛灵思今后将不再仅仅是一家FPGA企业,尤其是伴随着ACAP的发明,赛灵思在当前以及未来将为数据中心与主流市场创造更多新的价值。

ACAP首款产品Versal的名字来源于两个词,一个是多样性,一个是通用性。产品组合包括Versal基础系列(Versal Prime)、Versal旗舰系列(Versal Premium)系列和HBM系列。此外,还包括AI核心系列(AI Core)、AI边缘系列(AI Edge)和AI射频系列(AI RF)。率先亮相的Prime系列和AI Core系列已于2019年下半年实现全面供货,而最新推出的Versal Premium系列,则是目前业界带宽最高、计算密度最高的自适应平台。

Versal Premium的硬核秘密

“目前无论是在数据中心还是在核心城域,每年带宽的年复合增长率都高达51%,那些来自视频流、企业、物联网和智能器件的数据是主要推动力。”赛灵思产品线营销与管理高级总监Sumit Shah说,随着5G时代的到来,带宽规模将会增长100倍以上,传统网络在以下三大方向上的变化将最为明显:首先是核心网扩展,5G核心年复合增长率预计为313%;其次,安全和分析成为网络运营商最关心的内容;第三,端口的密度和带宽呈几何级倍数增长,端口速度远超摩尔定律,传统器件已经跟不上计算密度的发展。

赛灵思产品线营销与管理高级总监Sumit Shah

在这一背景下,Versal Premium采用了台积电7nm工艺制造,系统逻辑单元从最小160万个到最高740万个,自适应引擎LUT数量从最低72万个到最高340万个,可提供比当前主流FPGA高3倍的吞吐量和2倍的计算密度,并内置以太网、Interlaken和加密引擎,专为在散热条件和空间受限的环境下运行最高带宽网络,以及那些需要可扩展、灵活应变应用加速的云提供商而设计。预计将于2021年上半年开始为早期用户提供样品。

112Gbps PAM4收发器、数百GbE(千兆位以太网)和Interlaken连接、高速加密以及内置DMA、支持CCIX和CXL支持的PCIe Gen5是Versal Premium的新颖和独到之处。配合Vitis统一软件平台与Vivado设计套件,开发人员可以使用自己熟悉的框架和工具(TensorFlow、Caffe、PyTorch、Vitis、VIVADO)来进行开发。

赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson表示,Versal ACAP非常重要的差异化特点就是具有片上可编程网络。“传统高性能、高带宽的设计经常会遇到路径上的瓶颈,而片上可编程网络可以解决这个问题,可以在所有引擎之间、用户逻辑器件和连接界面之间实现通信,而无需额外资源。”他说。

赛灵思高端ACAP与FPGA高级产品线经理Mike Thompson

  • 更快速、更安全的网络

Versal Premium系列提供了高达9Tb/s的可扩展、自适应串行带宽。具体方法是将112G PAM4收发器与集成的网络功能模块用于核心网、城域网和数据中心互联(DCI)基础设施,将每端口带宽密度提高两倍,并降低时延高达50%。

这种预制连接可实现安全的多太位以太网(multi-terabit Ethernet),灵活支持各种数据速率与协议。通道化以太网硬核能够以最小占板空间提供高达5Tb/s的吞吐量,同时高速加密引擎可提供高达1.6Tb/s的加密线路速率吞吐量,并支持AES-GCM-256/128、MACsec和IPsec 。

以5G市场为例,Mike Thompson说5G运营商目前使用的是Versal AI Core系列,到今年年底应该能够大规模生产。而核心网建设要比无线网的投资晚2-3年,所以高峰应该出现在2023年,对于一些想要通过部署最尖端的技术来占领市场份额的客户,现在用Versal Premium开始开发设计,正好能够赶上这一机遇。

  • 灵活应变的云加速

通过将超过120TB/s的片上存储器带宽与可定制存储器层级相结合,Versal Premium能够减少数据移动从而消除相应的关键瓶颈,与此同时,还支持以嵌入式方式将预制连接与硬核集成到现有云基础设施中。从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium 提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。   

从基因组学、数据分析和视频转码,到针对语音和图像识别的AI推断,Versal Premium提供了高度集成的云就绪平台,为多元化的工作负载提供突破性能。具体到AI性能方面,Versal Premium系列在Yolov2(608×608)对象检测模型下,性能分别是英伟达V100和T4的4.6倍和7.7倍;在异常检测AI方面(随机森林算法),性能是英特尔Xeon的65倍。

具体到Versal Premium系列,其高效的表现主要源自对应用处理器、实时处理器、平台控制器、存储器界面以及多种连接进行的丰富集成。在Mike Thompson看来,如果用软件逻辑去实现以太网Interlaken或加密引擎,需要很多FPGA资源才能实现。但Versal Premium采用的ASIC硬核方式大幅提升了效率,网络硬核IP集成提供了等效22个16nm FPGA的逻辑密度。这样的配置使得开发者能够更加专注于差异化,而无需分散精力在基础架构设计与连接上,同时可以帮助客户降低资本支出与运营成本。

同时,Versal Premium在同一器件上提供32G、58G和112G收发器的广泛选择,允许厂商扩展主流100G系统、增加400G部署,并将自己定位为800G以上的厂商。

值得注意的是,与前代Virtex UltraScale+ FPGA相比,Versal Premium功耗降低了60%。在数据中心的应用当中,与前代的FPGA相比可以提供2倍的带宽密度。这意味着,在带宽相同的情况下Versal Premium的机柜空间占用只有前代FPGA的一半,实现了加速功能的优化并大幅降低了总拥有成本。

根据IHS Markit的研究显示,当前安全性已经成为了网络运营商最为关注的问题。Versal Premium ACAP提供1.6Tb/s的行速率加密吞吐量,因此是安全网络的理想平台。它在灵活应变的平台上采用业界唯一的硬化400G通道化高速加密 (HSC)引擎。HSC引擎支持AES-GCM加密/解密、MACsec和IPsec,可实现多层安全性。

但性能如此之高的产品,会不会因为昂贵的价格限制了市场的应用规模? Mike Thompson对此回应称,包括电信、全域网、交通网、数据中心、测试测量在内的很多市场都对Versal Premium表现出了非常浓厚的兴趣,希望尽快拿到Versal Premium去进行前期测试。

“但我必须要强调的是,Versal Premium是一款非常高端的产品,针对的目标群体是希望借此尽早部署最尖端、最先进的技术来获取市场份额的用户,而不是希望能够实现最低成本的客户。”他同时表示,考虑到目前芯片性能的增加和成本的降低,已经很难随着传统的摩尔定律逐步推进,所以Versal Premium具备的高集成度和灵活性将会给用户带来更多价值。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
Intel在CES上发布了面向笔记本的酷睿Ultra 200H, 200HX, 200U系列,基本完善了这一代酷睿Ultra处理器产品线...这也是面向高性能笔记本的酷睿Ultra二代处理器初次亮相。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
刚才的CES主题演讲中,黄仁勋发布一款与众不同的“AI PC”,但它似乎又不是个PC...
随着制程技术的不断升级,芯片制造成本也大幅攀升。苹果从A7芯片的晶圆价格5000美元,到A17和A18 Pro芯片的18000美元,晶圆成本上涨了约300%。每平方毫米的成本从A7时期的0.07美元增加到A17和A18 Pro的0.25美元......
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
今天推荐的视频介绍了单片机(MCU)和数字信号控制器(DSC)之间的差异、Microchip DSC的单核和双核架构、DSC的应用示例以及可将您的设计推向市场的开发资源。更多更全视频尽在Microch
01周价格表02周价格观察硅料环节本周硅料价格:N型复投料主流成交价格为40元/KG,N型致密料的主流成交价格为38元/KG;N型颗粒硅主流成交价格为35元/KG。供给动态头部料企继续推进减产策略,月
‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究,随着人型机器人迈向高度系统整合,并有望从工业场景走进家庭生活,前端的AI模型训练将更为关键,以满足更多后端理解与互动需求
近日,联想在CES 2025展会上展示了全球首款卷轴屏PC——ThinkBook Plus Gen 6。据悉,ThinkBook Plus Gen 6卷轴屏AI PC的核心魅力在于其独有的可卷曲显示屏
手机充电器ic U6773S助推充电便利好享受面对手机存储空间不足的问题,我们可以从多个方面入手,清理缓存、卸载不必要的应用、移动文件至外部存储、使用云存储服务等等。面对手机充电器充电速度慢、效率低的
 △广告 与正文无关 日前,苏州西典新能源电气股份有限公司(股票代码:603312,以下简称“西典新能”)发布公告称,公司经过3年多的产品和工艺研发及设备攻关,信号采集组件FCC技术取得重大进展,公司
  在千级电子净化车间中设置通风系统时,需要综合考虑多个因素,包括洁净度要求、换气次数、气流组织、空气处理、温湿度控制以及节能与环保等。以下是合洁科技电子洁净工程公司的一些具体的设
近日,由工业和信息化部、国家广播电视总局、国家知识产权局联合评选的“2024年度视听系统典型案例”公示名单正式发布。聚飞光电自主研发的大尺寸 Micro LED 超高清显示屏系统经专家评审及公示程序,
戴尔科技AI PC产品组合助力终端用户释放创造力并提高工作效率。 戴尔科技统一旗下产品组合品牌命名,旨在帮助用户更轻松、快速地找到相匹配的PC、配件及服务。 搭载英
据彭博社报道,软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司,致力于塑造云计算的未来,并推出了