数据中心的工作负载始终处于动态变化中,如何在不进行硬件升级的前提下保持数据中心的可扩展性和敏捷性?赛灵思“可组合式数据中心”方案给出了有益的尝试。

“数据中心没有固定模板,并不存在‘典型的’数据中心。”赛灵思数据中心事业部市场营销总监Ed Wright日前在接受《电子工程专辑》采访时表示,之所以做出这样的判断,是因为数据中心的工作负载始终处于持续的动态变化中,没有单一或某种特定类型的应用能够主导数据中心。因此,现有的数据中心必须要能够在不进行硬件升级和扩展的前提下,保持可扩展性和敏捷性,以应对不断变化的应用需求。

包括SN1000 SmartNIC、AI视频分析平台、加速算法交易、应用商店在内的“可组合式数据中心”,是赛灵思为解决上述挑战给出的最新解决方案。所谓的“可组合式”,Ed解释说,是不仅要求计算、网络和存储的分离,也不仅仅停留在基础设施层面,而是可以在器件级实现可扩展和可配置。如果用更精炼的文字加以表述,那就是八个字:“软件定义,硬件加速”。

不存在“典型的”数据中心

硬件可组合,SmartNIC的再进化

标准网卡(NIC)自20世纪80年代便已出现,到本世纪初,许多公司开始投身该领域进行创新。他们最初的重点是10G级别的高性能计算(HPC),能够支持非常高效的输入输出,而且从服务器到网络,再到存储,都不需要进行加速。

但是在从10G到25G节点的过程当中,传统CPU内核开始出现卡顿,出现了旨在减轻CPU负担并同时推进网络数据包加速的卸载NIC。但卸载NIC的弊端在于使用的都是ASIC芯片,无法编程,卸载能力有限,随着端口速率从25G向100G一路迈进,可编程SmartNIC(智能网卡)应运而生,现在SmartNIC不仅可以用于更广泛类别的卸载,还可以基于ASIC Arm和FPGA芯片设计。

最早采用SmartNIC技术的是以百度、阿里和腾讯为代表的超大规模数据中心和云服务提供商,他们对于网络、安全和存储的卸载性能要求一直是最高的。另一方面,这些超大规模数据中心客户的要求各不相同,导致CPU和SoC规模化性能不足,无法满足硬件加速的要求和性能;而AISC实现方案又缺乏定制能力,跟不上超大规模数据中心每隔12-18个月就会发生重大变化的演进速度。

因此,在2020年推出的25Gb SmartNIC Alveo U25的基础上,赛灵思日前推出了全新的100Gb SmartNIC Alveo SN1000。

SN1000包括UltraScale+ FPGA架构、ARM子系统和可编程的Vitis Networking软件,拥有控制面和数据面分离的异构架构,支持2×100GB端口速率,完全符合数据中心封装尺寸和75瓦功耗需求。正因为如此,赛灵思数据中心事业部网络与存储产品管理总监Kartik Srinivasan才将其称之为“业界首款硬件可组合式SmartNIC”。

即插即用是SN1000 SmartNIC的标志性特点。得益于赛灵思预先对硬件进行了包括OVS加速、网络虚拟化安全加速和存储加速在内的各项加速,不同用户在使用时,既可以选择对远程存储或NVMe进行加速,也可以对网关流量进行加速。如果客户不采用OVS加速,而是选择加入定制的虚拟交换机,也能够同时对虚拟化和安全进行加速。 

客户如何才能充分利用这种可组合式的功能呢?Kartik解释说,构成数据平面的收发流水线都有数个可编程入口点,客户可以在这些入口点上使用Vitis软件开发平台连接其使用P4、C/C++、HDL或HLS编写的代码块。然后,Vitis会将此代码编译成逻辑,帮助工程师在适当的数据包处理流水线中插入他们认为合适的模块。这可以让数据包以极快的速度通过数据平面,从而使赛灵思能够支持线速包处理。

对于成熟的用户来说,他们可以继续使用RTL或是传统的FPGA编程方法对数据面进行管理。通过这样的模块,无论是配置还是加速,既可以由赛灵思来做,也可以由客户、客户的客户、或是独立的软件和IP合作伙伴来做,他们可以在赛灵思App商店(Xilinx App Store)里买到这些硬件加速功能。

赛灵思应用商店是客户能够消费这些解决方案和应用的一种全新的方式,会非常容易的帮助他们去评估、购买并且部署有关的应用,例如能够更加方便的管理有关的许可证,更加方便的通过数字知识产权管理计划来获取相关数据,并且能够更好的给客户推送相关应用。Ed预计,从2021年起,赛灵思应用商店将会成为客户评估并且部署加速解决方案和应用的优选方式。

赛灵思的智能世界

基于Alveo的AI视频分析平台是赛灵思“智能世界解决方案”的一部分,它具备合作伙伴解决方案生态系统,并且专为最复杂、时延最敏感的AI视频推断应用提速而打造。根据赛灵思数据中心部亚太区数据中心战略营销经理Guruprasad M. Parthasarathy的介绍,该平台由视频机器学习流服务器(VMSS)支持,可以提供整体应用加速,还能在单个Alveo加速器卡上以确定性的低于100毫秒的流水线时延支持多个神经网络。这样做的结果就是,能够以业界最低的总拥有成本(TCO)支持严苛的AI视频应用。

在Guruprasad看来,最至关重要的AI视频分析应用指的是那些保护人的生命、健康和财产的应用,这些应用的复杂性不断提高,而复杂性又让架构不胜负荷,例如确定性的低时延变得更难以实现,OPEX(空间、能耗)和CAPEX(硬件成本)随着复杂性增大而陡增。

“赛灵思智能世界视频分析解决方案能够双管齐下同时解决企业和开发者的痛点。” Guruprasad说对企业而言,解决了方案生态系统,能立即部署至关重要的视频AI分析应用;对开发者而言,VMSS平台赋能合作伙伴和开发者为复杂AI推断交付低时延解决方案和插件。在他列举的一个零售场景中,与英伟达T4 GPU相比,该方案在总拥有成本方面能够降低30%,时延方面降低75%到80%。

与此同时,赛灵思生态系统还发布了以下解决方案:

Aupera 将公司的智能视频AI处理与Alveo加速器结合,提供了交钥匙智能城市和智能零售解决方案,为关键应用提供同类最佳的AI分析解决方案。

Mipsology 提供了一套工具集,助力现有 AI 应用从基于GPU的架构向Alveo平台轻松迁移,同时兼具即插即用的高性能 AI推断加速功能。

Deep-AI,通过Alveo加速器在边缘提供业界首款集成训练与推断能力的解决方案。与基于GPU的解决方案相比,Deep-AI独特的突破性INT8 AI训练可提供单位成本高达 10倍的性能提升。

毫秒必争的加速算法交易

当今的算法交易主要分为两大类别:一个是硬件算法交易,另一个是软件算法交易,两者之间不但功能和性能差异极大,而且如果软件算法交易想要转换成硬件算法交易,门槛很高,硬件开发者、高昂的成本、漫长的交付周期和高风险都是要考虑的因素。

同时,金融交易对低延时提出了更高的要求。因为如果无法在延时上竞争,不仅成本高昂,而且会对交易成本分析(TCA)造成负面影响。而微妙时延壁垒的突破不仅能赋予交易者重大优势,而且还能最大限度的降低高频交易(HFT)损失。但目前的CPU已触及性能天花板,无法再加快速度,未与网络连接的PCI拖慢交易速度。

而基于Alveo加速卡新推出的赛灵思加速算法交易,不但开箱即用部署,而且可以帮助交易者使用非常复杂的策略,不需要进行硬件的开发,就可以实现不到一微秒的低时延要求。

在Vitis软件平台上,开发者可以通过模块化的方式来构建并且部署基于FPGA的Alveo卡,由于支持库的混搭,该方案能够支持非常广泛的算法交易用例,从而在此基础上轻松部署算法交易的框架和IP。通过这样的方式,交易者可以在赛灵思加速算法交易框架中,使用各种各样的库进行组合,并且支持C和C++语言进行编程,继而就能支持非常广泛的软件开发商,也便于对内部和第三方的应用进行集成。与此同时,新的加速算法交易也使得时延降低到微秒级以下,达到了300-400毫秒,并将上市时间由过去的几年缩短到目前的几周。

包括经纪人、交易所、市场数据厂商、销售侧厂商和自营交易商在内的各种机构用户,只需通过赛灵思经销商和分销商购买Alveo U50和Alveo U250,然后从Xilinx.com免费开源下载使用即可,无需许可证的费用。

结语:

FPGA的优势是众所周知的,赛灵思最近发布的这些解决方案,目的是希望能够突破企业和FPGA技术采用方面的壁垒,使得FPGA更加的简单易用。换句话说,用户实际上并不需要知道FPGA是解决方案的核心,就可以利用FPGA的功能而无需进行任何FPGA设计,或是完成繁重的工作,或是生产出完整的、交钥匙的解决方案,从而为其设备开拓广阔的新市场。

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
莱迪思在最近的开发者大会上发布了最新的Nexus 2平台和对应的小型FPGA产品。这次我们有机会看看相比竞品,Nexus 2是怎么做到低功耗和高性能的...
莱迪思(Lattice)正在考虑对英特尔旗下的FPGA业务Altera发起收购要约,对于国产FPGA行业而言,这一消息无疑带来了新的挑战和机遇。尽管在技术实力、产品性能及市场份额等方面与国际巨头尚有一定差距,但近年来国产FPGA的发展势头不容小觑……
继今年4月AMD宣布推出第二代Versal AI Edge系列和Versal Prime系列之后,日前,该公司又宣布推出第二代Versal Premium系列,使得第二代Versal系列的版图更趋完整。
在金融行业的高频交易中,每一纳秒都至关重要,会导致从盈利几百万美元到巨额亏损之间的差别。正是在这样的背景下,AMD推出了其最新的金融科技加速卡——Alveo™ UL3422。这款加速卡不仅满足了金融机构对高性能和低时延的迫切需求,还以其独特的优势引领着金融交易的新时代。
中国市场对于Lattice而言不仅是至关重要的战略市场,更是其全球业务不可或缺的一部分。他提到,Lattice在中国的业务历史已超过30年,作为首批进入中国市场的半导体企业之一,Lattice已经建立了专门的本地团队,这些团队不仅深入理解并服务中国市场,还致力于为中国客户量身打造解决方案。
TI最近刚刚发布了新款PLD(可编程逻辑)产品系列,据说不需要编程知识,就能在十分钟内完成设计、仿真和配置...
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
点击蓝字 关注我们安森美(onsemi)在2024年先后推出两款超强功率半导体模块新贵,IGBT模块系列——SPM31 IPM,QDual 3。值得注意的是,背后都提到采用了最新的FS7技术,主要性能
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
“ 洞悉AI,未来触手可及。”整理 | 美股研究社在这个快速变化的时代,人工智能技术正以前所未有的速度发展,带来了广泛的机会。《AI日报》致力于挖掘和分析最新的AI概念股公司和市场趋势,为您提供深度的
2024年度PlayStation游戏奖今日公布,《宇宙机器人》获得年度最佳PS5游戏,《使命召唤:黑色行动6》获得年度最佳PS4游戏。在这次评选中,《宇宙机器人》获得多个奖项,包括最佳艺术指导奖、最
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益
今天上午,联发科宣布新一代天玑芯片即将震撼登场,新品会在12月23日15点正式发布。据悉,这场发布会联发科将推出全新的天玑8400处理器,这颗芯片基于台积电4nm制程打造,采用Arm Cortex A
极越汽车闪崩,留下一地鸡毛,苦的是供应商和车主。很多人都在关心,下一个倒下的新能源汽车品牌,会是谁?我们都没有未卜先知的超能力,但可以借助数据管中窥豹。近日,有媒体统计了15家造车新势力的销量、盈亏情
亲爱的企业用户和开发者朋友们距离2024 RT-Thread开发者大会正式开幕仅剩最后3天!还没报名的小伙伴,抓紧报名噢,12月21日不见不散!大会时间与地点时间:2024年12月21日 9:30-1