“在金融行业的高频交易中,每一纳秒都至关重要。从某种程度上来说,高频交易就是一场超低时延竞赛。”AMD自适应和嵌入式计算事业部Alveo加速卡高级产品线经理Shyam Chander日前在AMD Alveo™ UL3422金融科技加速卡媒体沟通会上如是说。
AMD自适应和嵌入式计算事业部Alveo加速卡高级产品线经理Shyam Chander
所谓的“高频交易”,是指主流的自营交易公司、对冲基金、经纪公司和交易所利用强大的计算机系统和复杂算法,非常迅速地实现tick-to-trade(从接收市场数据到执行交易订单所需的时间)交易。换句话说,就是利用市场上非常小的价差以及市场的低效,在短时高频发生的交易,通过这样的方式来获得利润。其核心特点包括以下三点:
- 低延时。几微秒之差就会导致从盈利几百万美元到巨额亏损之间的差别。
- 基础设施建设非常关键。要进行高频交易经常需要在交易所租用服务器,实现服务器共置来获得优势。很多的高频交易公司都选择在交易所进行基础设施的部署。而且,除了基础设施外,产品尺寸、机架服务器数量,对于高频交易来说也非常重要。
- 算法也能够给高频交易带来优势,通过不断演进的算法打造差异化优势,能够帮助交易商实现监管合规,这对效率也非常重要。
其实,在当今瞬息万变的金融市场中,各行各业都面临着前所未有的挑战与机遇,需要超低时延的场景不仅仅只有“高频交易”。在银行业,欺诈检测、风险计算、监管计算和客户体验必不可少;在支付行业,流畅的实时支付、交易分析、身份盗窃防范不可或缺;在保险业,智能文档处理、智能索赔、精算建模也都需要快速响应。
正是在这样的背景下,AMD推出了其最新的金融科技加速卡——Alveo™ UL3422。这款加速卡不仅满足了金融机构对高性能和低时延的迫切需求,还以其独特的优势引领着金融交易的新时代。
详解AMD Alveo™ UL3422
作为AMD Alveo™超低时延加速卡产品组合中的最新成员,基于Virtex UltraScale+ VU2P FPGA打造的Alveo™ UL3422加速卡采用了全新的收发器架构,能够在进行16位操作时达到644MHz的时钟速度,可高效传输市场数据。该器件还集成了固化的以太网MAC和PCS IP,可实现超低延迟数据传输和控制管理,并简化了ULL交易的时序收敛。该卡的FPGA和收发器架构配有两个网络端口,分别支持10Gb/s和25Gb/s数据传输速率,符合大多数市场交易所的运行标准。
与之前的架构相比,得益于GTF收发器的使用,Alveo™ UL3422加速卡在收发器时延方面实现了7倍的降低,这标志着AMD在超低时延交易技术领域的又一次重大突破。而如果与AMD Virtex™ UltraScale+™ VU9P FPGA相比,AMD Alveo™ UL3422加速卡在tick-to-trade时延方面实现了40-49%的显著降低,为金融机构带来了更加高效的交易处理能力。
在谈及GTF与GTY的主要区别时,Shyam Chander介绍称,GTF收发器是专为Virtex UltraScale+ VU2P FPGA芯片设计的,专为超低时延市场量身定制;GTY收发器技术则被广泛应用于Virtex UltraScale+系列的所有纳米级别产品,包括16纳米产品中。
此外,AMD Alveo™ UL3422加速卡还采用了先进的FPGA架构和DSP块,这些硬件资源能够针对不断演进的交易策略进行灵活加速。嵌入式RAM的加入,使定价数据、交易记录等关键信息能够实现快速内存存取,进一步提升了交易处理的效率。同时,DDR4存储技术的运用,则为订单簿信息、历史定价数据等提供了充足的存储空间,确保交易系统的稳定运行。
为了简化开发流程,AMD还提供了丰富的参考设计、工具以及生态系统IP,帮助金融机构快速实现交易系统的搭建与优化。这使得Alveo™ UL3422加速卡不仅易于集成,还能在短时间内实现高效的交易处理能力。
“Alveo UL3422能够进行实时的数据送达和交易执行,算法支持交易前的风险检测,无论是经纪商还是交易商都有着风险管控的需求,通过这样的方式能够减少错误的发生,并且更好地满足合规要求。”Shyam Chander说。
寻找性能与成本的平衡
纤薄的尺寸规格是Alveo™ UL3422的另一看点。数据显示,Alveo UL3422采用纤薄 FHHL(全高半长)外形尺寸设计,在实际部署中,这样的尺寸规格极具性价比,可以降低进入门槛,实现广泛采用。
Shyam Chander说,在交易所主机共置环境中,这种优势尤为突出。因为对于需要主机共置以确保最低时延的交易所而言,资本支出与运营支出、机架空间、能源、网络以及数据馈送等因素对盈利能力至关重要。对于市值超过100万亿美元的全球前25大证券交易所而言,这种高性能、高性价比的部署方案无疑具有极大的吸引力。
与一年前推出的Alveo UL3524加速卡相比,UL3422精简了功能集,但保留了核心的低时延交易加速能力。同时,它优化了连接性和板载内存,使部署成本更加合理。纤薄的尺寸规格使UL3422非常适合1U服务器,能够针对机架空间、电力输送和主机共置开销进行优化,从而降低整体运营成本。
此外,AMD Alveo™ UL3422加速卡还灵活适用于2U和4U服务器配置,这意味着每台服务器可以部署更多的加速卡,进一步提升交易处理能力。
易于开发和实现快速交易
对于传统FPGA开发者,AMD Alveo™ UL3422加速卡提供了灵活应变的硬件加速能力,使得高频交易公司能够持续优化其交易策略,并适应交易、算法及监管要求的不断演进。开发者则可以利用熟悉的FPGA工具流程,借助AMD Vivado™设计套件进行RTL(寄存器传输级)设计,从而轻松实现交易算法的硬件加速。
为了帮助开发者更好地评估时延并集成自定义算法,AMD还提供了针对时延基准测试的参考设计。这些参考设计不仅有助于开发者快速上手,还能确保他们在开发过程中达到最佳的性能表现。
此外,AMD丰富的IP工具包和生态系统解决方案,包括与多个生态系统合作伙伴的合作,如Exegy、FINN和Xelera等,提供了广泛的IP和开发框架,以实现交易解决方案的快速实施。
例如,Exegy的nxFramework为金融行业提供了高效构建和维护超低时延FPGA应用的环境;还可以采用FINN编译器来优化其性能,完美适配工业标准框架,用户可以轻松地将神经网络模型编译并生成对应的RTL IP,进一步提升产品的灵活性和适用性;而Xelera Technologies则助力应对高频交易中机器学习算法的时延缺陷,提供实时的、基于机器学习的交易决策。
金融科技为何垂青FPGA加速卡?
Shyam Chander表示,FPGA在这一过程中的价值和优势主要体现在两个方面:首先,FPGA的可编程性使其能够适应各种算法需求,实现利润最大化和特定算法的无缝连接,这是ASIC或SSD无法实现的;其次,针对金融科技对超低时延的严格要求,FPGA加速卡通过其GTF收发器能够在20纳秒内完成数据传输,从而满足超低时延的需求。
而且,金融领域许多交易商开始采用AI交易策略,这些策略与FPGA的灵活加速计算能力结合成为一种趋势。在金融科技领域,AI应用正逐渐从非核心部分转变为交易管线的关键组成部分。
为此,AMD也为不同时间要求的交易方案设计了完整的算法交易产品组合:超低时延解决方案,包括新推出的Alveo UL3422与先前的Alveo UL3524,均满足低于20纳秒的时延需求;标准化产品Alveo V80提供低于100纳秒的低时延FPGA交易,适配各类计算与内存资源;Alveo X3522支持低于1000纳秒的低时延CPU交易,兼容EPYC与锐龙处理器,满足多样工作负载。
如果从金融领域推而广之,和低时延相关的应用领域(科研和智能驾驶),也都是Alveo UL3422加速卡的潜在应用领域。例如科研领域中,许多数据馈送处理需要在交换机中完成,超低时延的芯片能力对于这些应用至关重要。
总体而言,AMD Alveo™ UL3422金融科技加速卡以其超低时延交易执行、纤薄尺寸规格以及轻松开发的特点,为金融机构提供了强大的交易加速支持。Shyam Chander 强调称,AMD正在通过高性能和自适应计算技术,积极推动金融服务领域的数字化转型,为金融市场带来更多高效、智能的解决方案,引领算法交易进入新时代。