介绍
过去十年,是计算机网络这一领域最具活力、最令人振奋的十年。软件定义网络 (SDN) 的兴起,使得网络控制功能从网络转发功能中的抽离成为了现实。同样,网络功能虚拟化 (NFV) 技术也将转发与其它一些功能从底层硬件中脱离出来。在服务器连接性方面,SDN 软件带来了网络接口卡 (NIC) 的虚拟化,使得能向虚拟机 (VM) 分配一个虚拟网卡 (vNIC)。
在过去十年,数据分析在确定企业战略、运营和产品开发方面的重要性不断提高。像人工智能 (AI) 这样的新软件技术,已经离开了实验室,进展到了生产部署阶段。联网IoT和消费设备的大规模普及,带动了数据体量和复杂性的急剧提高。这些趋势,在不断地推动着全球范围内对算力和联网带宽的需求。
但不幸的是,CPU技术领域的进步却并未能够跟上脚步,这是因为晶体管小型化方面的挑战,以及摩尔定律的趋缓。如要克服这种挑战,继续增加服务器的计算能力,需要将更多的专用芯片(例如 GPU、FPGA、TPU 等)引入到服务器中。将特定的负荷转交给加速器或协处理器能够有效提高计算密度。同样,随着服务器带宽需求的增加导致服务器的网络功能负荷呈指数级增长,将SDN和NFV功能从CPU中剥离出来,交由专用硬件负责,已经非常有必要。
联网设备厂商们对此的应对是在以太网适配器的以太网控制器ASIC中加入更多的处理功能。通过将常用SDN和NFV功能的芯片级部署,将网络处理负荷从CPU转移到以太网适配器,带来了一条相对易于配置的可编程数据路径。
这种策略,带来了多种转移能力以及对定制功能进行定制和整合新兴技术的能力。厂商们基于不同的技术、利用不同的命名对这些类型的适配器进行了区分,其中最常见是‘智能网卡 (SmartNIC)’ 和‘数据处理单元 (DPU)’。
云服务商在拥抱可编程NIC方面最为积极
云服务商 (SP) 是最早接受可编程网卡的一个群体,微软和亚马逊这样的云服务巨头率先采用了这一技术。大多数情况下,云服务商会基于服务器CPU的一个核心(或支持超线程的 CPU 的一个线程)来创建一台虚拟机。在CPU上运行网络堆栈会减少每个服务器上可创建的虚拟机数量或削弱虚拟机的处理能力。这反过来也限制了云服务商的营收机会。将网络堆栈交由可编程NIC负责,则可以减轻CPU核心的负担,提高服务器利用率,增强服务商的营收能力。
除了通过释放CPU核心来提高营收能力以外,云服务商们还会在可编程NIC上部署安全和存储功能,以对他们的云服务设施实现加速。在自有软件方面的专业经验,有助于大型云服务商根据其特定用例来对可编程NIC进行优化。微软Azure云和亚马逊AWS数据中心中部署的每一台服务器都配备有可编程NIC,用于处理网络和安全方面的负荷。
在更广泛的市场上,还有越来越多的独立软件厂商在为可编程NIC提供技术支持,来满足不同市场领域、工作负荷以及使用案例的需求。像英伟达这样的技术厂商也正在加大投入,力求为其可编程NIC产品创建一片更广泛的软件生态系统。
案例1:将VNF从CPU转移到NIC
可编程NIC选项带来乘法效果
最近几年来,英伟达、英特尔、Marvell、Silicom、Fungible、Pensando和Kalray所推出的产品,已为可编程NIC带来了一片丰富多样又竞争激烈的市场空间。
可编程NIC的可选架构可谓丰富。最常见的是基于FPGA以及基于SoC的产品。基于FPGA的NIC通常包含一个FPGA和一个以太网控制器ASIC。基于SoC的NIC则采用成熟处理器加以太网控制器。某些厂商采用的是以太网控制器逻辑加处理器核心的搭配,生产用于数据包处理的定制SoC,而另外一些厂商则将其用作适配卡上的一个单独芯片。这些以太网适配器的处理能力和速度,因其所采用芯片和IO接口的处理能力,而互相大有不同。
由于应用逻辑部署在了半导体栅极这一层面,FPGA在响应时间和延迟方面有一定优势,因此在对低延迟、安全部署和防火墙功能有要求的服务器中非常受欢迎。但是,FPGA比较不足的方面是芯片中逻辑单元的数量,因此芯片上可部署逻辑数量的不足限制了它的应用和用例。
SoC与FPGA相比晶体管密度较大,而且大多数的SoC也具有用于通用安全和加密算法(IPSec、SSL、RegEx 等)的专用加速核心,可对特定工作负荷进行加速。
在可编程性方面,基于SoC的NIC也因为支持常见的高级编程语言(例如 DPDK、P4 和 C 语言)而更方便编程,与之相比,基于FPGA的NIC则需要利用低级编程语言Verilog或VHDL等,存在市场上此类专业人才短缺的问题。基于SoC的可编程NIC甚至在Linux操作系统下也可正常使用。市场上一个很有趣的发展是像英伟达这样的厂商正在开发对用户十分友好的软件套装,以让基于SoC的NIC的编程更简单些。
软件选择的激增,带来了一个负荷转移可能性的新世界
自2017年以来,我们对北美的企业进行了多次年度调研。我们最近一次调研的结果显示,安全是企业们的主要关注方面。在表示有计划在其数据中心中部署可编程NIC的受调者中,有五分之一提到防火墙是他们的主要用例。这对于我们来说并不令人惊讶,在企业中,数据安全有着重要的地位,尤其是当薄弱漏洞甚至出现在芯片层面上时,例如幽灵、熔断和预兆等漏洞的威胁。
案例2:可编程NIC用例;来自北美企业的反馈
大多数可编程NIC厂商都会针对通用网络和存储协议负荷转移提供即时可用的支持服务。例如虚拟局域网 (vLAN)、虚拟路由 (vRouter)、网络地址转换 (NAT)、负载均衡、服务质量 (QoS)、虚拟网络隧道化、流量分类等网络负荷转移技术通常均受支持。在存储方面,也针对例如iSCSI或以太网光纤通道 (FCoE)、光纤 NVMe (NVMe-oF) 以及采用以太网RDMA的服务器存取 (RoCE) 提供即时可用的支持。
领先的安全软件厂商,例如Palo Alto Networks、思科、Fortinet和F5 Networks等,均已宣布支持可编程NIC。当VMware宣布有意让ESXi hypervisor运行于可编程适配器上,并将使vSAN和NSX可用于存储和网络虚拟化时,意味着可编程以太网控制器的软件生态系统迎来了一次大爆发。VMware软件能够运行在可编程NIC上将极大增强此类产品在企业用户中的吸引力,推动更广泛的采用。
通讯服务商也正在越来越多地采用可编程NIC来托管虚拟网络功能。5G网络的商业化投入也推动了对可编程NIC的需求。众多OEM厂商和其它一些独立技术厂商均支持将vRAN和vEPC功能负荷转移到可编程NIC上。
市场预测
Omdia预测2025日历年 (CY) 的可编程适配器出货量将占到出货以太网适配器端口量的37%,而这一数据在CY 2020则仅有15%。
促使Omdia作出如此预测的因素主要有:
多租户服务器上的虚拟机数量和容器数量持续增加,带来了需在每台服务器上运行一个虚拟交换机的需求。
高计算密度的工作负荷 - 例如人工智能 (AI) 算法 - 的商业化推广,使得将网络包处理负荷转移至适配器也成为了一个极具吸引力的选择。
软件定义网络 (SDN) 在诸如会消耗额外CPU核心并需要定期更新的隧道策略、负荷平衡、安全、带宽计量和服务质量 (QoS)等虚拟网络功能方面(QoS) 的部署的增长,驱动了对适配器可编程性的需求。
网络安全在对日益增加的网络攻击作出响应方面有着越来越高的要求;而安全功能的工作负荷,例如防火墙和加密等,也越来越依赖于处理器的能力,这使得将此类负荷转移至以太网适配器具有很大的吸引力。
案例3:NIC端口出货量 - 历史数据和预测数据
基线
随着CPU的小型化,对于数据中心服务器算力的需求不仅在不断攀升,而且也日益复杂化,这带来了将CPU的某些处理负荷转移出去的需求。此外,多租户服务器软件、数据分析、人工智能和物联网等的发展,也对服务器联网带宽提出了越来越高的要求。随着联网设备激增带来的工作负荷多样化增加,市场对于可编程网络硬件的需求也在不断增长。
面对这些挑战,企业和服务商们将目光落在了可编程NIC上,冀望NIC越来越多地运行网络和存储协议、实现直接存取,并承担起包含安全在内的高处理器需求的数据处理应用,来释放CPU。我们所采访的多家企业都预计将出现工作负荷向以太网适配器转移的趋势,而可编程性和可再配置性将在其中占据中心地位。物联网流量将进一步增加算法负荷转移需求,从而使数据的收发和处理得以同步进行。
文章版权和解释权归微信平台Omdia所有
Omdia公众号
长按二维码关注我们
Omdia是一家领先且独立的国际信息与通信技术(ICT)研究机构,提供市场关键数据、分析、建议和定制化咨询,使企业能够在不断变化的环境中蓬勃发展,并与Informa Tech的400万技术决策者、影响者和从业者合作。Omdia的客户遍布120多个国家,包括全球最大的技术和电信机构。Omdia成立于2020年,由IHS Markit、Tractica、Ovum和Heavy Reading合并而成。Omdia隶属于Informa Tech,研究范围涵盖企业IT、人工智能、物联网、通信运营商、网络安全、部件和设备、媒体和娱乐以及政府和制造业。
如您想了解更多有关Omdia的最新研究成果,请浏览Omdia官方网站或通过电子邮件联系我们。
omdia.com
queenie.jiang@omdia.com