NapatechIPU解决方案助力优化数据中心存储工作负载

FPGA开发圈 2024-05-16 12:02




Napatech是全球领先的智能网卡(SmartNIC)和IPU解决方案供 应商,业务范围涵盖云计算、企 业和电信数据中心应用等领域。Napatech将商用级软件套件与高 性能硬件相结合,致力于加速网络 基础设施、安全和存储工作负载,从而实现一流的系统级性能,同时为应用和服务提供最大化的服务器计算资源。


作者

Charlie Ashton

Napatech 业务发展高级总监

Rich Howell

 英特尔产品营销经理




越来越多的企业和云数据中心开始采用NVMe/TCP存储技术,因为它在性能、时延、可扩展性、管理和资源利用率等方面优势显著。然而,在服务器上实施所需的存储启动器工作负载会带来巨大的计算开销,并限制可用于运行服务和应用的CPU内核数量。 


这篇解决方案简介介绍了Napatech的集成式软硬件解决方案如何将存储工作负载从主机CPU卸载到IPU,同时在应用级别保持完整的软件兼容性。


该解决方案释放了主机CPU内核,避免其被存储功能占用。它的性能明显优于基于软件的实施方案,可显著降低数据中心的资本支出、运营支出和能耗。它还在系统中引入了安全隔离,增强了对网络攻击的保护,这有助于降低数据中心遭受安全漏洞和高价值客户数据泄露的风险。



NVMe/TCP:面向现代化数据中心的卓越存储技术



NVMe/TCP是一种存储技术,它允许使用标准数据中心结构通过网络访问快速非易失性内存 (NVMe) 存储设备。见图1。


1. 分散式存储架构


越来越多的现代云和企业数据中心开始采用NVME/TCP,因为相比旧的存储协议(如互联网小型计算机系统接口 (iSCSI) 光纤通道),它拥有极具吸引力的优势:


  • 更高的性能:NVMe旨在充分利用基于NAND的现代高速固态盘 (SSD),并提供比传统存储协议更快的数据传输速率。NVMe/TCP将这些优势扩展到网络存储环境,允许数据中心通过网络结构实现高性能存储访问。


  • 更低的延迟:NVMe/TCP的低延迟特性对于数据密集型应用和实时工作负载至关重要。NVMe/TCP可以最大限度地减少通信开销和消除协议转换需求,帮助减少存储访问延迟并提高整体应用性能。 


  • 可扩展性:数据中心经常处理大规模存储部署,NVMe/TCP通过网络提供灵活高效的存储访问解决方案,从而实现无缝的可扩展性。随着NVMe设备数量的增长,数据中心可以在没有明显瓶颈的情况下保持高性能水平。


  • 共享存储池:NVMe/TCP允许创建可同时访问多个服务器和应用的共享存储池。这种共享存储架构提高了资源利用率,简化了存储管理,大大节省了成本。


  • 传统基础设施兼容性:数据中心的现有基础设施通常建立在以太网、InfiniBand或光纤通道网络上。NVMe/TCP允许他们利用现有的结构投资,同时集成创新的基于NVMe的存储技术,而无需大幅调整整个网络基础设施。 


  • 高效的资源利用:NVMe/TCP通过减少应用对每个服务器上专用存储资源的需求,实现了更高的资源利用率。多个服务器可以通过网络访问共享NVMe存储设备,从而优化使用昂贵的NVMe存储资源。


  • 面向未来:随着数据中心不断发展并采用更快的存储技术, NVMe/TCP提供了一种前瞻性的存储访问方法,确保存储网络能够满足不断增长的现代应用和工作负载需求。


整体而言,NVMe/TCP为数据中心提供了一个强大而灵活的存储解决方案,在共享和可扩展的存储环境中实现了高性能、低延迟和高效的资源利用。



纯软件存储架构的限制



尽管NVMe/TCP在存储方面具有显著的优势,但数据中心运营商必须意识到,在方案实施中,如果所需的所有存储启动器服务都在服务器的CPU上运行,这会带来很大的局限性。见图2。


图 2. 基于软件的网络存储


首先,如果存储虚拟化软件、管理程序或虚拟交换机 (vSwitch) 在网络攻击中受损,则会出现系统级安全风险。 


其次,无法确保租户工作负载之间的完全隔离。单个架构在多租户环境中托管多个客户的应用和数据。当应用或虚拟机 (VM) 占用最多可用资源并降低共享基础设施上其他租户的系统性能时,就会出现“噪邻”效应。


最后,运行基础设施服务(如存储虚拟化软件、管理程序和vSwitch)需要很大一部分主机CPU内核。这减少了可用于虚拟机、容器和应用的CPU内核数量。报告指出,30%到50%的数据中心CPU资源通常被基础设施服务消耗。 


在高性能存储子系统中,主机CPU可能需要运行多个协议, 如传输控制协议 (TCP)、基于融合以太网的远程直接内存访问 (RoCEv2)、InfiniBand和光纤通道。当主机CPU被大量用于运行这些存储协议和其他基础设施服务时,租户应用可用的CPU内核数量将大大减少。例如,16核CPU可能只能提供10核CPU的性能。 


由于这些原因和其他原因,纯软件架构给数据中心存储带来了重大的业务和技术挑战。



基于IPU的存储卸载解决方案



将NVMe/TCP工作负载卸载到IPU,以及其他基础设施服务(如管理程序和vSwitch,见图3),解决了纯软件实施方案的局限性,并为数据中心运营商带来了显著优势:


  • CPU利用:NVMe/TCP通信需要将NVMe命令和数据封装在TCP传输协议中,主机CPU处理则会这些封装和解封装任务。将这些操作卸载到专用硬件上可以让CPU专注于其他关键任务,从而提高整体系统性能和CPU利用率。


  • 更低延迟:将NVMe/TCP通信任务卸载到专用硬件可以显著减少处理存储命令的延迟。因此,在访问远程NVMe存储设备时,应用可以体验到更快的响应速度和更高的性能。 


  • 高效数据移动:将非CPU应用任务卸载到独立的硬件加速器上,可以比使用通用CPU更高效地执行数据移动操作。它可以有效地处理大数据传输和缓冲区管理,减少延迟并提高总体吞吐量。


  • 更高的可扩展性:卸载NVMe/TCP任务可以提高大规模存储部署的可扩展性。通过减轻CPU处理网络通信的负担,系统可以支持更多的并发连接和存储设备,而不会受到CPU的限制。


  • 高能效:通过将某些任务卸载到专用硬件,可以降低主机CPU的功耗。这种能效在大型数据中心环境中尤其重要,因为功耗是一个重要的考虑因素。


除了上述适用于NVMe/TCP存储工作负载的优势之外,基于IPU的系统架构还提供了增量安全隔离选项,从而将基础设施服务与租户应用隔离开来。这样可以确保存储、管理程序和vSwitch服务免受租户应用发起的网络攻击。基础设施服务是安全的,因为IPU本身的启动过程是安全的;而IPU充当主机服务器的信任根。


图 3. 支持IPU的分散式存储



Napatech存储卸载解决方案



Napatech为数据中心存储卸载提供了一个集成的系统级解决方案,包括在F2070X IPU上运行的高性能Link-Storage软件堆栈。见图4。


图 4. Napatech存储卸载


Link-Storage软件包含一套丰富的功能,包括:


  • 将NVMe/TCP工作负载从主机完全卸载到IPU;


  • 将TCP工作负载从主机完全卸载到IPU;


  • NVMe到TCP启动器;


  • 通过存储性能开发套件远程过程调用 (SPDK RPC) 接口进行存储配置;


  • 多路径NVMe支持;


  • 通过virtio- blk接口向主机显示16块设备;


  • 兼容普通Linux* 发行版中的标准virtio-blk驱动程序;


  • 主机CPU和IPU之间的安全隔离,没有暴露于主机的网络接口。


除了Link-Storage,F2070X还支持Link-Virtualization软件,该软件提供了一个卸载和加速的虚拟化数据平面,包括开放式vSwitch (OVS)、实时迁移、虚拟机到虚拟机镜像、 VLAN/VxLAN封装/解封装、Q-in-Q、接收端扩展 (RSS) 负载均衡、链路聚合和服务质量 (QoS) 等功能。 


由于F2070X基于FPGA和CPU(而非ASIC),因此可以在部署后更新平台的完整功能。无论是修改现有服务、添加新功能还是微调特定的性能参数,这种重新编程都可以纯粹作为现有服务器环境中的软件升级来执行,而无需断开、移除或更换任何硬件。


Napatech F2070X IPU



基于英特尔F2000X-PL的Napatech F2070X IPU是一款2x100G PCIe卡,采用英特尔® Agilex 7 FPGA F系列和英特尔® 至强® D处理器,拥有全高半长 (FHHL) 双插槽外形。请见图5了解详情。


图 5. F2000X-PL结构图


F2070X IPU的标准配置包括一个带有四组4GB DDR4内存的英特尔® Agilex 7 FPGA AGF023和一个带有两组8GB DDR4内存的2.3 GHz英特尔® 至强D-1736处理器。可以提供其他配置选项来支持特定的工作负载。


F2070X IPU通过PCIe 4.0 x16 (16 GTps) 接口连接到主机,FPGA和处理器之间还有一个额外的PCIe 4.0 x16 (16 GTps) 接口。


两个前面板QSFP28/56网络接口支持以下网络配置:


  • 2x100G; 
  • 8x10G或8x25G(使用分支电缆)。 


专用PTPRJ45端口提供与外部SMA-F和内部MCX-F接口的可选时间同步。支持IEEE 1588v2时间戳。 


专用的RJ45以太网连接器提供主板管理功能。安全的FPGA图像更新支持在IPU部署完成后增加新功能或更新现有功能。 


处理器运行Fedora Linux,具有UEFI BIOS、PXE启动支持、通过SSH进行完整shell访问和UART。



总 结



越来越多的企业和云数据中心开始采用NVMe/TCP存储技术,因为它在性能、时延、可扩展性、管理和资源利用率等方面优势显著。然而,在服务器的主机CPU上实施所需的存储启动器工作负载会带来巨大的计算开销,并限制可用于运行服务和应用的CPU内核数量。


Napatech的集成式软硬件解决方案包括在F2070X IPU(图6)上运行的Link-Storage软件堆栈,通过将存储工作负载从主机CPU卸载到IPU来解决此问题,同时在应用级别保持完整的软件兼容性。


图 6. Napatech F2070X IPU


Napatech的存储卸载解决方案释放了主机CPU内核,避免其被存储功能占用。它的性能明显优于基于软件的实施,可显著降低数据中心的资本支出、运营支出和能耗。 


Napatech解决方案还在系统中引入了安全隔离,增强了对网络攻击的保护,这有助于降低数据中心遭受安全漏洞和高价值客户数据泄露的风险。


FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 510浏览
  • 随着全球向绿色能源转型的加速,对高效、可靠和环保元件的需求从未如此强烈。在这种背景下,国产固态继电器(SSR)在实现太阳能逆变器、风力涡轮机和储能系统等关键技术方面发挥着关键作用。本文探讨了绿色能源系统背景下中国固态继电器行业的前景,并强调了2025年的前景。 1.对绿色能源解决方案日益增长的需求绿色能源系统依靠先进的电源管理技术来最大限度地提高效率并最大限度地减少损失。固态继电器以其耐用性、快速开关速度和抗机械磨损而闻名,正日益成为传统机电继电器的首选。可再生能源(尤其是太阳能和风能
    克里雅半导体科技 2025-01-10 16:18 328浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 530浏览
  • 食物浪费已成为全球亟待解决的严峻挑战,并对环境和经济造成了重大影响。最新统计数据显示,全球高达三分之一的粮食在生产过程中损失或被无谓浪费,这不仅导致了资源消耗,还加剧了温室气体排放,并带来了巨大经济损失。全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,艾迈斯欧司朗基于AS7341多光谱传感器开发的创新应用来解决食物浪费这一全球性难题。其多光谱传感解决方案为农业与食品行业带来深远变革,该技术通过精确判定最佳收获时机,提升质量控制水平,并在整个供应链中有效减少浪费。 在2024
    艾迈斯欧司朗 2025-01-14 18:45 68浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 493浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 201浏览
  • 数字隔离芯片是现代电气工程师在进行电路设计时所必须考虑的一种电子元件,主要用于保护低压控制电路中敏感电子设备的稳定运行与操作人员的人身安全。其不仅能隔离两个或多个高低压回路之间的电气联系,还能防止漏电流、共模噪声与浪涌等干扰信号的传播,有效增强电路间信号传输的抗干扰能力,同时提升电子系统的电磁兼容性与通信稳定性。容耦隔离芯片的典型应用原理图值得一提的是,在电子电路中引入隔离措施会带来传输延迟、功耗增加、成本增加与尺寸增加等问题,而数字隔离芯片的目标就是尽可能消除这些不利影响,同时满足安全法规的要
    华普微HOPERF 2025-01-15 09:48 83浏览
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 471浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 113浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 463浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 498浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 449浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦