NapatechIPU解决方案助力优化数据中心存储工作负载

FPGA开发圈 2024-05-16 12:02




Napatech是全球领先的智能网卡(SmartNIC)和IPU解决方案供 应商,业务范围涵盖云计算、企 业和电信数据中心应用等领域。Napatech将商用级软件套件与高 性能硬件相结合,致力于加速网络 基础设施、安全和存储工作负载,从而实现一流的系统级性能,同时为应用和服务提供最大化的服务器计算资源。


作者

Charlie Ashton

Napatech 业务发展高级总监

Rich Howell

 英特尔产品营销经理




越来越多的企业和云数据中心开始采用NVMe/TCP存储技术,因为它在性能、时延、可扩展性、管理和资源利用率等方面优势显著。然而,在服务器上实施所需的存储启动器工作负载会带来巨大的计算开销,并限制可用于运行服务和应用的CPU内核数量。 


这篇解决方案简介介绍了Napatech的集成式软硬件解决方案如何将存储工作负载从主机CPU卸载到IPU,同时在应用级别保持完整的软件兼容性。


该解决方案释放了主机CPU内核,避免其被存储功能占用。它的性能明显优于基于软件的实施方案,可显著降低数据中心的资本支出、运营支出和能耗。它还在系统中引入了安全隔离,增强了对网络攻击的保护,这有助于降低数据中心遭受安全漏洞和高价值客户数据泄露的风险。



NVMe/TCP:面向现代化数据中心的卓越存储技术



NVMe/TCP是一种存储技术,它允许使用标准数据中心结构通过网络访问快速非易失性内存 (NVMe) 存储设备。见图1。


1. 分散式存储架构


越来越多的现代云和企业数据中心开始采用NVME/TCP,因为相比旧的存储协议(如互联网小型计算机系统接口 (iSCSI) 光纤通道),它拥有极具吸引力的优势:


  • 更高的性能:NVMe旨在充分利用基于NAND的现代高速固态盘 (SSD),并提供比传统存储协议更快的数据传输速率。NVMe/TCP将这些优势扩展到网络存储环境,允许数据中心通过网络结构实现高性能存储访问。


  • 更低的延迟:NVMe/TCP的低延迟特性对于数据密集型应用和实时工作负载至关重要。NVMe/TCP可以最大限度地减少通信开销和消除协议转换需求,帮助减少存储访问延迟并提高整体应用性能。 


  • 可扩展性:数据中心经常处理大规模存储部署,NVMe/TCP通过网络提供灵活高效的存储访问解决方案,从而实现无缝的可扩展性。随着NVMe设备数量的增长,数据中心可以在没有明显瓶颈的情况下保持高性能水平。


  • 共享存储池:NVMe/TCP允许创建可同时访问多个服务器和应用的共享存储池。这种共享存储架构提高了资源利用率,简化了存储管理,大大节省了成本。


  • 传统基础设施兼容性:数据中心的现有基础设施通常建立在以太网、InfiniBand或光纤通道网络上。NVMe/TCP允许他们利用现有的结构投资,同时集成创新的基于NVMe的存储技术,而无需大幅调整整个网络基础设施。 


  • 高效的资源利用:NVMe/TCP通过减少应用对每个服务器上专用存储资源的需求,实现了更高的资源利用率。多个服务器可以通过网络访问共享NVMe存储设备,从而优化使用昂贵的NVMe存储资源。


  • 面向未来:随着数据中心不断发展并采用更快的存储技术, NVMe/TCP提供了一种前瞻性的存储访问方法,确保存储网络能够满足不断增长的现代应用和工作负载需求。


整体而言,NVMe/TCP为数据中心提供了一个强大而灵活的存储解决方案,在共享和可扩展的存储环境中实现了高性能、低延迟和高效的资源利用。



纯软件存储架构的限制



尽管NVMe/TCP在存储方面具有显著的优势,但数据中心运营商必须意识到,在方案实施中,如果所需的所有存储启动器服务都在服务器的CPU上运行,这会带来很大的局限性。见图2。


图 2. 基于软件的网络存储


首先,如果存储虚拟化软件、管理程序或虚拟交换机 (vSwitch) 在网络攻击中受损,则会出现系统级安全风险。 


其次,无法确保租户工作负载之间的完全隔离。单个架构在多租户环境中托管多个客户的应用和数据。当应用或虚拟机 (VM) 占用最多可用资源并降低共享基础设施上其他租户的系统性能时,就会出现“噪邻”效应。


最后,运行基础设施服务(如存储虚拟化软件、管理程序和vSwitch)需要很大一部分主机CPU内核。这减少了可用于虚拟机、容器和应用的CPU内核数量。报告指出,30%到50%的数据中心CPU资源通常被基础设施服务消耗。 


在高性能存储子系统中,主机CPU可能需要运行多个协议, 如传输控制协议 (TCP)、基于融合以太网的远程直接内存访问 (RoCEv2)、InfiniBand和光纤通道。当主机CPU被大量用于运行这些存储协议和其他基础设施服务时,租户应用可用的CPU内核数量将大大减少。例如,16核CPU可能只能提供10核CPU的性能。 


由于这些原因和其他原因,纯软件架构给数据中心存储带来了重大的业务和技术挑战。



基于IPU的存储卸载解决方案



将NVMe/TCP工作负载卸载到IPU,以及其他基础设施服务(如管理程序和vSwitch,见图3),解决了纯软件实施方案的局限性,并为数据中心运营商带来了显著优势:


  • CPU利用:NVMe/TCP通信需要将NVMe命令和数据封装在TCP传输协议中,主机CPU处理则会这些封装和解封装任务。将这些操作卸载到专用硬件上可以让CPU专注于其他关键任务,从而提高整体系统性能和CPU利用率。


  • 更低延迟:将NVMe/TCP通信任务卸载到专用硬件可以显著减少处理存储命令的延迟。因此,在访问远程NVMe存储设备时,应用可以体验到更快的响应速度和更高的性能。 


  • 高效数据移动:将非CPU应用任务卸载到独立的硬件加速器上,可以比使用通用CPU更高效地执行数据移动操作。它可以有效地处理大数据传输和缓冲区管理,减少延迟并提高总体吞吐量。


  • 更高的可扩展性:卸载NVMe/TCP任务可以提高大规模存储部署的可扩展性。通过减轻CPU处理网络通信的负担,系统可以支持更多的并发连接和存储设备,而不会受到CPU的限制。


  • 高能效:通过将某些任务卸载到专用硬件,可以降低主机CPU的功耗。这种能效在大型数据中心环境中尤其重要,因为功耗是一个重要的考虑因素。


除了上述适用于NVMe/TCP存储工作负载的优势之外,基于IPU的系统架构还提供了增量安全隔离选项,从而将基础设施服务与租户应用隔离开来。这样可以确保存储、管理程序和vSwitch服务免受租户应用发起的网络攻击。基础设施服务是安全的,因为IPU本身的启动过程是安全的;而IPU充当主机服务器的信任根。


图 3. 支持IPU的分散式存储



Napatech存储卸载解决方案



Napatech为数据中心存储卸载提供了一个集成的系统级解决方案,包括在F2070X IPU上运行的高性能Link-Storage软件堆栈。见图4。


图 4. Napatech存储卸载


Link-Storage软件包含一套丰富的功能,包括:


  • 将NVMe/TCP工作负载从主机完全卸载到IPU;


  • 将TCP工作负载从主机完全卸载到IPU;


  • NVMe到TCP启动器;


  • 通过存储性能开发套件远程过程调用 (SPDK RPC) 接口进行存储配置;


  • 多路径NVMe支持;


  • 通过virtio- blk接口向主机显示16块设备;


  • 兼容普通Linux* 发行版中的标准virtio-blk驱动程序;


  • 主机CPU和IPU之间的安全隔离,没有暴露于主机的网络接口。


除了Link-Storage,F2070X还支持Link-Virtualization软件,该软件提供了一个卸载和加速的虚拟化数据平面,包括开放式vSwitch (OVS)、实时迁移、虚拟机到虚拟机镜像、 VLAN/VxLAN封装/解封装、Q-in-Q、接收端扩展 (RSS) 负载均衡、链路聚合和服务质量 (QoS) 等功能。 


由于F2070X基于FPGA和CPU(而非ASIC),因此可以在部署后更新平台的完整功能。无论是修改现有服务、添加新功能还是微调特定的性能参数,这种重新编程都可以纯粹作为现有服务器环境中的软件升级来执行,而无需断开、移除或更换任何硬件。


Napatech F2070X IPU



基于英特尔F2000X-PL的Napatech F2070X IPU是一款2x100G PCIe卡,采用英特尔® Agilex 7 FPGA F系列和英特尔® 至强® D处理器,拥有全高半长 (FHHL) 双插槽外形。请见图5了解详情。


图 5. F2000X-PL结构图


F2070X IPU的标准配置包括一个带有四组4GB DDR4内存的英特尔® Agilex 7 FPGA AGF023和一个带有两组8GB DDR4内存的2.3 GHz英特尔® 至强D-1736处理器。可以提供其他配置选项来支持特定的工作负载。


F2070X IPU通过PCIe 4.0 x16 (16 GTps) 接口连接到主机,FPGA和处理器之间还有一个额外的PCIe 4.0 x16 (16 GTps) 接口。


两个前面板QSFP28/56网络接口支持以下网络配置:


  • 2x100G; 
  • 8x10G或8x25G(使用分支电缆)。 


专用PTPRJ45端口提供与外部SMA-F和内部MCX-F接口的可选时间同步。支持IEEE 1588v2时间戳。 


专用的RJ45以太网连接器提供主板管理功能。安全的FPGA图像更新支持在IPU部署完成后增加新功能或更新现有功能。 


处理器运行Fedora Linux,具有UEFI BIOS、PXE启动支持、通过SSH进行完整shell访问和UART。



总 结



越来越多的企业和云数据中心开始采用NVMe/TCP存储技术,因为它在性能、时延、可扩展性、管理和资源利用率等方面优势显著。然而,在服务器的主机CPU上实施所需的存储启动器工作负载会带来巨大的计算开销,并限制可用于运行服务和应用的CPU内核数量。


Napatech的集成式软硬件解决方案包括在F2070X IPU(图6)上运行的Link-Storage软件堆栈,通过将存储工作负载从主机CPU卸载到IPU来解决此问题,同时在应用级别保持完整的软件兼容性。


图 6. Napatech F2070X IPU


Napatech的存储卸载解决方案释放了主机CPU内核,避免其被存储功能占用。它的性能明显优于基于软件的实施,可显著降低数据中心的资本支出、运营支出和能耗。 


Napatech解决方案还在系统中引入了安全隔离,增强了对网络攻击的保护,这有助于降低数据中心遭受安全漏洞和高价值客户数据泄露的风险。


FPGA开发圈 这里介绍、交流、有关FPGA开发资料(文档下载,技术解答等),提升FPGA应用能力。
评论 (0)
  •     在研究Corona现象时发现:临界电压与介电材料表面的清洁程度有关。表面越清洁的介电材料,临界电压越高;表面污染物越多的地方,越容易“爬电”。关于Corona现象,另见基础理论第007篇。    这里说的“污染物”,定义为——可能影响介电强度或表面电阻率的固体、液体或气体(电离气体)的任何情况。    IEC 60664-1 (对应GB/T 16935.1-2023) 定义了 Pollution Degree,中文术语是“污染等
    电子知识打边炉 2025-04-07 22:06 73浏览
  • 曾几何时,汽车之家可是汽车资讯平台领域响当当的“扛把子”。2005 年成立之初,它就像一位贴心的汽车小助手,一下子就抓住了大家的心。它不仅吸引了海量用户,更是成为汽车厂商和经销商眼中的“香饽饽”,广告投放、合作推广不断,营收和利润一路高歌猛进,2013年成功在纽交所上市,风光无限。2021年更是在香港二次上市,达到了发展的巅峰,当年3月15日上市首日,港股股价一度高达184.6港元,市值可观。然而,如今的汽车之家却陷入了困境,业务下滑明显。业务增长瓶颈从近年来汽车之家公布的财报数据来看,情况不容
    用户1742991715177 2025-04-07 21:48 77浏览
  • HDMI从2.1版本开始采用FRL传输模式,和2.0及之前的版本不同。两者在物理层信号上有所区别,这就需要在一些2.1版本的电路设计上增加匹配电路,使得2.1版本的电路能够向下兼容2.0及之前版本。2.1版本的信号特性下面截取自2.1版本规范定义,可以看到2.1版本支持直流耦合和交流耦合,其共模电压和AVCC相关,信号摆幅在400mV-1200mV2.0及之前版本的信号特性HDMI2.0及之前版本采用TMDS信号物理层,其结构和参数如下:兼容设计根据以上规范定义,可以看出TMDS信号的共模电压范
    durid 2025-04-08 19:01 80浏览
  •   工业自动化领域电磁兼容与接地系统深度剖析   一、电磁兼容(EMC)基础认知   定义及关键意义   电磁兼容性(EMC),指的是设备或者系统在既定的电磁环境里,不但能按预期功能正常运转,而且不会对周边其他设备或系统造成难以承受的电磁干扰。在工业自动化不断发展的当下,大功率电机、变频器等设备被大量应用,现场总线、工业网络等技术也日益普及,致使工业自动化系统所处的电磁环境变得愈发复杂,电磁兼容(EMC)问题也越发严峻。   ​电磁兼容三大核心要素   屏蔽:屏蔽旨在切断电磁波的传播路
    北京华盛恒辉软件开发 2025-04-07 22:55 140浏览
  • 贞光科技作为三星电机车规电容代理商,针对电动汽车领域日益复杂的电容选型难题,提供全方位一站式解决方案。面对高温稳定性、高可靠性、高纹波电流和小型化等严苛要求,三星车规电容凭借完整产品矩阵和卓越技术优势,完美满足BMS、电机控制器和OBC等核心系统需求。无论技术选型、供应链保障、样品测试还是成本优化,贞光科技助力客户在电动汽车产业高速发展中占据技术先机。在电动汽车技术高速发展的今天,作为汽车电子系统中不可或缺的关键元器件,电容的选型已成为困扰许多工程师和采购人员的难题。如何在众多参数和型号中找到最
    贞光科技 2025-04-07 17:06 59浏览
  •     根据 IEC术语,瞬态过电压是指持续时间几个毫秒及以下的过高电压,通常是以高阻尼(快速衰减)形式出现,波形可以是振荡的,也可以是非振荡的。    瞬态过电压的成因和机理,IEC 60664-1给出了以下四种:    1. 自然放电,最典型的例子是雷击,感应到电力线路上,并通过电网配电系统传输,抵达用户端;        2. 电网中非特定感性负载通断。例如热处理工厂、机加工工厂对
    电子知识打边炉 2025-04-07 22:59 85浏览
  • 在人工智能技术飞速发展的今天,语音交互正以颠覆性的方式重塑我们的生活体验。WTK6900系列语音识别芯片凭借其离线高性能、抗噪远场识别、毫秒级响应的核心优势,为智能家居领域注入全新活力。以智能风扇为起点,我们开启一场“解放双手”的科技革命,让每一缕凉风都随“声”而至。一、核心技术:精准识别,无惧环境挑战自适应降噪,听懂你的每一句话WTK6900系列芯片搭载前沿信号处理技术,通过自适应降噪算法,可智能过滤环境噪声干扰。无论是家中电视声、户外虫鸣声,还是厨房烹饪的嘈杂声,芯片均能精准提取有效指令,识
    广州唯创电子 2025-04-08 08:40 125浏览
  • 在万物互联时代,智能化安防需求持续升级,传统报警系统已难以满足实时性、可靠性与安全性并重的要求。WT2003H-16S低功耗语音芯片方案,以4G实时音频传输、超低功耗设计、端云加密交互为核心,重新定义智能报警设备的性能边界,为家庭、工业、公共安防等领域提供高效、稳定的安全守护。一、技术内核:五大核心突破,构建全场景安防基座1. 双模音频传输,灵活应对复杂场景实时音频流传输:内置高灵敏度MIC,支持环境音实时采集,通过4G模块直接上传至云端服务器,响应速度低至毫秒级,适用于火灾警报、紧急呼救等需即
    广州唯创电子 2025-04-08 08:59 104浏览
  • 文/Leon编辑/cc孙聪颖‍转手绢、跳舞、骑车、后空翻,就在宇树、智元等独角兽企业率领“机器人大军”入侵短视频时,却有资本和科技大佬向此产业泼了一盆冷水。金沙江创投管理合伙人朱啸虎近日突然对人形机器人发难,他表示“最近几个月正在批量退出人形机器人公司”。“只是买回去做研究的,或者买回去做展示的,这种都不是我们意义上的商业化,谁会花十几万买一个机器人去干这些活?”朱啸虎吐槽。不过,朱啸虎的观点很快就遭到驳斥,众擎机器人的创始人、董事长赵同阳回怼道:“(朱啸虎)甚至问出了人形机器人在这个阶段有什么
    华尔街科技眼 2025-04-07 19:24 115浏览
  • 在全球电子产业面临供应链波动、技术迭代和市场需求变化等多重挑战的背景下,安博电子始终秉持“让合作伙伴赢得更多一点”的核心理念,致力于打造稳健、高效、可持续的全球供应链体系。依托覆盖供应商管理、品质检测、智能交付的全链路品控体系,安博电子不仅能确保电子元器件的高可靠性与一致性,更以高透明的供应链管理模式,助力客户降低风险、提升运营效率,推动行业标准升级,与全球合作伙伴共同塑造更具前瞻性的产业生态。动态优选机制:构建纯净供应链生态安博电子将供应商管理视为供应链安全的根基。打造动态优选管控体系,以严格
    电子资讯报 2025-04-07 17:06 72浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦