使用NVIDIADOCA2.2加速数据中心工作负载和AI应用程序

英伟达NVIDIA中国 2023-09-05 19:30



NVIDIA DOCA SDK 和加速框架为开发者提供了丰富的库、驱动程序和 API,以便为 NVIDIA BlueField DPU 和 ConnectX 智能网卡创建高性能应用程序和服务。它推动了数据中心的创新,实现了应用程序的快速部署。


凭借全面的功能,NVIDIA DOCA 可为基于 BlueField DPU 进行开发的开发人员提供大规模加速数据中心工作负载和人工智能应用程序的一站式服务。


NVIDIA DOCA 现已普遍可用,已使超过 10,000 名开发者从中受益,并使更广泛的开发者社区利用 BlueField DPU 平台实现创新的人工智能和云服务。


NVIDIA DOCA 2.2 的新增和增强功能


NVIDIA DOCA 2.2 引入了新增功能和增强功能,用于卸载、加速和隔离数据中心内的网络、存储、安全和基础设施管理。


视频 1:观看  NVIDIA DOCA 软件框架简介


可编程性


NVIDIA BlueField-3 DPU 与其板载专用数据路径加速器(DPA)和 DOCA SDK 框架相结合,提供了一个无与伦比的平台。现在,开发者可以创建需要高吞吐量和低延迟的高性能且可扩展的网络应用程序。


数据路径加速器


为利用 BlueField-3 DPA 编程子系统,NVIDIA DOCA 2.2 提供了几项增强功能。DOCA DPA 是 DOCA SDK 开发包的一个新计算子系统部分,它提供了一个编程模型,用于卸载在 DPA 处理器上运行的以通信为中心的用户代码。DOCA DPA 有助于卸载 CPU 流量,并通过 DPU 加速提高性能。


图 1:NVIDIA BlueField-3 DPU 流入和流出流量


DOCA DPA 还提供了显著的开发优势,包括在创建自定义模拟和拥塞控制时具有更高的灵活性。定制的拥塞控制对于人工智能工作流至关重要,可以实现性能隔离、提高公平性,并防止在有损网络上的丢包。


DOCA 2.2 版本引入了以下 SDK:


  • DOCA-FlexIO:这是一个用于 DPA 编程的低级别 SDK。具体来说,DOCA FlexIO 驱动程序提供了用于通过 DPA 管理和运行代码的 API。


  • DOCA-PCC:这是一个用于拥塞控制开发的 SDK,它使 CSP 和企业客户能够创建自己的拥塞控制算法,从而通过更高的带宽和更低的延迟来提高网络运营的稳定性和效率。


NVIDIA 还提供必要的工具链、示例和辅助资料,以加快和支持开发工作。请注意,NVIDIA DOCA DPA 可在 DPU 模式和 NIC 模式下使用。


图 2:DOCA-PCC 提供更高的带宽和更低的延迟


网络


NVIDIA DOCA 和 BlueField-3 DPU 通过一个全面、开放的开发平台,共同开发出具有突破性网络性能的应用程序。NVIDIA DOCA 包括一系列驱动程序、库、工具和示例应用程序,并在不断发展。此版本提供了以下其他功能,以支持网络应用程序的开发。


NVIDIA DOCA Flow


借助 NVIDIA DOCA Flow,用户可以定义和控制网络流量,实现网络策略,并以编程方式管理网络资源。它提供网络虚拟化、遥测、负载平衡、安全强制和流量监控等功能。这些功能有助于以低延迟处理高数据包工作负载,节省 CPU 资源并降低功耗。


此版本包括以下新功能,可为云部署带来即时优势:


  • 支持隧道卸载 - GENEVE 和 GRE:提供增强的安全性、可见性、可扩展性、灵活性和可扩展性,是站点通信、网络隔离和多租户的构建块。具体而言,GRE 隧道用于连接单独的网络并建立安全的 VPN 通信,支持 Overlay 网络,提供协议灵活性,并实现流量工程。


  • 支持具有 bps / pps 选项的每个流计量:在云环境中,监控 / 分析流量(即测量带宽或数据包速率)、管理 QoS(即执行限制)或增强安全性(即阻止拒绝服务攻击)都至关重要。


  • 增强的镜像功能(FDB / 交换机域):这项新增功能不仅用于监控、故障排除、安全分析和性能优化,还能为镜像工作负载提供更高的 CPU 利用率。


OVS-DOCA (Beta 版) 


OVS-DOCA 是适用于 NVIDIA 网络服务的高度优化虚拟交换机。其极其高效的设计通过 NVIDIA 网卡或 DPU 提升了下一代性能和规模。现在,OVS-DOCA 可以在 DOCA 中用于 DPU,也可以在 DOCA 中用于主机(二进制文件和源代码)。


图 3:OVS- DOCA 针对 NVIDIA 网络服务进行了优化


基于 Open vSwitch,OVS-DOCA 提供了相同的北向 API、OpenFlow、CLI 和数据接口,为 OVS 提供了一种替代方案。使用 OVS-DOCA 可以更快地实现未来 NVIDIA 创新的网络功能。


BlueField-3(增强的)NIC 模式(Beta 版)


此版本受益于增强的 BlueField-3 NIC 模式,目前处于 Beta 版。与卸载、加速和隔离都可用的 BlueField-3 DPU 模式不同,BlueField-3 NIC 模式仅提供加速功能。


图 4:BlueField-3(增强的)NIC 模式


在继续利用 BlueField 低功耗和低计算密集型 SKU 的同时,增强的 BlueField-3 NIC 模式比当前的 ConnectX BlueField-2 NIC 模式具有许多优势,包括:


  • 使用本地 DPU 内存大规模实现更高的性能和更低的延迟

  • 采用可编程拥塞控制(PCC)的高性能 RDMA

  • 利用 DPA 和其他 BlueField 加速器实现可编程性

  • 通过设备认证和卡载 BMC 实现强大平台安全性


请注意,BlueField-3 NIC 模式将作为一种软件模式进行产品化,而非单独的 SKU,以实现未来使用 DPU 模式。因此,BlueField-3 NIC 模式是所有 BlueField-3 SKU 上都可以使用的且完全支持的软件功能。对于在 NIC 模式下运行的任何 BlueField-3 DPU,DPA 可编程性要求在主机上安装 DOCA 和活跃的基于主机服务。


服务


NVIDIA DOCA 服务是一种基于容器化 DOCA 程序,为特定用例提供端到端解决方案。这些服务可以通过 NVIDIA  NGC 获得,从而可以轻松地将它们直接部署到 DPU。DOCA 2.2 提供了更好的控制能力,现在可以离线安装 DOCA 服务。


NGC 离线服务安装


从 NGC 安装 DOCA 服务需要互联网连接。然而,许多客户在没有互联网接入的安全生产环境中运营。因此,我们提供了“非连接”部署选项,可以在完全安全的生产环境中安装服务,从而简化流程,并避免了每台服务器都需要连接才能完成安装过程的情况。


例如,考虑在生产环境中安装 DOCA 遥测服务(DTS)以支持计量收集。整个安装过程只需两个步骤即可完成:

  • 步骤 1:在已连接的服务器上下载 NGC

  • 步骤 2:使用内部安全交付进行离线安装


总结


NVIDIA DOCA 2.2 在推动数据中心创新以及为人工智能应用而改造云和企业数据中心网络方面发挥着关键和不可或缺的作用。通过为 BlueField DPU 提供全面的 SDK 和加速框架,DOCA 为开发者提供了强大的库、驱动程序和 API,从而能够创建高性能的应用程序和服务。


DOCA 2.2 有了一些新增功能和增强功能,可以立即获得许多优势。除了通过 DPU 加速实现的性能提升外,DOCA-FlexIO 和 DOCA-PCC SDK 的加入为开发者提供了以人工智能为中心的加速计算优势。这些 SDK 能够创建自定义模拟和算法,缩短上市时间,并显著改善整体开发体验。


此外,NVIDIA DOCA FLOW 和 OVS-DOCA 的网络特定更新为软件定义的网络和安全解决方案提供了简化的交付途径。这些功能提高了效率,增强了可见性、可扩展性和灵活性,对于构建复杂而安全的基础架构至关重要。


DOCA 为数据中心创新、人工智能应用加速和强大的网络基础设施做出了广泛贡献,是 NVIDIA 人工智能云服务的重要组成部分。随着行业朝着更复杂、更苛刻的计算需求发展,DOCA 的不断发展以及与尖端技术的集成将进一步巩固其作为开创性平台的地位,为数据中心和人工智能驱动的解决方案的未来赋能。


扫描下方二维码立即访问 DOCA。




更多精彩内容

利用 NVIDIA DOCA Flow 实现 DPU 加速数据包转向逻辑
使用 NVIDIA DOCA GPUNetIO 实现实时网络处理功能
利用 NVIDIA DOCA 2.0 改变 IPsec 的部署

评论
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 105浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 75浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 101浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 70浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 45浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 86浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 41浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 52浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦