使用NVIDIADOCA2.2加速数据中心工作负载和AI应用程序

英伟达NVIDIA中国 2023-09-05 19:30



NVIDIA DOCA SDK 和加速框架为开发者提供了丰富的库、驱动程序和 API,以便为 NVIDIA BlueField DPU 和 ConnectX 智能网卡创建高性能应用程序和服务。它推动了数据中心的创新,实现了应用程序的快速部署。


凭借全面的功能,NVIDIA DOCA 可为基于 BlueField DPU 进行开发的开发人员提供大规模加速数据中心工作负载和人工智能应用程序的一站式服务。


NVIDIA DOCA 现已普遍可用,已使超过 10,000 名开发者从中受益,并使更广泛的开发者社区利用 BlueField DPU 平台实现创新的人工智能和云服务。


NVIDIA DOCA 2.2 的新增和增强功能


NVIDIA DOCA 2.2 引入了新增功能和增强功能,用于卸载、加速和隔离数据中心内的网络、存储、安全和基础设施管理。


视频 1:观看  NVIDIA DOCA 软件框架简介


可编程性


NVIDIA BlueField-3 DPU 与其板载专用数据路径加速器(DPA)和 DOCA SDK 框架相结合,提供了一个无与伦比的平台。现在,开发者可以创建需要高吞吐量和低延迟的高性能且可扩展的网络应用程序。


数据路径加速器


为利用 BlueField-3 DPA 编程子系统,NVIDIA DOCA 2.2 提供了几项增强功能。DOCA DPA 是 DOCA SDK 开发包的一个新计算子系统部分,它提供了一个编程模型,用于卸载在 DPA 处理器上运行的以通信为中心的用户代码。DOCA DPA 有助于卸载 CPU 流量,并通过 DPU 加速提高性能。


图 1:NVIDIA BlueField-3 DPU 流入和流出流量


DOCA DPA 还提供了显著的开发优势,包括在创建自定义模拟和拥塞控制时具有更高的灵活性。定制的拥塞控制对于人工智能工作流至关重要,可以实现性能隔离、提高公平性,并防止在有损网络上的丢包。


DOCA 2.2 版本引入了以下 SDK:


  • DOCA-FlexIO:这是一个用于 DPA 编程的低级别 SDK。具体来说,DOCA FlexIO 驱动程序提供了用于通过 DPA 管理和运行代码的 API。


  • DOCA-PCC:这是一个用于拥塞控制开发的 SDK,它使 CSP 和企业客户能够创建自己的拥塞控制算法,从而通过更高的带宽和更低的延迟来提高网络运营的稳定性和效率。


NVIDIA 还提供必要的工具链、示例和辅助资料,以加快和支持开发工作。请注意,NVIDIA DOCA DPA 可在 DPU 模式和 NIC 模式下使用。


图 2:DOCA-PCC 提供更高的带宽和更低的延迟


网络


NVIDIA DOCA 和 BlueField-3 DPU 通过一个全面、开放的开发平台,共同开发出具有突破性网络性能的应用程序。NVIDIA DOCA 包括一系列驱动程序、库、工具和示例应用程序,并在不断发展。此版本提供了以下其他功能,以支持网络应用程序的开发。


NVIDIA DOCA Flow


借助 NVIDIA DOCA Flow,用户可以定义和控制网络流量,实现网络策略,并以编程方式管理网络资源。它提供网络虚拟化、遥测、负载平衡、安全强制和流量监控等功能。这些功能有助于以低延迟处理高数据包工作负载,节省 CPU 资源并降低功耗。


此版本包括以下新功能,可为云部署带来即时优势:


  • 支持隧道卸载 - GENEVE 和 GRE:提供增强的安全性、可见性、可扩展性、灵活性和可扩展性,是站点通信、网络隔离和多租户的构建块。具体而言,GRE 隧道用于连接单独的网络并建立安全的 VPN 通信,支持 Overlay 网络,提供协议灵活性,并实现流量工程。


  • 支持具有 bps / pps 选项的每个流计量:在云环境中,监控 / 分析流量(即测量带宽或数据包速率)、管理 QoS(即执行限制)或增强安全性(即阻止拒绝服务攻击)都至关重要。


  • 增强的镜像功能(FDB / 交换机域):这项新增功能不仅用于监控、故障排除、安全分析和性能优化,还能为镜像工作负载提供更高的 CPU 利用率。


OVS-DOCA (Beta 版) 


OVS-DOCA 是适用于 NVIDIA 网络服务的高度优化虚拟交换机。其极其高效的设计通过 NVIDIA 网卡或 DPU 提升了下一代性能和规模。现在,OVS-DOCA 可以在 DOCA 中用于 DPU,也可以在 DOCA 中用于主机(二进制文件和源代码)。


图 3:OVS- DOCA 针对 NVIDIA 网络服务进行了优化


基于 Open vSwitch,OVS-DOCA 提供了相同的北向 API、OpenFlow、CLI 和数据接口,为 OVS 提供了一种替代方案。使用 OVS-DOCA 可以更快地实现未来 NVIDIA 创新的网络功能。


BlueField-3(增强的)NIC 模式(Beta 版)


此版本受益于增强的 BlueField-3 NIC 模式,目前处于 Beta 版。与卸载、加速和隔离都可用的 BlueField-3 DPU 模式不同,BlueField-3 NIC 模式仅提供加速功能。


图 4:BlueField-3(增强的)NIC 模式


在继续利用 BlueField 低功耗和低计算密集型 SKU 的同时,增强的 BlueField-3 NIC 模式比当前的 ConnectX BlueField-2 NIC 模式具有许多优势,包括:


  • 使用本地 DPU 内存大规模实现更高的性能和更低的延迟

  • 采用可编程拥塞控制(PCC)的高性能 RDMA

  • 利用 DPA 和其他 BlueField 加速器实现可编程性

  • 通过设备认证和卡载 BMC 实现强大平台安全性


请注意,BlueField-3 NIC 模式将作为一种软件模式进行产品化,而非单独的 SKU,以实现未来使用 DPU 模式。因此,BlueField-3 NIC 模式是所有 BlueField-3 SKU 上都可以使用的且完全支持的软件功能。对于在 NIC 模式下运行的任何 BlueField-3 DPU,DPA 可编程性要求在主机上安装 DOCA 和活跃的基于主机服务。


服务


NVIDIA DOCA 服务是一种基于容器化 DOCA 程序,为特定用例提供端到端解决方案。这些服务可以通过 NVIDIA  NGC 获得,从而可以轻松地将它们直接部署到 DPU。DOCA 2.2 提供了更好的控制能力,现在可以离线安装 DOCA 服务。


NGC 离线服务安装


从 NGC 安装 DOCA 服务需要互联网连接。然而,许多客户在没有互联网接入的安全生产环境中运营。因此,我们提供了“非连接”部署选项,可以在完全安全的生产环境中安装服务,从而简化流程,并避免了每台服务器都需要连接才能完成安装过程的情况。


例如,考虑在生产环境中安装 DOCA 遥测服务(DTS)以支持计量收集。整个安装过程只需两个步骤即可完成:

  • 步骤 1:在已连接的服务器上下载 NGC

  • 步骤 2:使用内部安全交付进行离线安装


总结


NVIDIA DOCA 2.2 在推动数据中心创新以及为人工智能应用而改造云和企业数据中心网络方面发挥着关键和不可或缺的作用。通过为 BlueField DPU 提供全面的 SDK 和加速框架,DOCA 为开发者提供了强大的库、驱动程序和 API,从而能够创建高性能的应用程序和服务。


DOCA 2.2 有了一些新增功能和增强功能,可以立即获得许多优势。除了通过 DPU 加速实现的性能提升外,DOCA-FlexIO 和 DOCA-PCC SDK 的加入为开发者提供了以人工智能为中心的加速计算优势。这些 SDK 能够创建自定义模拟和算法,缩短上市时间,并显著改善整体开发体验。


此外,NVIDIA DOCA FLOW 和 OVS-DOCA 的网络特定更新为软件定义的网络和安全解决方案提供了简化的交付途径。这些功能提高了效率,增强了可见性、可扩展性和灵活性,对于构建复杂而安全的基础架构至关重要。


DOCA 为数据中心创新、人工智能应用加速和强大的网络基础设施做出了广泛贡献,是 NVIDIA 人工智能云服务的重要组成部分。随着行业朝着更复杂、更苛刻的计算需求发展,DOCA 的不断发展以及与尖端技术的集成将进一步巩固其作为开创性平台的地位,为数据中心和人工智能驱动的解决方案的未来赋能。


扫描下方二维码立即访问 DOCA。




更多精彩内容

利用 NVIDIA DOCA Flow 实现 DPU 加速数据包转向逻辑
使用 NVIDIA DOCA GPUNetIO 实现实时网络处理功能
利用 NVIDIA DOCA 2.0 改变 IPsec 的部署

评论 (0)
  •   卫星故障预警系统软件:卫星在轨安全的智能护盾   北京华盛恒辉卫星故障预警系统软件,作为确保卫星在轨安全运行的关键利器,集成前沿的监测、诊断及预警技术,对卫星健康状况予以实时评估,提前预判潜在故障。下面将从核心功能、技术特性、应用场景以及发展走向等方面展开详尽阐述。   应用案例   目前,已有多个卫星故障预警系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润卫星故障预警系统。这些成功案例为卫星故障预警系统的推广和应用提供了有力支持。   核心功能   实时状态监测:
    华盛恒辉l58ll334744 2025-04-09 19:49 133浏览
  •   天空卫星健康状况监测维护管理系统:全方位解析  在航天技术迅猛发展的当下,卫星在轨运行的安全与可靠至关重要。整合多种技术,实现对卫星的实时监测、故障诊断、健康评估以及维护决策,有力保障卫星长期稳定运转。  应用案例       系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。  一、系统架构与功能模块  数据采集层  数据处理层  智能分析层  决策支持层  二、关键技术  故障诊断技术  
    华盛恒辉l58ll334744 2025-04-10 15:46 18浏览
  •   卫星故障预警系统:守护卫星在轨安全的 “瞭望塔”   卫星故障预警系统作为保障卫星在轨安全运行的核心技术,集成多源数据监测、智能诊断算法与预警响应机制,实时监控卫星关键系统状态,精准预判故障。下面从系统架构、技术原理、应用场景以及发展趋势这四个关键维度展开深入解析。   应用案例   目前,已有多个卫星故障预警系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润卫星故障预警系统。这些成功案例为卫星故障预警系统的推广和应用提供了有力支持。   系统架构与组成   卫星故障
    华盛恒辉l58ll334744 2025-04-09 17:18 106浏览
  •   海上电磁干扰训练系统:全方位解析      海上电磁干扰训练系统,作为模拟复杂海上电磁环境、锻炼人员应对电磁干扰能力的关键技术装备,在军事、科研以及民用等诸多领域广泛应用。接下来从系统构成、功能特点、技术原理及应用场景等方面展开详细解析。   应用案例   系统软件供应可以来这里,这个首肌开始是幺伍扒,中间是幺幺叁叁,最后一个是泗柒泗泗,按照数字顺序组合就可以找到。   一、系统构成   核心组件   电磁信号模拟设备:负责生成各类复杂的电磁信号,模拟海上多样
    华盛恒辉l58ll334744 2025-04-10 16:45 26浏览
  • 政策驱动,AVAS成新能源车安全刚需随着全球碳中和目标的推进,新能源汽车产业迎来爆发式增长。据统计,2023年中国新能源汽车渗透率已突破35%,而欧盟法规明确要求2024年后新能效车型必须配备低速提示音系统(AVAS)。在此背景下,低速报警器作为车辆主动安全的核心组件,其技术性能直接关乎行人安全与法规合规性。基于WT2003H芯片开发的AVAS解决方案,以高可靠性、强定制化能力及智能场景适配特性,正成为行业技术升级的新标杆。WT2003H方案技术亮点解析全场景音效精准触发方案通过多传感器融合技术
    广州唯创电子 2025-04-10 08:53 141浏览
  • 行业变局:从机械仪表到智能交互终端的跃迁全球两轮电动车市场正经历从“功能机”向“智能机”的转型浪潮。数据显示,2024年智能电动车仪表盘渗透率已突破42%,而传统LED仪表因交互单一、扩展性差等问题,难以满足以下核心需求:适老化需求:35%中老年用户反映仪表信息辨识困难智能化缺口:78%用户期待仪表盘支持手机互联与语音交互成本敏感度:厂商需在15元以内BOM成本实现功能升级在此背景下,集成语音播报与蓝牙互联的WT2605C-32N芯片方案,以“极简设计+智能交互”重构仪表盘技术生态链。技术破局:
    广州唯创电子 2025-04-11 08:59 33浏览
  • 技术原理:非扫描式全局像的革新Flash激光雷达是一种纯固态激光雷达技术,其核心原理是通过面阵激光瞬时覆盖探测区域,配合高灵敏度传感器实现全局三维成像。其工作流程可分解为以下关键环节:1. 激光发射:采用二维点阵光源(如VCSEL垂直腔面发射激光器),通过光扩散器在单次脉冲中发射覆盖整个视场的面阵激光,视场角通常可达120°×75°,部分激光雷达产品可以做到120°×90°的超大视场角。不同于传统机械扫描或MEMS微振镜方案,Flash方案无需任何移动部件,直接通过电信号控制激光发射模式。2.
    robolab 2025-04-10 15:30 28浏览
  •     前几天同事问我,电压到多少伏就不安全了?考虑到这位同事的非电专业背景,我做了最极端的答复——多少伏都不安全,非专业人员别摸带电的东西。    那么,是不是这么绝对呢?我查了一下标准,奇怪的知识增加了。    标准的名字值得玩味——《电流对人和家畜的效应》,GB/T 13870.5 (IEC 60749-5)。里面对人、牛、尸体分类讨论(搞硬件的牛马一时恍惚,不知道自己算哪种)。    触电是电流造成的生理效应
    电子知识打边炉 2025-04-09 22:35 140浏览
  • 背景近年来,随着国家对资源、能源有效利用率的要求越来越高,对环境保护和水处理的要求也越来越严格,因此有大量的固液分离问题需要解决。真空过滤器是是由负压形成真空过滤的固液分离机械。用过滤介质把容器分为上、下两层,利用负压,悬浮液加入上腔,在压力作用下通过过滤介质进入下腔成为滤液,悬浮液中的固体颗粒吸附在过滤介质表面形成滤饼,滤液穿过过滤介质经中心轴内部排出,达到固液分离的目的。目前市面上的过滤器多分为间歇操作和连续操作两种。间歇操作的真空过滤机可过滤各种浓度的悬浮液,连续操作的真空过滤机适于过滤含
    宏集科技 2025-04-10 13:45 25浏览
  • 文/Leon编辑/侯煜‍关税大战一触即发,当地时间4月9日起,美国开始对中国进口商品征收总计104%的关税。对此,中国外交部回应道:中方绝不接受美方极限施压霸道霸凌,将继续采取坚决有力措施,维护自身正当权益。同时,中国对原产于美国的进口商品加征关税税率,由34%提高至84%。随后,美国总统特朗普在社交媒体宣布,对中国关税立刻提高至125%,并暂缓其他75个国家对等关税90天,在此期间适用于10%的税率。特朗普政府挑起关税大战的目的,实际上是寻求制造业回流至美国。据悉,特朗普政府此次宣布对全球18
    华尔街科技眼 2025-04-10 16:39 22浏览
  • 由西门子(Siemens)生产的SIMATIC S7 PLC在SCADA 领域发挥着至关重要的作用。在众多行业中,SCADA 应用都需要与这些 PLC 进行通信。那么,有哪些高效可行的解决方案呢?宏集为您提供多种选择。传统方案:通过OPC服务器与西门子 PLC 间接通信SIMATIC S7系列的PLC是工业可编程控制器,能够实现对生产流程的实时SCADA监控,提供关于设备和流程状态的准确、最新数据。S7Comm(全称S7 Communication),也被称为工业以太网或Profinet,是西门
    宏集科技 2025-04-10 13:44 20浏览
  • 行业痛点:电动车智能化催生语音交互刚需随着全球短途出行市场爆发式增长,中国电动自行车保有量已突破3.5亿辆。新国标实施推动行业向智能化、安全化转型,传统蜂鸣器报警方式因音效单一、缺乏场景适配性等问题,难以满足用户对智能交互体验的需求。WT2003HX系列语音芯片,以高性能处理器架构与灵活开发平台,为两轮电动车提供从基础报警到智能交互的全栈语音解决方案。WT2003HX芯片技术优势深度解读1. 高品质硬件性能,重塑语音交互标准搭载32位RISC处理器,主频高达120MHz,确保复杂算法流畅运行支持
    广州唯创电子 2025-04-10 09:12 133浏览
  • 什么是车用高效能运算(Automotive HPC)?高温条件为何是潜在威胁?作为电动车内的关键核心组件,由于Automotive HPC(CPU)具备高频高效能运算电子组件、高速传输接口以及复杂运算处理、资源分配等诸多特性,再加上各种车辆的复杂应用情境等等条件,不难发见Automotive HPC对整个平台讯号传输实时处理、系统稳定度、耐久度、兼容性与安全性将造成多大的考验。而在各种汽车使用者情境之中,「高温条件」就是你我在日常生活中必然会面临到的一种潜在威胁。不论是长时间将车辆停放在室外的高
    百佳泰测试实验室 2025-04-10 15:09 18浏览
  • ‌亥姆霍兹线圈‌是由两组相同的线圈组成,线圈之间的距离等于它们的半径。当电流同时流过这两个线圈时,会在它们中间形成一个几乎均匀的磁场。这种设计克服了普通线圈磁场不均匀的缺陷,能够在中心区域形成稳定、均匀的磁场‌。‌亥姆霍兹线圈的应用领域‌包括材料、电子、生物、医疗、航空航天、化学、应用物理等各个学科。由于其操作简便且能够提供极微弱的磁场直至数百高斯的磁场,亥姆霍兹线圈在各研究所、高等院校及企业中被广泛用于物质磁性或检测实验。‌亥姆霍兹线圈可以根据不同的标准进行分类‌:‌按磁场方向分类‌:‌一维亥
    锦正茂科技 2025-04-09 17:20 93浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦