借助NVIDIADPU和NVIDIADOCA为人工智能时代的数据中心带来变革

英伟达NVIDIA中国 2023-03-28 20:25

正如 NVIDIA GTC 2023 的宣布,NVIDIA BlueField-3 DPU(数据处理器)现已全面投产,并被 Oracle 云基础设施(OCI)选择来实现更高的性能,更优的效率和更强的安全性。

作为一个 400 Gb/s 的基础设施计算平台,BlueField-3 DPU 使企业能够大规模部署和运营数据中心。NVIDIA DOCA 软件框架现在已支持 BlueField-3 DPU,使成千上万的开发者能够利用第三代 DPU 平台的强大功能来快速创建加速的应用程序和服务。

从数据中心到人工智能工厂


数据中心是新兴的人工智能驱动型经济的核心,数据是原材料,人工智能算法是将数据转化为有价值见解的处理引擎。BlueField-3 DPU 是为全球数据中心提供动力的 NVIDIA 加速计算堆栈的基础。通过卸载、加速和隔离数据中心控制平面,BlueField-3 DPU 创建了一个安全、加速和可持续的基础设施,用于在节点集群中运行人工智能和其他现代工作负载,并作为一个统一的计算平台运行。

BlueField-3 DPU 专为数据中心规模的计算而设计,提供 400 Gb/s 以太网和 InfiniBand 网络连接,相比上一代可支持高达 4 倍的计算能力、高达 4 倍的加密加速性能、2 倍的存储处理性能和 4 倍的内存带宽,同时通过 NVIDIA DOCA 软件框架提供完全的向后兼容性。

NVIDIA DOCA 引领加速云服务的发展


NVIDIA DOCA 是专为 BlueField DPU 而设计的软件开发套件和加速框架。DOCA 旨在通过为 BlueField DPU 快速创建和部署应用程序和服务来解锁数据中心创新。

NVIDIA DOCA 拥有丰富的库、驱动程序和 API,可为 BlueField DPU 开发者提供 “一站式服务”,同时也是加速云基础设施服务的关键。这使得 NVIDIA DOCA 成为 NVIDIA 人工智能云服务战略的关键组成部分,该战略旨在为加速数据中心工作负载和大规模部署人工智能应用程序提供一个灵活而强大的平台。

目前,全球已有超过 4700 名注册早期访问的开发者使用 NVIDIA DOCA 来创建 BlueField DPU 应用程序,NVIDIA 很高兴的宣布 NVIDIA DOCA 全面面市,并向所有人开放访问。
图 1 . NVIDIA DOCA 2.0 软件框架

NVIDIA DOCA 2.0

支持全新的 BlueField-3 用例


最新发布的 NVIDIA DOCA 2.0 增加了对 BlueField-3 数据路径加速器( DPA )编程子系统的支持,包括 DOCA IPsec 加密/解密库、设备认证和 YARA 规则在内的多项安全增强功能。还包括对 DOCA Flow 库的增强功能。

NVIDIA DOCA 可为

BlueField-3 DPA 提供可编程性


NVIDIA DOCA 2.0 添加了增强功能,以利用 BlueField-3 DPA 编程子系统。DPA 是一种高度可编程的嵌入式处理器,存在于 BlueField-3 DPU 中。它专为网络密集型、低计算量任务而构建,如设备仿真、拥塞控制、自定义协议等。


NVIDIA DOCA DPA 库是 NVIDIA DOCA 软件开发套件的一部分,它提供了一种编程模型,用于卸载以网络为中心的代码,并在 DPA 处理器上运行。DPA 有助于从 CPU 卸载更多类型的流量,并通过 DPU 加速来提高性能。


将用于设备仿真的 VirtIO

卸载到 BlueField-3 DPA


在使用 VirtIO-net 进行设备仿真时,NVIDIA DOCA 和带有 DPA 的 BlueField-3 DPU 比以前的选项有了显著的改进。在虚拟化环境中,虚拟机(VM)需要像物理机一样访问网络。


在此示例中,虚拟机通常调用 CPU 来处理特定任务,例如访问网卡。将此任务从 CPU 卸载到 BlueField-3 DPU 上专门构建的 DPA 引擎,可实现比 BlueField-2 DPU 高 2 倍的性能,以更高的效率来助力降低数据中心功耗。这有效地消除了数据中心网络税,否则就会占用本该用于应用程序的 CPU 核心资源。


借助 NVIDIA DOCA IPsec 的安全通信


IPsec 是一种安全协议,提供加密、身份验证和完整性服务,以保护 IP 数据包免受未经授权的访问、篡改或窃听。对安全和高速通信的需求日益增长,这给传统基于 CPU 的 IPsec 处理带来了压力,使卸载成为一种有吸引力的解决方案。


在加速防火墙解决方案中,将 IPsec 卸载到 BlueField-3 DPU 可以优化安全性并加速性能。穿过防火墙的流量可以卸载到 DPU,并通过 IPsec 隧道发送到接收主机,例如,提供具有 200 Gbps 双向流量的 32K 并发 IPsec 隧道。这降低了 CPU 的利用率,并通过快速、高效的方法管理可信流量。需要进行威胁检查的剩余流量通过主机和 CPU 进行路由。此过程现已得到优化,由于 CPU 不再管理 IPsec 流量,因此防火墙应用程序可提供更好的性能。


DOCA IPsec 库的添加为下一代防火墙(NGFW)应用程序带来了显著的优势。库中包含的资源池,包括消息模板、预写代码和子例程,有助于简化整个开发流程并减少上市时间。DOCA IPsec 库与 DOCA Flow 库相互操作,使开发者能够将多个 DOCA Flow 管道链接在一起,用于各种网络管线设计(例如,DOCA Flow NAT 管道)。


最后,NVIDIA DOCA 现在能够以更高的速率对新路由和 NAT 表进行编程,使以接近线速速率进行 IPsec 加密和解密既可行又实用,同时减轻了 CPU 的负担。


5G 工作负载的高效 GPU 通信


NVIDIA Aerial 是一个用于构建高性能、软件定义 5G L1 堆栈的软件开发套件,并通过 GPU 的并行处理进行了优化。具体而言,NVIDIA Aerial 软件开发套件可用于构建基带单元(BBU)软件,该软件负责发送(下行链路)或接收(上行链路)的无线客户端数据帧,这些数据帧通过无线电单元(RU)分拆为多个以太网数据包。


在上行链路中,BBU 接收分组,验证它们,并在触发信号处理之前重建每个 RU 的原始数据帧。使用 NVIDIA Aerial 软件开发套件,这将发生在 GPU 中,每个时隙的 RU 都有一个专用的 CUDA 内核。然而,随着基站数量的增加,在网卡和 GPU 之间运行的 CPU 成为了瓶颈。


NVIDIA DOCA 软件框架提供了一种将 CPU 从关键路径中移除并实现网卡和 CUDA 内核之间的直接通信的方法(GPUDirect 异步内核启动技术)新的 DOCA GPUNetIO 库提供了 CUDA 设备功能,应用程序可以在 CUDA 内核中调用这些功能,以便直接向 GPU 发送或从 GPU 接收数据包,而无需使用 CPU 核心或内存。


通过这种方式,NVIDIA Aerial BBU 软件可以提供一种高度并行化和可扩展的方法,每个基站都有一个专用的 CUDA 内核来接收数据包。这使系统容量提高了 4 倍(从采用以 CPU 为中心的 4 个基站到通过 DOCA GPUNetIO 的以 GPU 为中心的 16 个基站)。


CPU 不再需要与 GPU 通信来提供数据包信息,使 CPU 能够专注于应用程序处理,而不是管理网络开销。


扫描下方二维码,立即注册 NVIDIA DOCA GPUNetIO 抢先体验计划。



加速人工智能服务


为了充分发挥人工智能的潜力,数据中心正转向加速计算,以满足日益增长的计算需求。BlueField-3 DPU 是第三代基础设施计算平台,支持 400 Gb/s 网络连接,并提供前所未有的计算和加速能力。在 NVIDIA DOCA 2.0 版本的支持下,BlueField-3 DPU 正在为人工智能时代云、超级计算和企业数据中心带来变革。

NVIDIA DOCA 现已开放接受申请,扫描下方二维码即可注册体验!





扫描海报二维码,或点击“阅读原文”,即可观看 NVIDIA 创始人兼首席执行官黄仁勋 GTC23 主题演讲重播!


评论
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 658浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 175浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 320浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 203浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 194浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 145浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 134浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 122浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 72浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 586浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 158浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦