AllinOne!一个开发者套件解决六个NVIDIAJetsonOrin模块开发

英伟达NVIDIA中国 2022-09-29 17:44

随着 Jetson Orin Nano 在本次 GTC 大会的发布,整个 Jetson Orin 模块阵容现已揭晓。凭借高达 40 TOPS 的 AI 性能,Orin Nano 模块为入门级 AI 设定了新标准,正如 Jetson AGX Orin 已经通过 275 TOPS 的服务器级计算重新定义了机器人技术和其他自主边缘用例一样。

所有 Jetson Orin 模块和 Jetson AGX Orin 开发套件均基于单一 SoC 架构,配备 NVIDIA Ampere 架构 GPU、高性能 CPU 和最新加速器。这种共享架构意味着您可以为一个 Jetson Orin 模块开发软件,然后轻松将其部署到任何其他模块。

您现在可以开始使用 Jetson AGX Orin 开发者工具套件开发任何 Jetson Orin 模块。开发者工具套件能够本地模拟任何模块的性能,让您从现在开始并缩短上市时间。通过配置硬件特性和时钟以匹配目标模块的特性,开发者工具套件可以准确地模拟任何 Jetson Orin 模块的性能。

开发团队受益于这种简单性,即只需要一种类型的开发者工具套件,而不用管哪些模块是针对生产的。这也简化了 CI / CD 基础架构。无论您是针对机器人、视频分析还是任何其他用例进行开发,这一开发者工具套件的功能都会带来许多好处。

将 Jetson AGX Orin 开发者套件

转化为任何 Jetson Orin 模块


只需一步,您就可以将 Jetson AGX Orin 开发者套件转换为任何一个 Jetson Orin 模块。我们为此过程提供了闪存配置文件。

在 Jetson AGX Orin 开发工具套件上模拟 Jetson Orin 模块,遵循其中提到的相同步骤使用刷写实用程序来刷写 Jetson AGX Orin 开发者工具套件。将您的开发者工具套件置于强制恢复模式后,使用 flash.sh 命令行工具使用新映像对其进行闪存。例如,以下命令使用其默认配置刷新开发者工具套件:

$ sudo ./flash.sh jetson-agx-orin-devkit mmcblk0p1

您使用的确切命令应修改为适合您正在模拟的目标 Jetson Orin 模块的闪存配置名称。例如,要模拟 Jetson Orin NX 16GB 模块,请使用以下命令:

$ sudo ./flash.sh jetson-agx-orin-devkit-as-nx-16gb mmcblk0p1

表 1 列出了 Jetson Orin 模块和适用于每个模块的 flash.sh 命令。
表 1 Jetson Orin 模块的 flash.sh 命令
从 5.0.2 版本开始,NVIDIA JetPack 中尚未包含 Jetson Orin Nano 模块的 Flash 配置。在下载这些新配置并按照下载文件中的说明在 NVIDIA JetPack 5.0.2 之上应用覆盖补丁后,可以使用这些新配置。

有关用于仿真的闪存配置的更多信息,请参阅以下链接:
https://docs.nvidia.com/jetson/archives/r35.1/DeveloperGuide/text/SD/EmulationSupport.html

闪存完成后,完成初始启动和配置。然后,您可以使用 SDK Manager 安装其余的 NVIDIA JetPack 组件,或者只需在运行的开发者工具套件上使用软件包管理器:

sudo apt updatesudo apt install nvidia-jetpack

现在您已经运行了开发者工具套件并安装了 NVIDIA JetPack。您的 Jetson AGX Orin 开发者套件现在可以模拟指定的 Jetson Orin 模块的性能和功率。

准确模拟任何 Jetson Orin 模块


本机模拟非常准确,因为它将开发者工具套件配置为与目标模块可用的时钟频率、GPU 和 CPU 内核数量以及硬件加速器相匹配。

例如,在模拟 Jetson Orin NX 16GB 模块时:
  • 开发者套件 GPU 配置有 1024 个 CUDA 内核和 32 个 Tensor 内核,最大频率为 918 MHz。
  • CPU 复合体配置有八个运行频率为 2 GHz 的 Arm Cortex-A78AE 内核。
  • DRAM 配置为 16 GB,带宽为 102 GB/s。
  • 该系统提供与 Jetson Orin NX 16GB 模块支持的相同电源配置文件。

图 1 可用的电源模式
从桌面顶部菜单打开 Jetson Power 图形用户界面,您会看到系统已根据正在模拟的目标模块进行了准确的配置。可以通过运行以下命令来配置最大时钟,Jetson Power 图形用户界面将显示更改。

sudo jetson_clocks

图 2 显示了当 Jetson AGX 开发者套件闪存到模拟的 Jetson AGX-Orin 64GB 模块时,与闪存到模拟 Jetson Orin NX 16GB 模块时相比配置了最大时钟后的 Jetson Power 图形用户界面。
图 2 开发者套件上显示的 Jetson Power 图形用户界面闪烁以模拟 Jetson AGX Orin 64GB(左)和选择 MAXN 电源模式的 Jetson Orin NX 16GB(右)

通过运行 NVIDIA JetPack 提供的各种示例,您可以看到性能已调整为与正在模拟的模块相匹配。例如,在配置 Jetson AGX Orin 开发者套件进行仿真后,与 VPI 库一起打包的基准测试示例可用于显示 Jetson AGX Orin 64GB、Jetson Orin NX 16GB 和 Jetson Orin Nano 8GB 模块的 CPU、GPU 和 PVA 性能相应的模块。

要运行 VPI 基准测试示例,请使用以下命令:

cd /opt/nvidia/vpi2/samples/05-benchmarksudo cmake .sudo makesudo ./vpi_sample_05_benchmark

VPI 基准测试示例以毫秒为单位输出高斯算法的延迟。表 2 显示了每个目标模块的结果。
表 2 目标模块的延迟(毫秒)
同样,您可以运行多媒体样本进行编码和解码。

要解码,请运行以下命令:

cd /usr/src/jetson_multimedia_api/samples/00_video_decodesudo makesudo ./video_decode H264 --disable-rendering --stats --max-perf

要进行编码,请运行以下命令:

cd /usr/src/jetson_multimedia_api/samples/01_video_encodesudo makesudo ./video_encode input.yuv 1920 1080 H264 out.h264 -fps 30 1 -ifi 1000 -idri 1000 --max-perf --stats

表 3 显示了使用 H.264 1080P 30FPS 视频流运行这些编码和解码样本后的 FPS 数。
表 3 运行编码和解码样本后的 FPS 数
* Jetson Orin Nano 不包括 NVEncoder。对于表 3,Jetson Orin Nano 的编码是在 CPU 上使用 ffmpeg 完成的。使用四个 CPU 核心时,达到 110 FPS。当使用两个 CPU 核心时,实现了 73 的 FPS,而当使用一个 CPU 核心时,实现了 33 的 FPS。

为了证明仿真的准确性,我们在 Jetson AGX Orin 开发者套件上运行了一些 AI 模型基准测试,模拟为 Jetson AGX Orin 32GB 。然后,我们将其与在实际 Jetson AGX Orin 32GB 模块上运行相同基准测试所获得的结果进行比较。从结果中可以看出,模拟性能和实际性能之间的差异微不足道。

尽管 Jetson AGX Orin 开发者套件包括 32GB 模块,但它提供了相同级别的性能,并且配备了 275 个 TOPS,与 Jetson AGX Orin 64GB 相匹配。Jetson AGX Orin 64 GB 仿真不需要特殊的闪存配置,但您必须使用适当的闪存配置在 Jetson AGX Orin 开发者套件上仿真 Jetson AGX Orin 32GB。
表 4 真实和仿真 Jetson AGX Orin 模块之间的性能比较

对任何 Jetson Orin 模块进行端到端开发


您可以在模拟 Jetson Orin 模块的同时使用整个 Jetson 软件堆栈。NVIDIA DeepStreamNVIDIA Isaac 和 NVIDIA Riva 等框架在仿真模式下工作,而 TAO Toolkit 等工具在 NGC 的预处理模型中的性能符合预期。软件堆栈与仿真无关,性能与被仿真目标的性能精确匹配。

图 4 NVIDIA Jetson 软件堆栈
如果您正在开发机器人用例或开发视觉 AI 工作流,您现在可以使用 Jetson AGX Orin 开发者套件和仿真模式对任何 Jetson Orin 模块进行端到端开发。

使用 NVIDIA Isaac ROS 为任何 Jetson Orin 模块开发机器人应用程序。只需使用正确的闪存配置来闪存并启动 ROS 开发。图 5 显示了在 Jetson AGX Orin 开发者套件上运行 Isaac ROS Stereo Disparity DNN ,模拟为 Jetson Orin Nano 8GB 。
图 5 NVIDIA Isaac ROS Stereo Disparity DNN 在模拟为 Jetson Orin Nano 8GB 的 Jetson AGX Orin 开发者套件上运行
在 Jetson AGX Orin 开发套件上使用 DeepStream 开发视觉 AI 工作流,适用于任何 Jetson Orin 模块。

图 6 显示了在 Jetson AGX Orin 开发者套件上使用 DeepStream 运行人员检测的 IVA 工作流,模拟为 Jetson Orin Nano 8GB ,具有四个 H.265 1080P 30FPS 流。
图 6 DeepStream 视觉工作流运行 Jetson AGX Orin 开发者套件上的人员和车辆检测,模拟为 Jetson Orin Nano 8GB

使用 Jetson AGX Orin 开发者套件更快地进入市场


有了仿真支持,您可以通过在 Jetson AGX Orin 开发者套件上启动和完成应用程序开发以便更快地投入生产。我们还将在即将推出的 NVIDIA JetPack 5.0.2 网络研讨会中做出详细介绍。

复制链接,立即注册参加网络研讨会!
https://gateway.on24.com/wcc/experience/elitenvidiabrill/1407606/3944300/jetpack-502



即刻点击 “阅读原文” 或扫描下方海报二维码
观看 GTC 主题演讲重播。

评论
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 104浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 121浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 134浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 86浏览
  • TOF多区传感器: ND06   ND06是一款微型多区高集成度ToF测距传感器,其支持24个区域(6 x 4)同步测距,测距范围远达5m,具有测距范围广、精度高、测距稳定等特点。适用于投影仪的无感自动对焦和梯形校正、AIoT、手势识别、智能面板和智能灯具等多种场景。                 如果用ND06进行手势识别,只需要经过三个步骤: 第一步&
    esad0 2024-12-04 11:20 92浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 90浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 131浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 135浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 154浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 111浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦