采用NVIDIADeepStreamSDK6.2的先进实时多目标跟踪器

英伟达NVIDIA中国 2023-04-20 21:47


当你在连续一段时间内观察某件事时,可以找到能够进行预测的趋势或模式。而通过预测,你可以提醒自己采取适当的行动。


具体来说,当你观察移动的目标时,轨迹是理解目标行为的最重要方法之一,可以基于此获得可操作的见解(视频 1)。


视频 1:猎豹追逐猎物(资料来源:Adobe)


当猎物距离较远时,猎豹长周期内的运动模式对规划捕猎更为重要。而随着猎物越来越近,在做出预测时,猎物短周期内的运动模式则会成为关键点。猎豹的视觉系统会锁定猎物,并一直跟踪它,直到捕获。


同样,如果想生成关于目标的轨迹,需要随着时间的推移始终跟进识别同一目标,即使在视觉外观或运动动力学发生突然变化的情况下,也是如此。然而,当目标被部分或完全遮挡时,要做到这一点就会更困难。通常来说,在附近有长时间的遮挡,或视觉上有引人注目的物体等极具挑战性的情况下,即使是食肉动物或拥有强大视觉系统的人类,也经常会失去对目标的跟踪(图 1)。


图 1:东京涩谷十字路口(资料来源:Adobe)


目标轨迹也是许多视觉人工智能应用的关键部分,例如用于结账队列分析、商店布局优化和生产检查。


NVIDIA DeepStream SDK 提供了 GPU 加速多目标跟踪器(MOT)。最新版 DeepStream SDK 6.2 发布后,多目标跟踪器更是有了显著的提升,有效地解决了具有挑战性的遮挡问题。利用基于深度神经网络的重新识别(ReID)模型进行目标匹配和关联,来实现这一点。


NvDCF 现已可配置使用 ReID 模型,对可能经历长时间遮挡或较长时间错过检测的目标提高关联性。NvDCF 仍然使用基于强鲁棒性和高效短期跟踪的判别式相关滤波器(DCF)方法。同时还配备了神经网络驱动的长期目标重新关联,从而在多目标跟踪的效率、准确性和鲁棒性之间取得最终平衡。


NvDeepSORT 使用基于 NVIDIA TensorRT 的 ReID 模型中提取的深度特征,来执行用于跨视频帧跟踪的目标关联。您能够使用自定义 ReID 模型,以便进行多目标跟踪。


NvSORT 是 NVIDIA 支持的简单在线实时跟踪器 (SORT) ,使用卡尔曼滤波器进行状态估计,并基于来自检测器的目标边界框,使用数据关联算法进行目标关联。NvSORT 使用级联数据关联算法进行强鲁棒性的目标匹配,这是对原始 SORT 的优化。


得益于 DeepStream SDK 中的统一跟踪器架构,增强的级联数据关联算法也用于以下所有其他类型的 MOT:NvDCF 和 NvDeepSORT。统一跟踪器架构让您能够通过 NvMultiObjectTracker 库,根据选择的跟踪器类型启用和禁用单个模块。同样,您也可以使用 NvDsTracker 构建自定义跟踪器。


表 1 总结了 DeepStream 6.2 中提供的多对象跟踪器组合。

表 1:DeepStream SDK 6.2 中提供的多对象跟踪器


行人追踪


是时候在一些有趣的场景中使用这些目标跟踪器,生成目标的轨迹并检验效果了。


首先是一个行人跟踪用例。使用了 PeopleNet v2.6 检测器,上面装配了不同类型的物体跟踪器。检测器配置参数和跟踪器参数都针对 PeopleNet v2.6 进行了调整。有关详细信息,请参阅 DeepStream 6.2 Object Tracker documentationhttps://docs.nvidia.com/metropolis/deepstream/dev-guide/text/DS_plugin_gst-nvtracker.html#setup-and-visualization-of-tracker-sample-pipelines)。


在视频 2 中,对 PeopleNet 、NvSORT、NvDeepSORT 和 NvDCF 的实时感知结果以顺时针方向显示,用于并排比较。不同的人和边界框(bbox)为了更容易识别,用了不同的颜色绘制,并且只有当场景中存在相应的目标时,才会显示颜色编码的轨迹。视频是以 x0.5 的速度拍摄的,以便于比较,但实际数据是实时生成的。


bbox 顶部的标签(例如[21]: 80 (0.24)) 显示的是个人 ID (例如 21), 跟踪年龄(例如 80) 和跟踪置信度(例如 0.24)。检测器配置参数针对每种跟踪器类型进行不同配置,以获得更好的跟踪精度。


视频 2:室内大堂的行人追踪


使用相同的检测模型时,并排的视觉比较使您能够获得不同对象跟踪器类型的行为和质量的定性见解。NvDCF 跟踪器具有最高的精度,因此我们在视频 3 中更仔细地显示了其跟踪结果。


视频 3:NvDCF 跟踪器在完全遮挡的情况下跟踪行人


下方图 2 的场景中央有一个大柱子,会导致走在后面的人长时间被完全遮挡。对于任何目标检测或跟踪系统来说,这都是一个特别具有挑战性的场景。一些检测错误包括部分或双重检测和遗漏检测,根据背景和物理环境的不同,可能会非常频繁地发生。


图 2:样本检测错误:

有两个人的边界框、遗漏检测和部分检测


幸好,新引入了基于 ReID 的目标重新关联,NvDCF 跟踪器可以成功跟踪大多数人(视频 4),即使他们在柱子后面经历了完全遮挡。它不仅在许多帧之后重新关联柱子前后的相同对象,而且还恢复了由柱子引起的遗漏检测(漏报率)。


一个更具挑战性的场景是,除了这种环境遮挡之外,还有许多其他目标的遮挡(视频 4)。这种遮挡产生不同程度的部分遮挡,其中检测到的目标边界框的大小和纵横比,在短时间内会显著变化。这给目标匹配和跟踪中的关联带来了挑战。


视频 4:NvDCF 跟踪器在完全和部分遮挡情况下

对行人进行跟踪


尽管存在这些挑战,您可以看到 NvDCF 跟踪器在大多数情况下只需几个 ID 开关即可执行鲁棒跟踪。在目标离开场景之后,目标跟踪就会被配置为立即终止。视频 4 中离开场景的一些目标,在重新进入后按照计划被分配了不同的 ID。


仔细观察图 3 和视频 4 中的目标 ID [3],如图 3 和视频 4 所示。在整个行程中,他多次经历严重的完全和部分遮挡,但他从一开始就一直被跟踪,直到离开现场。


图 3:穿着白衬衣的目标 ID [3] 的人

在视频 4 中的四张快照


视频 5 显示了跟踪器内部使用的目标模板,其中提取了特征,以及同一目标的相关性响应图。紫色的“x”标记显示附近的目标位置,而黄色的“+”标记显示当前目标位置。


视频 5:(左)跟踪器使用的图像模板;

(右)目标周围的相关性响应


这些结果是使用相对简单的基于 ResNet-10 的 ReID 模型生成的。为了获得更好的结果,我们鼓励您尝试更高级的自定义 ReID 模型。


DeepStream 6.2 中的 NvDCF 跟踪器是一款先进的多目标跟踪器,在精度和性能之间取得了很大的平衡。在 MOT17 Challenge 排行榜上,您可以看到学术界和工业界都积极提交了许多跟踪器。NvDCF 跟踪器在 MOT17 排行榜上显示为 NvMOT _ DSv62  型,是实时生成输出的在线跟踪器中的顶级跟踪器之一。


车辆跟踪


对于车辆跟踪用例,我们使用 TrafficCamNet 带有 DeepStream 多目标跟踪器的探测器。我们使用了一个典型的车辆交通监控系统的场景进行测试,该系统俯瞰着一个繁忙的十字路口。有大小灯杆和交通信号杆,造成了大量遮挡。相对较少的摄像机有利位置更加剧了遮挡问题,导致了对其他车辆的许多遮挡。此外,道路上的植被也增加了场景的复杂性。


由于交通杆和树木的存在,车辆会发生部分和完全遮挡,导致大量的漏检和错误检测。您可以在并排视频中看到,不同类型的目标跟踪器如何处理这些具有挑战性的情况(视频 6)。该视频是以 x0.4 的速度拍摄的,但实际数据是实时生成的。


视频 6:繁忙十字路口的车辆跟踪


在视频的左上角,显示了 TrafficCamNet 检测器的对象框,您可能会注意到检测噪音。其中包括检测到的 bbox 中的抖动、在单个 bbox 中捕获多个对象的双重检测、由于遮挡而导致的部分检测等等。


当车辆在交通杆后被遮挡时,这些检测误差和噪声会变得更加严重。要了解 DeepStream 多对象跟踪器如何处理这些噪声检测,请参阅视频 6 ,并在视频 7 中更仔细地了解 NvDCF 跟踪器的跟踪结果。


视频 7:NvDCF 跟踪器的车辆跟踪


总结


您可以下载并尝试 DeepStream SDK 6.2https://developer.nvidia.com/deepstream-sdk),为您的用例添加强鲁棒性高效的多对象跟踪器!


有关多目标跟踪器组成部分的更多信息,请参阅 NVIDIA DeepStream Technical Deep Dive: Multi-Object Tracker 视频(https://www.youtube.com/watch?v=4nV-GtqggEw)。



即刻点击 “阅读原文” 或扫描下方海报二维码在 NVIDIA On-Demand 上观看 GTC 精选回放,包括主题演讲相关精选、中国本地精选内容、生成式 AI 专题以及全球各行业及领域最新成果!


评论
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 223浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 573浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 169浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 230浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 238浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 584浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 88浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 191浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 128浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 95浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 117浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 105浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 173浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦