英国萨里大学(University of Surrey)开发一种新的轻量级人工智能(AI)技术,可重新辨识并匹配影片中的行人,并足以为边缘装置实现跨镜追踪(ReID)…

英国萨里大学(University of Surrey)的研究人员开发了一种新颖的卷积神经网络(CNN),可用于重新辨识视频监控影片中的行人;此外,由于该CNN尺寸够小,使其得以部署于诸如安全监控摄影机等边缘装置。研究人员并声称,该人工智能(AI)技术甚至比人们更擅长操作摄像机。

新的神经网络称为全尺度网络(Omni-Scale Network;OSNet),用于实现“跨镜追踪”(ReID)网络的全尺度特征学习;它仅采用220万个参数,这在深度学习架构中算是非常少见的。相形之下,其他这一类针对行人再辨识的ReID网络,通常以经典的ResNet-50影像辨识算法为基础,它往往必须使用高达2,400万个参数。
这表示OSNet可以在边缘装置执行,而不必上传云端,因而够节省带宽,否则如果将大量视频影片都传送到数据中心的话,将会十分耗用带宽。

这项研究是在萨里大学的“视觉、语音和信号处理中心”(Centre for Vision, Speech and Signal Processing;CVSSP)进行的。ReID是采用多台摄影机监控系统的基本功能之一,能够追踪出现在不同非重迭(non-overlapping)摄像机画面中的行人。由于每一台摄像机的视角情况可能完全不同,使得追踪或匹配同一个人成为相当困难的问题。在视频监看画面中,行人与摄像机之间的通常存在一定的距离,使得这一问题更加复杂化,因为有太多不同的人所穿的衣服看起来很可能十分类似。


针对行人进行跨镜追踪(ReID)是一大挑战。在图1中的每一组照片,从左到右分别提供了原始影像、成功匹配的影像,以及匹配错误的影像进行比较。(来源:University of Surrey)

CVSSP计算机视觉与机器学习特聘教授Tao Xiang表示,“透过OSNet,我们着手开发了一种工具,它能克服在其他设置中所面临的行人再辨识等许多问题,而最终的结果远远超出了我们的期望。透过OSNet实现的ReID准确性明显超过了人类操作员。OSNet不仅显示在许多跨镜追踪问题上的性能优于同类方案,而其结果也显示它本身就可以作为一种独立的视觉辨识技术。”

研究人员们在其论文——《用于人员重新辨识的全尺度特征学习》(Omni-Scale Feature Learning for Person Re-Identification)中指出,尽管OSNet模型的尺寸较小,但在6个行人的ReID数据集上达到了最先进的性能,大幅超越其他大多数的大尺寸模型。

OSNet基于各种空间尺度的信息组合,并同时考虑了对应于较小的局部区域(如鞋子、眼镜),以及行人身体的全局范围(行人的体型大小和年龄、大概的服装组合,如白色T恤+灰色短裤等)。首先,该技术采用全身特征(如服装组合)来缩小搜寻范围,然后再检查局部特征,例如鞋子是否匹配等。

针对目前存在挑战的情况(例如图1(d)),则需要采用跨多个尺度的更复杂功能。研究人员以行人T恤上的标志为例解释,但影片的距离来看,它很可能会被误认或混淆其他图案。因此,透过标志(小尺度)加上白色T恤(中尺度)的组合,可望使追踪与匹配功能达到最佳效果。

OSNet采用由多个卷积串流组成的多尺度,实现了这种有效的特征组合,每个卷积串流都检测一定尺度特征。其所产生的多尺度特征图形则由新颖的统一聚合闸(可训练的微型网络,共享所有串流中的参数)产成的权重进行动态融合,以产全尺度特征,并可根据需要从不同的尺度中筛选出任何特定尺度的特征或混合特征。
20191029-101.jpg
轻量级OSNet网络结构,其中,R是指接收区(receptive field)的大小。(来源:University of Surrey)

编译:Susan Hong   责编:Yvonne Geng

(参考原文:Lightweight AI Tracks Suspects Between Cameras,by Sally Ward-Foxton)

 

阅读全文,请先
您可能感兴趣
半导体行业正迎来一个新的建设高峰期,SEMI预测,2025年,全球范围内将有18个新的晶圆厂项目开始建设,其中15座为12英寸晶圆厂,3座为8英寸晶圆厂,大部分预计将于 2026 年至 2027 年开始运营......
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
这款机器人头上的摄像头可以录制视频或使用人工智能识别物体,虽然该机器人的动作仅限于挥动细小的手臂和眨动动画眼睛,但它可以与一把小型电动椅子配对,自动在家中导航。
IP供应商、芯片设计服务提供商和AI专家在以AI为中心的设计价值链中的地位正变得更加突出。本文给出了四个设计用例,强调了服务于AI应用的芯片设计模型的重新调整。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
刚才的CES主题演讲中,黄仁勋发布一款与众不同的“AI PC”,但它似乎又不是个PC...
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
其中包含Wi-Fi 7和蓝牙5.4 模组FME170Q-865、Wi-Fi 6和蓝牙5.4 模组FCS962N-LP、Wi-Fi 6和蓝牙5.3模组FCU865R 、独立Wi-Fi和蓝牙模组FGM840R、高功率Wi-Fi HaLow模组FGH100M-H……
今天推荐的视频介绍了单片机(MCU)和数字信号控制器(DSC)之间的差异、Microchip DSC的单核和双核架构、DSC的应用示例以及可将您的设计推向市场的开发资源。更多更全视频尽在Microch
小米15 Ultra目前已经三证齐全,静待2月份发布了,大概率会是2025年第一款超大杯旗舰。博主定焦数码最新公布了一张该机的渲染图,后摄区域是根据内部结构绘制,展示了全新的排列方式。四摄呈L形排列,
1月8日消息,奥康国际发布公告称,终止发行股份购买资产,公司股票将于1月8日开市起复牌。至此,奥康国际谋划的跨界收购芯片公司事项告一段落。奥康国际在公告中介绍,公司于2024年12月24日披露了《关于
‌‌Jan. 9, 2025 产业洞察根据TrendForce集邦咨询最新研究,随着人型机器人迈向高度系统整合,并有望从工业场景走进家庭生活,前端的AI模型训练将更为关键,以满足更多后端理解与互动需求
当地时间2025年1月7日,全球备受期待的技术盛宴——国际消费电子展(CES 2025)在美国拉斯维加斯盛大开幕。作为显示领域的领军企业,天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场,带来手
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
日前,国家发展改革委等部门介绍了加力扩围实施“两新”政策有关情况,今年第一批消费品以旧换新资金810亿已经预下达。很多网友没有看懂具体政策,下面快科技给大家简单梳理一下,其实一句话来说就是:国四车、家
点击蓝字 关注我们SUBSCRIBE to US如果你听说过深度伪造(deepfakes),即人们做着从未做过的事或者说着从未说过的话的高度逼真视频,你可能会认为这是一种可疑的技术发展成果。例如,它们
这届CES,几乎成了半个车展。尤其是今年多个中国电动车品牌参展,凭借各种华丽的车载科技大放异彩,直接让美国记者看傻了。在体验完极氪001 FR之后,美国知名电动车媒体InsideEVs记者Patric
日前,奥康国际发布公告表示终止发行股份购买资产。根据公告,2024 年 12 月 24 日,奥康国际披露《关于筹划发行股份购买资产事项的停牌公告》,公司拟筹划以发行股份或支付现金的方式购买联和存储科技