英国萨里大学(University of Surrey)开发一种新的轻量级人工智能(AI)技术,可重新辨识并匹配影片中的行人,并足以为边缘装置实现跨镜追踪(ReID)…

英国萨里大学(University of Surrey)的研究人员开发了一种新颖的卷积神经网络(CNN),可用于重新辨识视频监控影片中的行人;此外,由于该CNN尺寸够小,使其得以部署于诸如安全监控摄影机等边缘装置。研究人员并声称,该人工智能(AI)技术甚至比人们更擅长操作摄像机。

新的神经网络称为全尺度网络(Omni-Scale Network;OSNet),用于实现“跨镜追踪”(ReID)网络的全尺度特征学习;它仅采用220万个参数,这在深度学习架构中算是非常少见的。相形之下,其他这一类针对行人再辨识的ReID网络,通常以经典的ResNet-50影像辨识算法为基础,它往往必须使用高达2,400万个参数。
这表示OSNet可以在边缘装置执行,而不必上传云端,因而够节省带宽,否则如果将大量视频影片都传送到数据中心的话,将会十分耗用带宽。

这项研究是在萨里大学的“视觉、语音和信号处理中心”(Centre for Vision, Speech and Signal Processing;CVSSP)进行的。ReID是采用多台摄影机监控系统的基本功能之一,能够追踪出现在不同非重迭(non-overlapping)摄像机画面中的行人。由于每一台摄像机的视角情况可能完全不同,使得追踪或匹配同一个人成为相当困难的问题。在视频监看画面中,行人与摄像机之间的通常存在一定的距离,使得这一问题更加复杂化,因为有太多不同的人所穿的衣服看起来很可能十分类似。


针对行人进行跨镜追踪(ReID)是一大挑战。在图1中的每一组照片,从左到右分别提供了原始影像、成功匹配的影像,以及匹配错误的影像进行比较。(来源:University of Surrey)

CVSSP计算机视觉与机器学习特聘教授Tao Xiang表示,“透过OSNet,我们着手开发了一种工具,它能克服在其他设置中所面临的行人再辨识等许多问题,而最终的结果远远超出了我们的期望。透过OSNet实现的ReID准确性明显超过了人类操作员。OSNet不仅显示在许多跨镜追踪问题上的性能优于同类方案,而其结果也显示它本身就可以作为一种独立的视觉辨识技术。”

研究人员们在其论文——《用于人员重新辨识的全尺度特征学习》(Omni-Scale Feature Learning for Person Re-Identification)中指出,尽管OSNet模型的尺寸较小,但在6个行人的ReID数据集上达到了最先进的性能,大幅超越其他大多数的大尺寸模型。

OSNet基于各种空间尺度的信息组合,并同时考虑了对应于较小的局部区域(如鞋子、眼镜),以及行人身体的全局范围(行人的体型大小和年龄、大概的服装组合,如白色T恤+灰色短裤等)。首先,该技术采用全身特征(如服装组合)来缩小搜寻范围,然后再检查局部特征,例如鞋子是否匹配等。

针对目前存在挑战的情况(例如图1(d)),则需要采用跨多个尺度的更复杂功能。研究人员以行人T恤上的标志为例解释,但影片的距离来看,它很可能会被误认或混淆其他图案。因此,透过标志(小尺度)加上白色T恤(中尺度)的组合,可望使追踪与匹配功能达到最佳效果。

OSNet采用由多个卷积串流组成的多尺度,实现了这种有效的特征组合,每个卷积串流都检测一定尺度特征。其所产生的多尺度特征图形则由新颖的统一聚合闸(可训练的微型网络,共享所有串流中的参数)产成的权重进行动态融合,以产全尺度特征,并可根据需要从不同的尺度中筛选出任何特定尺度的特征或混合特征。
20191029-101.jpg
轻量级OSNet网络结构,其中,R是指接收区(receptive field)的大小。(来源:University of Surrey)

编译:Susan Hong   责编:Yvonne Geng

(参考原文:Lightweight AI Tracks Suspects Between Cameras,by Sally Ward-Foxton)

 

阅读全文,请先
您可能感兴趣
Rambus的HBM4控制器IP还具备多种先进的特性集,旨在帮助设计人员应对下一代AI加速器及图形处理单元(GPU)等应用中的复杂需求。这些特性使得Rambus在HBMIP领域继续保持市场领导地位,并进一步扩展其生态系统支持。
2016-2023年中国独角兽企业总估值由近5000亿美元持续攀升至超1.2万亿美元,其中在2020年首破万亿美元。
目前,这两家人工智能领军企业已经与美国政府下属的AI安全研究所(US AI Safety Institute)签署了谅解备忘录,承诺在发布重大新的人工智能模型之前,先让美国政府进行评估,包括模型的能力、可能带来的风险以及减轻这些风险的策略。
Intel刚刚发布了至强W-2500与W-3500系列处理器,最高60个核心,面向工作站设备。现在的工作站,相比从前似乎已经大不一样了...
在性能方面,Granite Rapids-D至强6 SoC采用了英特尔最新的Intel 3工艺计算小芯片与基于Intel 4的边缘优化I/O小芯片相结合的创新设计,提供了显著的性能、能效和晶体管密度提升。
黄仁勋、Mark Zuckerberg在前不久的SIGGRAPH上大谈了一番AI技术的价值。似乎SIGGRAPH已经很大程度被AI给占领了,这可是个图形技术顶会,这种趋势从去年就开始了...
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
‍‍Mobileye 将终止内部激光雷达开发Mobileye 宣布终止用于自动驾驶的激光雷达的开发,并裁员 100 人。Mobileye 认为,下一代 FMCW 激光雷达对可脱眼的自动驾驶来说必要性没
‍‍近期,IC 设计大厂联发科宣布了2024年上半年度的员工分红计划,与8月份薪资一起发放。据外界估算,按照上半年税前盈余约648.66亿新台币(约 144.42 亿元人民币)进行估算,此次分红总额接
周二,捷普科技(Jabil)官员与印度泰米尔纳德邦代表团在泰米尔纳德邦首席部长MK Stalin的见证下,签署了一份备忘录。MK Stalin正在美国进行为期17天的访问,旨在吸引新的投资。MK St
8月28-30日,PCIM Asia 2024展在深圳举行。“行家说”进行了为期2天的探馆,合计报道了200+碳化硅相关参展企业(.点这里.)。其中,“行家说”还重点采访了骄成超声等十余家企业,深入了
在苹果和华为的新品发布会前夕,Counterpoint公布了2024年第一季度的操作系统详细数据,数据显示, 鸿蒙操作系统在2024年第一季度继续保持强劲增长态势,全球市场份额成功突破4%。在中国市场
9月6日,“智进AI•网易数智创新企业大会”在秦皇岛正式举行,300+企业高管及代表、数字化技术专家齐聚一堂,探讨当AI从技术探索迈入实际应用,如何成为推动组织无限进化的新引擎。爱分析创始人兼CEO金
近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆