【光电智造】计算机视觉新高度,机器摄像头瞟一眼就记住所有细节,远超碳基生命视觉系统以及记忆系统

今日光电 2024-03-27 18:01

今日光电

     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!




----追光逐电 光赢未来----

由麻省理工学院CSAIL研究人员开发的FeatUp,提高了任何深度网络或计算机视觉系统视觉基础的分辨率。

想象一下,你瞥了一眼繁忙的街道几秒钟,然后试图从记忆中勾画出你所看到的场景。大多数人可以画出汽车、人和人行横道等主要物体的大致位置,但几乎没有人能以像素级的精确度画出每一个细节。对于大多数现代计算机视觉算法来说也是如此:它们擅长捕捉场景的高级细节,但在处理信息时会丢失细致的细节。
现在,麻省理工学院的研究人员创建了一个名为“FeatUp”的系统,允许算法同时捕捉场景的高层次和低层次细节——几乎就像给计算机视觉做了激光眼睛手术。
当计算机通过查看图像和视频学习“看”时,它们通过所谓的“特征”建立对场景中内容的“想法”。为了创建这些特征,深度网络和视觉基础模型将图像分解成一格格的小方块,并将这些方块作为一个组进行处理,以确定照片中正在发生什么。每个小方块通常由16到32个像素组成,因此这些算法的分辨率远小于它们处理的图像。在尝试总结和理解照片时,算法会丢失大量的像素清晰度。
FeatUp算法可以阻止这种信息损失,并提高任何深度网络的分辨率,而不会影响速度或质量。这允许研究人员快速轻松地提高任何新的或现有算法的分辨率。例如,尝试解释肺癌检测算法的预测,目标是定位肿瘤。在使用类似类激活映射(CAM)方法解释算法之前应用FeatUp,可以得到一个明显更详细(16-32倍)的视图,根据模型可能位于肿瘤的位置。
FeatUp不仅帮助从业者理解他们的模型,还可以改善各种不同的任务,如对象检测、语义分割(将图像中的像素与对象标签相对应)和深度估计。它通过提供更准确的高分辨率特征,这对于构建从自动驾驶到医学成像等视觉应用至关重要,从而实现了这一点。
“所有计算机视觉的本质在于这些深度学习架构深处涌现的深层、智能特征。现代算法的一大挑战是它们将大图像简化为非常小的‘智能’特征网格,获得智能洞察但丢失了细节,”麻省理工学院电气工程与计算机科学系的博士生、计算机科学与人工智能实验室(CSAIL)附属成员、该项目论文的共同首席作者马克·汉密尔顿说。“FeatUp帮助实现了两全其美:具有原始图像分辨率的高度智能表示。这些高分辨率特征显著提升了计算机视觉任务的性能,从增强对象检测和改进深度预测,到通过高分辨率分析提供网络决策过程的更深入理解。”

分辨率复兴

随着这些大型AI模型变得越来越普遍,解释它们在做什么、在看什么、在想什么的需求也在增加。
但FeatUp是如何发现这些细致的细节的呢?奇怪的是,秘密在于轻微地调整图像。
特别是,FeatUp对图像进行轻微调整(比如将图像向左或向右移动几个像素),并观察算法对这些轻微图像移动的响应。这产生了数百个略有不同的深度特征图,可以组合成一套清晰的、高分辨率的深度特征集。“我们想象一些高分辨率特征的存在,当我们摆动它们并模糊它们时,它们将与所有原始、较低分辨率特征匹配。我们的目标是学习如何将低分辨率特征精炼成高分辨率特征,通过这个‘游戏’让我们知道我们做得如何,”汉密尔顿说。这种方法类似于算法如何从多张2D图像创建3D模型,确保预测的3D对象与用于创建它的所有2D照片匹配。在FeatUp的情况下,它们预测与通过晃动原始图像形成的所有低分辨率特征图一致的高分辨率特征图。
该团队指出,PyTorch中可用的标准工具无法满足他们的需求,并在寻求快速高效解决方案的过程中引入了一种新型的深度网络层。他们的自定义层,一种特殊的联合双边上采样操作,比PyTorch中的简单实现高出100倍以上。该团队还展示了这个新层如何改善包括语义分割和深度预测在内的各种不同算法。这个层提高了网络处理和理解高分辨率细节的能力,给任何使用它的算法带来了实质性的性能提升。
“另一个应用是所谓的小物体检索,我们的算法允许精确定位物体。例如,即使在杂乱的道路场景中,通过FeatUp丰富的算法也可以看到像交通锥、反光器、灯和坑洞这样的小物体,而它们的低分辨率对应物则失败了。这证明了它将粗糙特征增强为精细信号的能力,”加州大学伯克利分校的博士生、新FeatUp论文的另一位共同首席作者斯蒂芬妮·傅说。“这对于时间敏感的任务特别关键,比如在拥挤的高速公路上准确指出交通标志。这不仅可以通过将广泛的猜测转化为精确的定位来提高这些任务的准确性,还可能使这些系统更可靠、可解释和值得信赖。”

接下来是什么?

关于未来的愿景,团队强调FeatUp在研究界和更广泛的领域内的潜在广泛采用,类似于数据增强实践。“目标是使这种方法成为深度学习中的基本工具,丰富模型以更细致地感知世界,而不会带来传统高分辨率处理的计算低效率,”傅说。
“FeatUp代表着向着使视觉表示真正有用的方向迈出的美妙进步,通过以全图像分辨率产生它们,”康奈尔大学计算机科学教授诺亚·斯纳夫利说,他没有参与这项研究。“在过去几年中,学习到的视觉表示变得非常好,但它们几乎总是以非常低的分辨率产生——你可能输入一个漂亮的全分辨率照片,然后得到一个微小的、邮票大小的特征网格。如果你想在产生全分辨率输出的应用中使用这些特征,这就是一个问题。FeatUp以一种创造性的方式解决了这个问题,将超分辨率中的经典思想与现代学习方法结合起来,产生了美丽的、高分辨率的特征图。”
“我们希望这个简单的想法可以有广泛的应用。它提供了我们之前认为只能是低分辨率的图像分析的高分辨率版本,”高级作者、麻省理工学院电气工程与计算机科学教授、CSAIL成员威廉·T·弗里曼说。
领头作者傅和汉密尔顿由麻省理工学院CSAIL的当前或前附属成员、博士生劳拉·布兰特SM '21、阿克塞尔·费尔德曼SM '21以及周通·张SM '21、博士 '22共同完成。他们的研究部分由国家科学基金会研究生奖学金、国家科学基金会和国家情报总监办公室、美国空军研究实验室以及美国空军人工智能加速器资助。该团队将在5月的国际学习表示会议上展示他们的工作。
来源:新机器视觉



申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。


 

----与智者为伍 为创新赋能----


【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
投稿丨合作丨咨询

联系邮箱:uestcwxd@126.com

QQ:493826566



评论
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 45浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 89浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 91浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 111浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 100浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 175浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 84浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 51浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 90浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 122浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 169浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 121浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 181浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 71浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦