适合AI应用的计算机视觉类型是什么?

原创 德州仪器 2023-11-16 16:01

点击上方蓝字

关注我们!

计算机视觉是指通过为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生视觉和画面的能力,所以我们必须给予计算机一些算法,以便处理特殊任务。

本文着眼于使计算机能够像人类一样通过“看”来感知世界,从这一视角对人工智能 (AI) 进行探讨。本文将简要比较每一类计算机视觉,特别是嵌入式系统,它们能够在本地收集和处理数据,并根据数据采取行动,而不是依赖基于云的资源。


什么是计算机视觉?

20 世纪 60 年代,计算机视觉已经能够执行从页面上读取文本(光学字符识别)和识别圆形或矩形等形状这类任务。从那时起,计算机视觉便成为 AI 的核心领域之一,它包括了任何从数据中感知、综合或推断含义的计算机系统。

计算机视觉有三种方法:

传统计算机视觉

传统计算机视觉是指用来处理诸如运动估计、全景图像拼接或直线检测等任务的编程算法。传统计算机视觉使用标准信号处理和逻辑来处理任务。工程师需要手动选择用于从图像中提取含义的函数,然后在处理任务的算法中使用所生成的特征。Canny 边缘检测算法可以找出运动的轮廓,光流算法可以找出运动的矢量,这有助于在图像或运动跟踪后续图像中分离出物体。对于需要根据此任务或环境进行校准的参数,需要手动或通过辅助算法做出调整。

经典机器学习计算机视觉

经典机器学习计算机视觉需要由专家来“打造”特征集,供机器学习模型进行训练。其中许多特征是与传统计算机视觉应用所共有的。但并非所有特征都有用,因此需要进行分析以去除无信息特征,机器学习算法将使用这些特征进行训练,以便找出可能难以手动分离的模式。若要有效地实现这些算法,需要具备图像处理和机器学习方面的专业知识。

深度学习计算机视觉

深度学习计算机视觉属于机器学习,但使用的是非常庞大的神经网络模型,对大量未经处理的“原始”数据进行运算。深度学习对计算机视觉产生了重大影响,它将特征提取操作拉入模型之中,使得算法可以学习信息最丰富的特征,而无需专业知识来手动打造特征集。深度学习甚至能够更好地分离出微妙的模式,但对计算和内存的要求更高。

那么,哪一类计算机视觉最好呢?

这最终取决于表 1 中概述的几个因素。此表只是笼统地进行概括,其中的准确性和任务复杂性等指标依赖于具体用例。

表 1:计算机视觉技术比较

经典机器学习计算机视觉介于传统方法和深度学习方法之间;与其他两种方法相比,能够从中受益的应用集合规模较小。在简单直接、高通量或安全攸关的应用中,传统计算机视觉可能准确而高效。深度学习通用性强、开发难度低,并且在复杂应用中的准确性高,如在高密度设计的印刷电路板 (PCB) 装配验证期间用于发现微小的缺失元件。

一些应用可以通过同时采用多种类型的计算机视觉算法而受益,相互取长补短。这种方法常用于环境非常多变的安全攸关型应用中,如驾驶辅助系统。例如,您可以并行采用基于传统计算机视觉方法的光流和深度学习模型来跟踪附近的车辆,并且使用一种算法对结果进行融合,从而确定两种方法是否一致。如果不一致,系统可能会警告驾驶员或启动安全操控。

👇 点击查看 TI 计算机视觉在驾驶辅助的应用 👇

替代方法是依次使用多种类型的计算机视觉。条形码读取器可以使用深度学习来定位感兴趣区域,对这些区域进行裁剪,然后使用传统计算机视觉算法进行解码。


深度学习在计算机视觉应用中的益处

与传统计算机视觉和经典机器学习相比,深度学习由于在研究、开源和商业社区中非常受欢迎,因此始终具有较高的准确性,并且在迅速改进。图 1 从开发者的角度总结了这三种技术在数据流方面的差异。

图 1:各种计算机视觉方法的数据流

深度学习是一种计算密集型方法。然而,由于处理能力、速度、加速器(如神经处理单元和图形处理单元)的改进,以及对矩阵和向量运算的软件支持的提升,计算要求增加的问题得以缓解,即使在嵌入式系统上也是如此。诸如 AM62A7 等微处理器可以利用硬件加速器,以很高的帧率运行深度学习算法。


计算机视觉实践

TI AM6xA 产品组合(如 AM62A7)中的处理器包含深度学习加速硬件和辅助软件,有利于传统及深度学习计算机视觉任务。在 TDA4VM 和 AM68PA 等处理器上,数字信号处理器内核(如 C66x)以及用于光流和立体声深度估计的硬件加速器还能为高性能传统计算机视觉任务赋能。

借助能够同时支持传统计算机视觉和深度学习计算机视觉的处理器,将有可能打造出与科幻梦想相媲美的工具。自动购物车将会简化购物过程;手术和医疗机器人将指导医生发现早期疾病征兆;移动机器人将会修剪草坪和递送包裹。


👇 点击查看 TI 计算机视觉在机器人领域的应用 👇





点击“阅读原文”,获取更多 TI 的边缘智能解决方案,探究嵌入式计算机视觉如何改变世界。

德州仪器 德州仪器(TI)是全球最大的半导体设计与制造公司之一。我们将在这里为您分享TI最新的动态和技术创新。
评论
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 111浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 84浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 51浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 71浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 91浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 89浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 90浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 100浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 45浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 121浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦