广告

机器人视觉系统使图像更加清晰

2011-10-01 蔡培德 阅读:
嵌入式机器人视觉系统的开发已经到达转折点。各种各样的设备不仅变得更加智能,而且变得更加了解在世界上所处的位置,伯克利设计技术有限公司(BDTI)总裁、最近成立的嵌入式视觉联盟(EVA)创始人Jeff Bier表示。

作者:蔡培德

嵌入式机器人视觉系统的开发已经到达转折点。各种各样的设备不仅变得更加智能,而且变得更加了解在世界上所处的位置,伯克利设计技术有限公司(BDTI)总裁、最近成立的嵌入式视觉联盟(EVA)创始人Jeff Bier表示。

这与成本迅速下降的传感器——特别是图像传感器以及分析这些数据的处理逻辑有很大的关系。BDTI公司花了很长时间来建立数字信号处理器基准,最终发现某段时期内总有一个主要的应用驱动力,至少目前为止是这样,Bier表示。“在20世纪90年代早期,主要驱动力是数字化无线技术;在20世纪90年代末期,是消费类数字音频;在21世纪初,是消费类数字视频。”他指出,“嵌入式视觉有望成为下一个重要的驱动力。”

另外一个观点是,20世纪80年代和80年代以前是DSP的军事化应用时代,而80年代以后的30年是DSP的工业与企业应用时代,比如生产线和计算机监控。

下一个时代无疑是促进消费的时代,比如游戏和汽车的电传线控(drive-by-wire)等应用。随着应用处理器性能的提高和成本的下降,潜在应用将呈爆发式增长,Bier认为。视觉系统在安全关键和救生应用中早有使用,例如汽车上的车道偏离告警和碰撞避免系统,能够防止溺水事故的游泳池告警系统等。

Mobileye NV公司已经能够提供基于视觉的先进驾驶辅助系统。公司成立于1999年,成功开发出了运行在被称为EyeQ的专有处理器上的专有图像处理算法。EyeQ处理器最初是由意法半导体(ST)采用0.18um CMOS工艺为Mobileye公司制造的。芯片和软件算法首先被卖给宝马和沃尔沃等汽车OEM客户。

大约2007年时,上述解决方案就成为了汽车配件市场产品。解决方案架构由2个32位ARM946E处理器内核、4个视觉计算引擎(VCE)、1个多通道DMA和多个外设组成。其中一个ARM946E用于管理4个VCE、多通道DMA以及其它外设。4个VCE和另外一个ARM946E执行诸如跟踪和图案分类等任务所要求的所有密集型视觉运算。

Bier指出,对于从增强实景(augmented reality)到贴片机等无数应用来说,嵌入式视觉“不是必须发明的一个事物,而是已经有30或40年的实际学术研究成果可以借鉴。”《电子工程专辑》认为手势识别是值得期待的2011年十大技术之一,而微软的Kinect的出现势必打破机器人视觉格局。

Kinect是Xbox 360的3D运动检测附加产品。Xbox解决方案使用可见光谱图像检测、红外检测和本地处理的组合来判断场景中的人物和深度,其硬件基本来自以色列公司PrimeSense。微软开发的识别软件则将信息融合进了游戏。

今年6月,微软宣布推出兼容Windows软件开发套件的免费beta版本Kinect。开发人员、学术研究人员和爱好者都可以使用这种开发套件创建相关应用,并使用Kinect技术实现在Windows 7上运行的深度检测、人体运动跟踪以及语音和目标识别功能。

嵌入式视觉联盟(EVA)的成立则强调了这个行业转折点的到来。

Bier认为EVA联盟将发挥三重作用:提高人们对这种技术潜力的理解;分享实用的技术诀窍,包括经验证的解决问题的方法甚至算法和代码;提供一个感兴趣的各方都能联网参与的论坛。“标准化肯定需要,也许标准化就是EVA的最终目标之一。”Bier指出。

在所有各种计算机设备中包含图像传感器将带来计算机视觉的“民主化”,使得每台笔记本电脑成为潜在的开发平台,Bier表示。“像OpenCV之类的东西对此起着推波助澜的作用。”他指出。OpenCV(针对开源计算机视觉)是一个主要用于实时计算机视觉的编程函数库。

OpenCV库是Intel公司于1999年最早创建的,现在由机器人技术研究实验室和技术孵化企业Willow Garage有限公司提供支持,在开源伯克利软件发布许可条件下可免费使用。OpenCV包含500多个函数,包括通用图像处理、相机防抖、立体声和3D功能、检测、识别、适配、跟踪和其它机器学习函数。

虽然OpenCV库最早是由Intel开发的,但OpenCV是一种交叉平台,拥有可在Windows、Linux、Android和MAC系统上运行的C++、C、Python以及不久后还将增加的Java界面。Willow Garage公司拥有内建OpenCV的机器人操作系统(ROS),也是PR2个人机器人的开发商。

{pagination}

转折点

Willow Garage公司研究人员Gary Bradski承认,这个行业已经处于转折点。

“人们已经认识到事情变得可行起来,”他表示,“深度检测越来越便宜,处理功耗越来越低,您甚至可以在蜂窝电话上完成重要的事情。测试已经发生改变。现在人们关注的是文本识别、信用卡识别、游戏素材、增强实景、脸部识别等功能。”

对硬件来说有什么含义吗?总的趋势是在标准平台上实现低成本的解决方案。

另一方面,Mobileye和PrimeSense等公司专注于开发图像处理IC。“一些最佳文本识别功能可以由卷积神经网络完成。”尽管是用软件来实现,Bradski指出。指定应用的最优架构取决于应用的具体细节。

一些公司喜欢做本地处理,然后只传回事件数据。有些公司则需要将数据发送到云网络进行集中处理。Cognivue公司(渥太华)正在开发一种称为图像识别处理器(ICP)的可编程IC,这种处理器能够捕获图像和视频数据并提取特殊应用信息,可用于汽车应用中的碰撞减轻和基于手势识别的电视遥控器等场合。有件事很明确:对于计算刹车距离并自动实施刹车的安全关键性任务来说,本地处理非常重要。

一般来说,延时是机器人技术中的关键,不适合分布式处理。近年来,有许多自主机器人参加了各种激烈的竞赛测试,如针对自动化汽车的Darpa Grand Challenge系列以及机器人杯(Robocup)足球比赛。足球比赛对机器人来说是一种很好的测试,因为这种比赛为下一代机器人平台提出了许多挑战,包括团队合作、感知、作出自主判断以及高级运动控制。

尽管如此,像本田公司具有人类特征的Asimo等机器人现在已经有10岁了,但看起来更像是在表现视觉功能,而不是解决现实世界的问题。

对机器来说,做出走路、抓取和夹紧等动作仍是相当困难的任务。“虽然我们最终解决了问题,但我们也应该认识到,给机器人分配一个任务需要消耗太多的能量和资源,”Bier指出。“因此我们需要重点关注应用,”他表示,“在许多应用中,只是人类更适合做某项任务。”也即能以更低的成本和更低的能耗完成任务。

Willow Garage公司在开发PR2机器人时就充分考虑了成本/性能因素,并决定机器人“不应该有腿”,Bradski认为。“在大多数应用中,走路只是娱乐罢了,滚动就可以很好地工作。”但他继续表示,洗衣机和洗碗机正在变成机器人;下一代机器将使用机器人视觉功能检查它们自己的工作。即使在机器人使用相当成熟的生产线上,“生产线的工作夹具对某些产品来说是个问题。”

汽车生产线的设计指标是在第一辆汽车制造出来之前需要长达18个月时间,因此定制机器人可做许多工作,Bradski表示。但“蜂窝电话只能采用人工装配,因为夹具开发时间太长,而产品成本很低,并且具有很短的生命周期。汽车可以支付夹具成本,因为它们赢利能力强,生命期长。”

不管怎样,Bradski和Bier一致认为,机器人和机器视觉迎来了很好的发展机遇,毕竟有大量任务是人类不能做、做不好或因为厌烦或危险的原因不愿意做的。

(电子工程专辑)

本文来自《电子工程专辑》2011年10月刊,拒绝转载。

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
您可能感兴趣的文章
相关推荐
    广告
    近期热点
    广告
    广告
    可能感兴趣的话题
    广告
    广告
    向右滑动:上一篇 向左滑动:下一篇 我知道了