打造桌上足球的神经形态机器人

EETOP 2022-06-20 12:10


来源:悦智网


我们为什么要打造玩桌上足球的神经形态机器人。

在过去大约25年的时间里,我们这些试图用电脑模拟大脑工作的人每年都会在科罗拉多州特鲁莱德山区小镇举办研讨会。在夏季的几周时间里,与会者经常在小镇大街上的新谢里登酒店的酒吧里放松。大多数人都可能记得,酒吧的里屋里有一张桌上足球台。在召开研讨会的几周里,你经常会发现一相互群竞争多年的神经形态工程师好友围着它。因此,几乎可以预见,有人要打造一款神经形态桌上足球机器人。
人就是我。
事实证明,这个想法不仅仅是为了寻找乐趣。毕竟,我们为什么要玩桌上足球这样的竞技游戏呢?我们被它们吸引有社交方面的原因,但也喜欢学习它的运作方式,进而提高游戏水平。游戏可以提高人的手眼协调、跟踪和预测能力,以及策略性思维。这些都是我们希望机器人拥有的技能。
人类一直对机器玩游戏这个想法感兴趣。早在18世纪末,机械特克(Mechanical Turk)在国际象棋中击败人类的(虚构的)能力,吸引并震惊了观众。1997年,当IBM的“深蓝”(Deep Blue)计算机真的击败了人类时,我们依然跟当初一样感到惊愕。现在,这样的胜利几乎已是家常便饭,DeepMind的人工智能(AI)系统首先在围棋中击败了人类冠军,然后在电子游戏《星际争霸2》中取得了胜利。(当你读完这篇文章时,AI可能又征服了你最喜欢的一款游戏。)
这些卓越的计算成就可以相当好地测量系统的能力。但它们在一些重要方面存有欠缺。机器人需要在充满喧嚣和不规则行为,且环境不断变化的现实世界中运行。围棋严格死板的规则和受限的环境永远不会带来这样的挑战。现实世界中的游戏(肯定有桌上足球,也可能有桌上弹球)可能是更好的方法,可以衡量我们模仿人类大脑能力的努力是否真的步入了正轨。

我们为什么对学习生物计算和感知的秘密如此感兴趣?坦率地说,这是因为它们比今天的计算技术强大得多,今天的计算技术似乎正在迅速达到它的极限。产品传感器产生了太多数据,使计算机难以理解,为了理解这些数据,计算机会消耗非常多的能量。生物在感觉和感知世界方面胜过我们所有的技术,在能效、可靠性、鲁棒性和适应性方面都要高出几个数量级。

我在西悉尼大学国际神经形态系统中心(ICNS)的同事安德烈•范斯海克(André van Schaik)举了一个很好的例子:不起眼的蚊子。它的大脑只有大约20万个神经元,但它的飞行控制和避障能力远超我们已经建造的任何东西。再看看蜻蜓,它可以在飞行途中捕捉蚊子。它的神经元数量大约是蚊子的5倍,每天大概消耗30只蚊子的能量,大约相当于几个糖粒。
视觉感知最直接的例子就是神经形态技术的应用,这恰好是我的专业。制造观察世界的设备几乎总是使用带有互补金属氧化物半导体(CMOS)成像仪的摄像头。摄像头这种商品很容易让人们忘记图片(计算机视觉研究人员称之为“帧”)并不是感知视觉世界的唯一方式。
摄像头用于捕捉场景的表象,足以愚弄我们的视觉系统。但我们其实不知道视觉系统用什么特征或信息来理解场景,所以摄像头只是尽可能多地捕捉信息。这种方法适合拍摄静态图片,但不太适合在空间中跟踪物体。比如,想象一下试图追踪一个物体,例如桌上足球的球,它移动得很快,在一帧和另一帧之间的33毫秒内完全离开了图像的边缘。当然,你可以使用帧速率加倍的摄像头,但这意味着所要整理的数据也要加倍,而这一切只是为了跟踪那一个对象。
生物眼睛的工作原理则不同。生物的视觉中没有帧,眼睛和大脑之间的神经非常少,完全无法传输整个图像。神经形态视觉传感器从眼睛的光感受细胞工作方式中获得灵感;它们仍然使用镜头将外部世界投射到硅芯片的像素网格上,但就是这些像素中蕴藏着有趣的信息。
神经形态传感器也被称为基于事件的成像器,其中的像素只报告光亮的变化,并且只在变化发生的瞬间报告。当前方没有任何变化时,它们不产生任何数据。这种方法大大减少了这些摄像头产生的数据量,这意味着减少了要存储、传输和处理的数据。因此,无论对于摄像头本身,还是之后需要进行的所有计算,这些成像器消耗的功率都极少。
初创公司Prophesee和IniVa-tion已经在市场上推出了基于事件的成像器品牌。这些传感器甚至已经进入太空:ICNS的神经形态摄像头将帮助发现轨道上的卫星和太空垃圾,国际空间站最近安装了一款传感器,用于检测短暂的大气现象,如精灵闪光(sprites)。
神经形态研究人员还研究了我们的其他感官。他们开发了硅耳蜗来模拟听力、触觉形态传感器来探索触觉,甚至还有硅鼻来识别气味和气体。除了感知之外,神经形态工程学还寻求了解大脑处理和存储信息的基本方式。事实上,神经形态工程学建立之初就是为了更好地了解大脑中真正的神经元是如何运作的,从而尝试构建电子神经元。
神经形态传感器,以及处理传感器产生的数据所使用的脑启发算法,可为高效执行某些任务而构建专用系统。但很难知道这些传感器何时捕捉到正确的信息,或者我们的算法何时在正常工作。这时就需要基准测试发挥作用。

要更好地理解为什么把桌上足球作为神经形态基准测试,可以参考当今深度学习AI一直在用MNIST数据库作为基准测试这一例子。MNIST来自美国国家标准与技术研究所,就像机器视觉的“Hello, World!”。它的数据集包含成千数万幅低分辨率的手写数字符号的图像,可作为评判图像识别神经网络工作情况的基准线。基于事件的成像器可否也使用MNIST数据库作为基准测试?

每个MNIST数字在前面闪过时,基于事件的成像器都会立即看到它。为了让这种传感器持续看到静态数字,必须以可控的方式移动摄像头或者数字。眼睛的工作方式与之类似:眼睛的焦点从一个点移动到另一个点,直到大脑理解眼睛所看到的东西。

像MNIST那样,创建适合神经形态系统测试的数据集并不是一件容易的事,而且事实上它们也不是很有用。将运动与成像关联起来的过程非常动态,除了限定性极强的任务之外,其他任何可能性的数量都非常大。那么,如何确定神经形态系统是否在工作,以及如何将它们与其他方法进行比较呢?
当然,也有采用交互仿真方式的基准测试。例如,在自动驾驶仿真过程中,随着汽车位置的变化,汽车传感器馈送给算法的图像也会在变化。但这些仿真也存在问题。最显著的是控制仿真和控制实体系统之间存在差异。
仿真系统和现实之间的主要区别在于现实世界中噪声的数量和特点。对于大多数AI系统来说,噪声数据是一个大问题。但我们有理由相信,神经形态系统会在噪声中茁壮成长,甚至可能需要噪声。这看上去并不那么奇怪。实际上,一定数量的噪声可强化我们对运动和自身位置的感觉。通过额外的处理,或设计更接近理想化仿真环境的现实世界系统,试图减少神经形态系统中的噪声,反而可能会阻碍技术的发展。
因此,要推动神经形态系统向前发展,我们需要实际存在于现实世界的基准测试。

让我们从简单的游戏开始:桌面弹球。对于基准测试问题,桌面弹球实际上是一个非常好的选择,因为这款游戏非常简单。只有两个输出,每个发球板一个,游戏胜负的关键在于击球的时刻。这个真实系统的现实是不允许悔步,你不能为了让算法跟上游戏就简单地暂停或减慢球的运动速度。最重要的是,桌面弹球是计分的,一个明确的目标就是实现得分最大化。因此,无论哪个系统在桌面弹球游戏中得到最高分,都无疑是桌面弹球机器人更好的算法。

我们还可以稍微调整一下游戏,给它增加难度。例如,可以同时添加多个球,甚至可以添加诱饵球,或用不同材料制成、在弹球桌上表现不同的球。由此,我们可以添加更广泛的任务,如跟踪、检测、划分和识别球,同时仍将分数作为成功的最终衡量标准。

ICNS的一个演示系统中,一款弹球机器人可在桌上玩个球,效果与人类玩家差不多。令人惊讶的是,与一般深度学习系统中出现数十万或数百万个人工神经元不同,这种微小的神经形态大脑仅用两个人工神经元,就可对基于事件成像器的输入进行解释和反应。

虽然在弹球游戏上取得了很好的效果,但我的团队认为需要一项更复杂、更苛刻的手段来进一步推动神经形态研究群体的发展。而且,我们也喜欢玩新谢里登酒店酒吧的桌上足球。

桌上足球看起来像是一个机器人可以轻松掌握的游戏:所有的动作都发生在二维空间中,只需要8个马达就能控制球台上的所有小人。但实际比看起来要困难得多。

多年来,曾有几次建造桌上足球机器人的尝试,并在不同程度上取得了成功,但都没有使用过神经形态传感器和算法。为了使机器人获得优势,先前的机器人系统通常需要修改游戏。例如,杨百翰大学建造的桌上足球使用了颜色分割跟踪算法,要求球是桌上唯一的绿色物体。瑞士洛桑联邦理工学院(EPFL)的桌上足球机器人令人印象深刻,它极大地简化了任务,用透明塑料薄膜替代球台的底面,让摄像头由下向上看,因而总能提供一个无障碍的看球视野。

我们的方法旨在重新创造与人类玩家体验相同的输入。摄像头俯瞰桌子,遭遇与人类玩家类似的视野遮挡。我们使用的是标准球,没有特殊标记或颜色。

到目前为止,我们的桌上足球机器人已经有两次由澳大利亚到科罗拉多山脉的旅行。一次为期三周,几个由新手神经形态工程师组成的团队兴致勃勃地研究这个问题,为桌上足球编程,向获得最高分数发起挑战。其结果凸显了这项任务的难度,以及传统AI方法的不足。

一方面,用神经形态传感器跟踪球应该很容易,在弹球机这个小例子中确实很容易。然而,桌上足球是一种更加动态的游戏,尤其是当有人类玩家参与时。每个人类玩家有不同的策略,他们的动作并不总是合乎逻辑或必要。
尝试使用深度学习等非神经形态解决方案给我们带来了一些值得关注的经验。首先,很明显,深度学习神经网络的处理方式(通常在GPU上进行)适合这类任务。GPU处理成批图像效果最好,而不是一次处理一帧。还有一个问题是,我们不关心球过去曾经在哪里,我们甚至不关心球现在在哪里;我们真正关心的是球下一步要去哪里。因此,深度学习解决方案处理了大量不必要的信息。
其次,我们发现深度学习方法对问题中的微小变化极为敏感。摄像头的轻微抖动、玩家向不同方向拉动时球台出现的轻微倾斜,甚至是照明条件的改变,都会导致深度学习球跟踪器的优越性能崩溃。我们也许可以通过增加训练量来解决这些微小的差异(有完整的研究领域专门构建针对这类问题的弹性网络),但这需要玩非常多的游戏。
我们的最新方法着眼于更简单、更快速的神经形态网络。这些算法处理摄像头的每一个事件(事件在神经形态计算中也被称为“尖峰”),并使用它们更新预测球的位置。
这些网络没有使用深度学习的多层神经元,而是使用了16个小型模式识别网络,每个网络为18×18像素,因此在游戏中的任何时刻都只需考虑364像素。这使得它们的速度非常快,而且基本准确。速度非常重要,因为事件驱动算法需要跟上摄像头产生的时间敏感数据。每个事件只需要一些小而简单的计算。虽然这个系统不会对经验丰富的玩家构成太多的挑战,但我们的网络跟踪已经可以非常可靠地拦截球。不过,进球得分仍然是一项正在研究的工作。
理论上,深度学习可以执行类似的操作,但它需要查看整个图像,且网络的每一层执行的计算量要多几个数量级。这不仅比我们的系统使用的数据多得多,而且实际上又将事件驱动输出转换回了帧。
目前,我们用记录下来的基于事件数据对算法进行离线训练。该方法使用一种遗传算法(不断向最佳方案进化的算法)来学习球的外观,并对球的下一个位置做出好的估计。该算法会学习如何从数据本身识别球,而不是通过我们的任何编码。它也学习球的实际移动,而不是我们自己对它的期望。这两点都很重要,因为我们认为很好的桌上足球模型可能在实际运行的时候效果并不好。我们还发现,我们对球运动轨迹的仿真和预期也与实际相差甚远。
下一步,我们将把离线训练转为实时在线学习,让网络在游戏进行过程中不断学习和适应。除此之外,这可能有助于提高系统对目前特定训练球台的灵敏度。
这些事件驱动算法是迈向“尖峰神经形态硬件算法”的中间一步。英特尔的Loihi和BrainChip的Akida等脑启发处理器将按照尖峰时序对信息编码,与基于事件的传感器自然契合。一旦有了稳定的尖峰算法,我们将能更快地取得进展。

希望我们不是唯一取得这些进展的人。在桌上足球机器人设计中,我们专注于降低成本和整个项目的开源。幸运的话,其他神经形态研究团队将看到拥有自己的机器人基准测试会展现出多么大的价值。如果没有,他们将能够在今年晚些时候在特鲁莱德找到我们和我们的桌上足球台。 

作者:Gregory Cohen
618优惠倒计时!

EETOP EETOP半导体社区-国内知名的半导体行业媒体、半导体论坛、IC论坛、集成电路论坛、电子工程师博客、工程师BBS。
评论
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 44浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 114浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦