Nature封面:斯坦福团队「意念手写」脑机接口重磅发布,速度创记录!

云脑智库 2022-08-30 00:00


Nature封面重磅发布:可将脑中想象的「笔迹」转为屏幕文本,准确率超99%. 而且,受试者可以每分钟输入90个字符,这是此前使用脑机接口打字纪录的两倍多,接近同龄健全人每分钟115个字符的智能手机打字速度。

无需植入,机器学习搞定「读心术」。

长期以来,人们都对「读心」的概念着迷。


说话,这项看似毫不费力的活动,实际上却是人类最复杂的动作之一。


说话需要精确、动态地协调声道发音器官结构中的肌肉——嘴唇、舌头、喉部和下颌。


当由于中风、肌萎缩侧索硬化症(ALS)或其他神经系统疾病而导致言语中断时,丧失说话能力可能是毁灭性的。

上周Nature封面重磅发布一项「拯救性」研究:可将脑中「笔迹」转为屏幕字句,速度创记录,准确率超99%。

这种方法的重要突破在于:其速度与健全的同龄人在智能手机上发短信的速度相媲美。

首次聚焦「手写体」,接近同龄健全人智能手机打字速度

近年来,以马斯克Neuralink为代表的许多脑机接口公司,都在致力于开发类似的大脑植入技术。

然而,没有人研究过手写体。

来自斯坦福大学霍华德・休斯医学研究所(HHMI)研究员克里希纳・谢诺伊教授(Krishna Shenoy)与科学家弗兰克・威利特(Frank Willett)表示,此次研究的最大创新是首次破译了与手写笔记有关的大脑信号。斯坦福神经外科医生杰米・亨德森(Jaimie Henderson)也参与了这项研究。

斯坦福神经外科医生杰米・亨德森(Jaimie Henderson)和斯坦福HHMI研究员克里希纳・谢诺伊教授(Krishna Shenoy)

此前,谢诺伊的团队对与语言相关的神经活动进行了解码,他们让植入了神经传感器的受试者尝试手臂运动来移动屏幕上的光标,以指向并单击字母并拼出单词和句子。

以这种方式指向和点击字母让人们每分钟输入大约40个字符,这是之前用脑机接口(BCI)打字的速度记录。

而在最新实验中,一名受试者可以每分钟输入90个字符,这是此前使用脑机接口打字纪录的两倍多,接近同龄健全人每分钟115个字符的智能手机打字速度。在线原始准确率为94.1%,离线自动校正的准确率超过 99%.

「大脑-文本」BCI

该实验的受试者名为「T5」,他因14年前的脊髓损伤几乎失去了颈部以下的活动能力,仅能做手部抽搐和微动。

受试者通过想象他拿着钢笔在一张纸上尝试写句子,就好像他的手没有瘫痪一样。

书写时,利用传感器从各个神经元收集信号,一个机器学习算法识别了他的大脑在每个字母上产生的模式。

有了这个系统,受试者复制书写(按照所提供的句子再写一次)句子和回答问题的速度与同龄人在智能手机上打字的速度相当。

威利特说,这种所谓的「大脑到文本」的BCI之所以如此快速,是因为每个字母的书写都会产生一种非常独特的活动模式,这使得算法相对容易区分一个字母和另一个字母。

亨德森博士在受试者的左脑上放置了两个脑机接口芯片,每个芯片有100个电极,这些电极从运动皮层部分发射的神经元中提取信号,从而控制手部的运动。

这些神经信号通过电线发送到计算机,在计算机上人工智能算法对信号进行解码,并推测T5预期的手和手指运动。

用于打字的脑机接口

威利特等人开发出的脑机接口通过将想象中的手写尝试所产生的神经活动转化为计算机屏幕上的文本,使瘫痪的人能够打字。

简单描述就是植入大脑的电极在受试者想象书写每个字母时测量许多神经元的活动(线表示每个神经元激发的时间点)。

一个叫做递归神经网络(RNN)的深度学习模型学习每个字符产生的神经活动模式,并分析这些活动模式如何跨越多个试验相关联,生成聚类图。

这个信息被一个算法用来预测参与者在当前试验中想象的字母,然后这个预测被翻译成一个排版输出。

笔迹的神经表征

高准确率来自RNN模型

利用RNN需要大量的训练数据,但这些数据在神经接口中是有限的,因为很少有用户愿意想象连续写作数小时。这是该实验的一大难点。

研究团队用一种被称为「数据增强」的方法解决了该问题。

在这种方法中,参与者先前产生的神经活动模式被用来产生句子,在这些句子上训练RNN。他们还通过在神经活动模式中引入人为的变化来扩展他们的训练数据,以模仿人类大脑中自然发生的变化。

在这项研究中,T5需要把每个字母重复10次,让软件「学习」识别与他尝试写那个特定字母相关的神经信号。

在接下来数小时的测试中,T5被展示了几组句子,并被要求在大脑中尝试「手写」每一个句子,没有使用大写字母。这些句子比如,「i interrupted, unable to keep silent,」和「within thirty seconds the army had landed.」。

随着时间的推移,这些算法提高了它们区分代表不同字母或符号的神经放电模式的能力。算法对T5意图写的任何字母的解读在大约「半秒的延迟」后出现在电脑屏幕上。

T5还被要求复制书写算法从未接触过的句子。他最终能够每分钟写出90个字符,大约18个单词。之后,他被要求回答开放性的问题(需要一些停顿来思考),他每分钟写了73.8个字符(平均接近15个单词),是2017年研究中自由书写记录速度的三倍。

威利特等人的算法做到了准确分类。复制书写错误率大约是每18或19个字符中有一个错误;自由书写错误率约为每11或12个字符中有一个。

当研究人员通过包括预测语言模型(类似于智能手机上的自动纠错功能)后,错误率明显较低:复制书写的错误率低于1%,自由书写的错误率略高于2%。

「与其他脑机接口相比,这些错误率相当低。」谢诺伊说。

训练数据集已公开

接下来,该小组的目标是与无法说话或患有诸如肌萎缩性侧索硬化症(ALS)之类的退化性神经系统疾病的参与者合作,这种疾病会夺走患者的说话能力。

威利特和同事的研究开始兑现 BCI 技术的承诺。iBCIs 将需要提供巨大的性能和可用性收益,以证明将电极植入大脑的相关费用和风险是合理的。

重要的是,打字速度并不是决定是否采用这项技术的唯一因素,这种方法的寿命和鲁棒性也需要分析。

研究人员提供了有前景的证据,证明他们的算法在有限的训练数据下仍能表现良好,但随着神经活动模式的改变,可能还需要进一步的研究,才能使设备在使用寿命期间保持运转。

未来继续进行研究以测试该方法是否可以推广到其他用户以及实验室以外的场景也至关重要的。

另一个问题是这种方法将如何扩展和翻译成其他语言。威利特和他的同事们的模拟研究突出表明,拉丁字母中的几个字母书写方式相似(例如 r, v和u) ,因此比其他字母更难分类。

拉丁字母中的几个字母书写方式相似(例如 r, v和u) 

另外,比如泰米尔语有247个字母,字母彼此之间密切相关,所以可能很难分类。对于那些还没有被机器学习的语言预测模型很好地表示出来的语言来说,翻译问题尤其重要。

虽然还有很多工作要做,但威利特和同事们的研究是一个里程碑,它拓宽了iBCI的应用。

由于它使用的机器学习方法正在迅速改进,插入最新的模型为未来的改进提供了一条有前景的道路。研究小组还将其数据集公开,以加速研究进展。

参考资料:
https://www.hhmi.org/news/brain-computer-interface-turns-mental-handwriting-into-text-on-screen

https://www.nature.com/articles/d41586-021-00776-8

文章来源:Nature、新智元






免责声明本公众号目前所载内容为本公众号原创、网络转载或根据非密公开性信息资料编辑整理,相关内容仅供参考及学习交流使用。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请跟我们联系。我们致力于保护作者知识产权或作品版权,本公众号所载内容的知识产权或作品版权归原作者所有。本公众号拥有对此声明的最终解释权。

云脑智库 努力是一种生活态度,与年龄无关!专注搬运、分享、发表雷达、卫通、通信、化合物半导体等技术应用、行业调研、前沿技术探索!专注相控阵、太赫兹、微波光子、光学等前沿技术学习、分享
评论
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 53浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 65浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 107浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 46浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 52浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 55浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 43浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 79浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 56浏览
  • 本文介绍编译Android13 ROOT权限固件的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。关闭selinux修改此文件("+"号为修改内容)device/rockchip/common/BoardConfig.mkBOARD_BOOT_HEADER_VERSION ?= 2BOARD_MKBOOTIMG_ARGS :=BOARD_PREBUILT_DTB
    Industio_触觉智能 2025-01-08 00:06 111浏览
  • 「他明明跟我同梯进来,为什么就是升得比我快?」许多人都有这样的疑问:明明就战绩也不比隔壁同事差,升迁之路却比别人苦。其实,之间的差异就在于「领导力」。並非必须当管理者才需要「领导力」,而是散发领导力特质的人,才更容易被晓明。许多领导力和特质,都可以通过努力和学习获得,因此就算不是天生的领导者,也能成为一个具备领导魅力的人,进而被老板看见,向你伸出升迁的橘子枝。领导力是什么?领导力是一种能力或特质,甚至可以说是一种「影响力」。好的领导者通常具备影响和鼓励他人的能力,并导引他们朝着共同的目标和愿景前
    优思学院 2025-01-08 14:54 93浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 55浏览
  •  在全球能源结构加速向清洁、可再生方向转型的今天,风力发电作为一种绿色能源,已成为各国新能源发展的重要组成部分。然而,风力发电系统在复杂的环境中长时间运行,对系统的安全性、稳定性和抗干扰能力提出了极高要求。光耦(光电耦合器)作为一种电气隔离与信号传输器件,凭借其优秀的隔离保护性能和信号传输能力,已成为风力发电系统中不可或缺的关键组件。 风力发电系统对隔离与控制的需求风力发电系统中,包括发电机、变流器、变压器和控制系统等多个部分,通常工作在高压、大功率的环境中。光耦在这里扮演了
    晶台光耦 2025-01-08 16:03 84浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦