是否单个神经元可以识别手写体数字?

TsinghuaJoking 2022-12-22 14:47

 MNIST识别

一、背景介绍

  今天看到一段视频,介绍一位来自美国Dartmouth大学神经科学专业学生的研究工作,现在约翰霍普金斯做研究员。 在Pennsylvannia大学研究神经计算。这个讲座来自于她介绍如何利用神经元生物特性完成神经网络学习。 但并不是对十个数字都进行识别, 而只是对其中的3,5 两个数字进行区分识别。 识别的效果如何呢? 这里给出对比的结果。 这是线性分类器,实际上就是使用传统的单个神经元进行分类的准确率。已经能够接近于88%了。很不错了。 这是利用单隐层全连接BP网络的分类结果,可以看当中间隐层达到32的时候,准确率可以接近于98%。 中间这个是单个神经元识别的结果。 这里的单个神经元,比传统的单个神经识别效率高,究竟为什么呢? 下面让我们看看Alina的工作吧。

▲ 图1.1.1 三种不同的网络对于MNIST数字识别的效果


  在介绍具体工作之前,先看看这三个结果对应着什么神经网络。 这是传统的单个神经元, 它实际上是能够实现线性分类器。 所以对应的最好的分类结果是88%左右。 这是单隐层全连接网络, 它的识别结果最高。 这是本文将介绍的单个神经元, 这就令我们感到奇怪了。这难道不是一个深层网络吗? 好吧,我们知道做理论研究最重要的是能够自圆其说。剩下的就是玩得高兴,不要太较真了。

二、单个神经元模型

  这是人大脑中的不同神经元的形态结构, 但现代人工神经网络则将神经元处理信息的功能进行了简化。  将不同形态的神经元看成由输入输入信息,轴突输出信息的多输入单输出系统。 输入信息经过比例加权之后,  然后在通过一个非线性激励函数输出。 这个模型被称为传统的 McCulloch-Pitts 模型。 它将神经元本身的多样性, 处理信息的多层次, 以及其它一些动态特性进行了省略, 所以现代神经网络中的神经元最终退化成只能完成线性分类的感知机。

▲ 图1.2.1 现代神经元的简化模型


  关于生物神经元的细节,Alina进行了介绍,不过我对此并不太了解, 下面将给出Alina在McCulloch-Pitts模型上所做的五点改动进行介绍,并给出她的对比效果。 这是对单个神经元模型的五点改动。 先看前两点的改动,这是比较关键。 第一点将单个神经元从输入到输出看成一个二叉树。 信息从输入到输出之间经过若干层的综合处理。 传统意义上对于传递信息的轴突,也可以通过改变其电流传送阻抗完成对信息的加权, 因为轴突传送过程中的非线性也给这些汇聚点提供了非线性传递函数的功能。 因此就形成了深层信息处理的结构。 

        第二个改动是令我之前所不知道的,就是突触重复。 所谓的重复,就是突触在接收前级信息的时候会对若干个接触点输入信息进行平均。 因此就形成了输入信号的多次输入重复输入版本。 在汇合前各自有各自的传输通道。 因此在神经元模型中,就形成了多个相同的二叉树的并联, 这是重复两次的情况,  重复的次数k可以是任意设定的数值。这样就大大增加了单个神经元中可以修改的自由权系数的个数了。

▲ 图1.2.2 单个神经元模型的改动


  下面在讨论一下 第三个神经元模型的修改。 传统神经元网络认为神经元的树突仅仅是对信号的汇聚环传输, 它应该是一个线性函数, 但实际上它传输信号过程中具有非线性, 这是去掉线性关系放大后的非线性, 实际上也可以形成类似于常见到的神经元传递函数。 这种传递函数是连续可导的。

         神经元的第四点修改, 是对输入层的功能调整。 传统神经元的输入层仅仅是将信号传递到网络,是个恒等关系, 但实际上信号进入神经元具有非线性关系, 这里给出的是动态微分方程, 如果考虑到静态关系则是一个具有五个参数的指数关系, 所以这一层也具有五个可以调整的权系数。 由此又增加了一层信息处理功能。

  下面来看看最后一个修改, 这是对权系数的限定, 在实际过程中所有的权系数都是正的数值, 这与通常神经元模型不同, 这是对神经元轴突信息处理特性的描述。 这个限制在一定程度上减少了神经元的模型复杂度。 这是考虑到实际生物神经元特性之后对神经元模型的五点修改。

三、修改后的效果

  经过上述对神经元模型的改造, 首先将单个感知机编程了多个二叉树的网络,其中可以调整的权系数就大大增加了。 这个模型相比于多层全连接的网络来讲,它属于稀疏网络, 对于MNIST中3,5两个数字的分类问题, 这三种网络的性能时有区别的, 从这个对比来来看,改造后的神经元的性能已经与多层全连接神经网络接近了。

▲ 图1.3.1 不同网络对于MNIST数字识别的效果


  结 ※

  文介绍了艾莉娜·琼斯对于神经元模型的改进, 原视频中还通过大量的测试对比了每种改动对于识别效果的影响。 通过这样的神经元模型,的确可以实现单个神经元就可以完成MNIST中数字的识别效果。 对此你有什么看法吗?

参考资料

[1]

Ilenna Jones - Can a single neuron solve MNIST?: https://www.youtube.com/watch?v=JCM1Czruyq0


TsinghuaJoking 这是一个公众号,它不端、不装,与你同游在课下、课上。 卓晴博士,清华大学中央主楼 626A。010-62773349, 13501115467,zhuoqing@tsinghua.edu.cn
评论
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 91浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 78浏览
  • 肖特基具有很多的应用场景, 可以做同步整流,防止电流倒灌和电源反接等,但是随着电源电流的增大,肖特基导通正向压降0.3~0.7v的劣势也越发明显,产生了很多的热,对于工程师的散热设计是个考验,增加了工程师的设计难度和产品成本,目前一种新的理想二极管及其控制器,目前正在得到越来越广泛的应用- BMS,无人机,PLC,安防,家电,电动工具,汽车等都在快速普及理想二极管有三种架构,内置电荷泵的类似无锡明芯微MX5050T这种,驱动能力会弱点,静态功耗200uA,外置电荷泵MX74700T的这种驱动能力
    王萌 2024-12-10 08:51 85浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 65浏览
  • 在驾驶培训与考试的严谨流程中,EST580驾培驾考系统扮演着至关重要的数据角色。它不仅集成了转速监控、车速管理、转向角度测量、转向灯光控制以及手刹与安全带状态检测等多项功能,还通过高精度的OBD数据采集器实时捕捉车辆运行状态,确保学员在模拟及实际驾驶中的每一步操作都精准无误。EST580驾培驾考转速车速转向角转向灯光手刹安全带OBD数据采集器系统的重要性及其功能:1、提高评判效率:通过原车CAN协议兼容,不同车型通过刷写固件覆盖,不仅提高了考试的数字化、自动化程度,还减少了人为干预的安装需要,从
    lauguo2013 2024-12-09 16:51 101浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 129浏览
  • 本文介绍Linux系统(Ubuntu/Debian通用)挂载exfat格式U盘的方法,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。修改对应的内核配置文件# 进入sdk目录cdrk3562_linux# 编辑内核配置文件vi./kernel-5.10/arch/arm64/configs/rockchip_linux_defconfig注:不清楚内核使用哪个defc
    Industio_触觉智能 2024-12-10 09:44 89浏览
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 68浏览
  •         霍尔传感器是根据霍尔效应制作的一种磁场传感器。霍尔效应是磁电效应的一种,这一现象是霍尔(A.H.Hall,1855—1938)于1879年在研究金属的导电机构时发现的。后来发现半导体、导电流体等也有这种效应,而半导体的霍尔效应比金属强得多,利用这现象制成的各种霍尔元件,广泛地应用于工业自动化技术、检测技术及信息处理等方面。霍尔效应是研究半导体材料性能的基本方法。通过霍尔效应实验测定的霍尔系数,能够判断半导体材料的导电类型、载流子浓度及载流子
    锦正茂科技 2024-12-10 11:07 64浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 89浏览
  • 开发板在默认情况下,OpenHarmony系统开机后 30 秒会自动息屏,自动息屏会让不少用户感到麻烦,触觉智能教大家两招轻松取消自动息屏。使用触觉智能Purple Pi OH鸿蒙开发板演示,搭载了瑞芯微RK3566四核处理器,Laval鸿蒙社区推荐开发板,已适配全新OpenHarmony5.0 Release系统,SDK源码全开放!SDK源码中修改修改以下文件参数:base/powermgr/power_manager/services/native/profile/power_mode_co
    Industio_触觉智能 2024-12-09 11:39 112浏览
  •         在有电流流过的导线周围会感生出磁场,再用霍尔器件检测由电流感生的磁场,即可测出产生这个磁场的电流的量值。由此就可以构成霍尔电流、电压传感器。因为霍尔器件的输出电压与加在它上面的磁感应强度以及流过其中的工作电流的乘积成比例,是一个具有乘法器功能的器件,并且可与各种逻辑电路直接接口,还可以直接驱动各种性质的负载。因为霍尔器件的应用原理简单,信号处理方便,器件本身又具有一系列的du特优点,所以在变频器中也发挥了非常重要的作用。  &nb
    锦正茂科技 2024-12-10 12:57 69浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦