其实,监督学习与无监督学习,就好比现在大多数中国家庭里面对孩子的教育一样。有的父母喜欢监督、指导孩子学习,这样不仅仅父母累,孩子可能也会累,得到的都是标准答案;另一类是非常有自主学习能力和习惯的孩子,他们会主动去学习,去寻找正确的答案,有时候得到的答案可能不是标准答案,但是这样孩子的学习能力是非常强的。而且,等到初中及以上,大部分父母都没法进行监督学习了。这就像机器学习一样,当面对大量的数据和分析时,人已经无能为力,必须通过无监督学习进行。对孩子的教育也一样,刚开始可以实行监督学习,慢慢地必须让其掌握方法,培养习惯,让其进入无监督学习状态。

在机器学习领域,经常听到诸如“XGBoost”和“F-Score”之类的术语。最常见的两种是“监督”和“无监督”学习。今天,我们为您深入浅出讲解!

其实,监督学习与无监督学习,就好比现在大多数中国家庭里面对孩子的教育一样。有的父母喜欢监督、指导孩子学习,这样不仅仅父母累,孩子可能也会累,得到的都是标准答案;另一类是非常有自主学习能力和习惯的孩子,他们会主动去学习,去寻找正确的答案,有时候得到的答案可能不是标准答案,但是这样孩子的学习能力是非常强的。而且,等到初中及以上,大部分父母都没法进行监督学习了。这就像机器学习一样,当面对大量的数据和分析时,人已经无能为力,必须通过无监督学习进行。对孩子的教育也一样,刚开始可以实行监督学习,慢慢地必须让其掌握方法,培养习惯,让其进入无监督学习状态。

什么是机器学习?

什么是机器学习?这个定义引起了激烈的争论,我们引用机器学习大师 Andrew Ng (吴恩达)的名言来解释:

机器学习是一种技术,它可以让计算机仅通过查看数据就变得越来越智能。” 

现在,我们来讨论让这些计算机变得更智能的方法。

监督与无监督学习

从广义上讲,您可以将大多数机器学习算法归为两类之一——有监督和无监督。如果您意识到您需要使用机器学习来解决问题,您将需要确定您将使用哪种方法。

在监督学习算法的情况下,您可以通过告诉模型答案是什么来拟合模型。这很像您的说西班牙语的朋友指着桌子说“Mesa”。现在,您知道西班牙语中的桌子是什么了!她为您提供了正确的输入和输出,以便您进行关联。监督学习算法也是如此。

无监督学习就是学习,但是,你猜对了,没有提供答案!这完全是另一场比赛。这些算法似乎神奇地解决了我们甚至不知道存在的数据问题。

监督学习:示例

因此,需要为监督学习算法提供答案(也称为标签)。然后它可以在输入和提供的答案之间绘制出“转换”或翻译。例如,更多的学习时间会映射到更高的成绩吗?直觉上,我会说是的,我们可以使用数据更确定地回答。我们需要做的就是跟踪学生投入了多少时间学习样本,然后通过提供答案来训练模型。

下面是两所葡萄牙学校的学生最终成绩与下面的学习小时数组(箱)进行了对比:

我们可以看到一个小的正相关,这意味着学习时间更长和取得更好的成绩之间可能存在联系。虽然令人惊讶的是,这种关系并没有你想象的那么牢固!学习时间长不一定总能给你更好的成绩。正如他们所说,“......更聪明,而不是更难”!

 

 

 

无监督学习

这就是魔法发生的地方。当你的老板递给你一些非描述性数据时,你会使用这些算法,比如“嘿,你知道机器学习。你能从这些数据中找到什么?”。

聚类

无监督学习算法不需要标签就可以使用。相反,我们可以简单地输入数据来进行一些“数据挖掘”。即使刚进入教室,您是如何感觉到教室里的“朋友群”的?也许是他们坐得有多近,或者他们的服装相似。同样,我们可以使用无监督学习在数据中找到分组。

对于一个经典示例,可以查看客户细分问题(数据集)。这个想法是有一些关于客户的信息,并且您怀疑可能存在一些组(或细分)。了解这一点可能有助于定位营销和业务工作。

使用聚类算法 k-means,我们可以清楚地看到有一组集群是高收入者和高支出者。还有一个低支出、高收入的群体。

 

 

 

异常检测

聚类并不是无监督学习唯一可以做的事情!无监督学习有很多技巧。另一个无监督学习问题集是异常检测。这在各种场景中都很方便。例如,您可以发现来自传感器的错误数据点、识别欺诈者并突出复杂数据集中的异常事件。

这是一个简单的示例,用于发现与平均值“相差太远”的异常数据点。

 

 

 

降维

复杂的数据集可能很麻烦,尤其是当我们只能想象最多 3 维的图形时。使用一个漂亮的算法,我们可以只用二维来描述复杂的数据。

以500,000 条 美食评论为例。阅读所有评论是不切实际的,更不用说在合理的时间内找到共同的主题和话题了!为此,我们可以使用机器学习对评论进行编码,并将复杂信息减少到二维,以更好地理解数据。下面,我们可以根据二维图中的多维“含义”看到一些清晰的评论分组。

小结

机器可以通过多种方式学习。你使用什么方法取决于数据和你要解决的问题。也许你有一些带有标签的数据,需要归纳起来进行预测,或者你只是想找到一些模式。

其实,监督学习与无监督学习,就好比现在大多数中国家庭里面对孩子的教育一样。有的父母喜欢监督、指导孩子学习,这样不仅仅父母累,孩子可能也会累,得到的都是标准答案;另一类是非常有自主学习能力和习惯的孩子,他们会主动去学习,去寻找正确的答案,有时候得到的答案可能不是标准答案,但是这样孩子的学习能力是非常强的。而且,等到初中及以上,大部分父母都没法进行监督学习了。这就像机器学习一样,当面对大量的数据和分析时,人已经无能为力,必须通过无监督学习进行。对孩子的教育也一样,刚开始可以实行监督学习,慢慢地必须让其掌握方法,培养习惯,让其进入无监督学习状态。

对于学生或者孩子,我们总是希望能够提前了解或者说预测TA的成绩将是多少?有没有想过这个神奇的方法:可以用机器学习来预测学生成绩,没错,确实可以的,而且比较精准。需要本文中的数据集或者感兴趣的朋友可以关注我们或者联系作者(微信同名),下期将会推出这个主题:怎样用AI/机器学习来预测学生的成绩!

责编:Challey
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
近期,多个储能电站项目上新。■ 乐山电力:募资2亿建200MWh储能电站12月17日晚,乐山电力(600644.SH)公告,以简易程序向特定对象发行A股股票申请已获上交所受理,募集资金总额为2亿元。发
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
12月18日,珠海京东方晶芯科技举行设备搬入仪式。插播:加入LED显示行业群,请加VX:hangjia188在10月31日,珠海京东方晶芯科技有限公司发布了Mini/Micro LED COB显示产品
万物互联的时代浪潮中,以OLED为代表的新型显示技术,已成为人机交互、智能联结的重要端口。维信诺作为中国OLED赛道的先行者和引领者,凭借自主创新,实现了我国OLED技术的自立自强,成为中国新型显示产
12月18 日,据报道,JNTC与印度Welspun BAPL就车载盖板玻璃的开发及量产签订了投资引进业务合作备忘录(MOU)。资料显示,JNTC是韩国的一家盖板玻璃厂商。Welspun的总部位于印度
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
近期,高科视像、新视通、江苏善行智能科技等企业持续扩充COB产能。插播:加入LED显示行业群,请加VX:hangjia188■ 高科视像:MLED新型显示面板生产项目(二期)招标12月18日,山西高科
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
 “ AWS 的收入增长应该会继续加速。 ”作者 | RichardSaintvilus编译 | 华尔街大事件亚马逊公司( NASDAQ:AMZN ) 在当前水平上还有 38% 的上涨空间。这主要得益