终于等到你!“西瓜书”《机器学习》官方配套习题集重磅出版

IT阅读排行榜 2025-01-03 10:54

作为人工智能领域(AI)中文教材扛鼎之作,南京大学周志华教授所著的《机器学习》帮助无数AI从业者理清了机器学习的基本原理。在书中,周志华解释机器学习基本术语和问题时,贯穿全书用西瓜进行比喻讲解,因此该书也被读者们昵称为“西瓜书”。

近日,机械工业出版社携手南京大学人工智能学院推出《《机器学习》习题参考》,本书配套周志华教授所著《机器学习》的教学及自学的辅助参考书。


周志华教授撰文推荐


由叶翰嘉和詹德川两位老师合作的《〈机器学习〉习题参考》(以下简称“本书”)是一本配合本人所撰《机器学习》(清华大学出版社于2016年出版,以下采用读者给予的昵称“西瓜书”)的教学参考书。


西瓜书于2016年出版后即被用作南京大学计算机系本科课程“机器学习导论”的教材(讲授前9章),2018年南京大学成立人工智能学院后,又被用作人工智能学院本硕核心必修课的教材(本科讲授前10章、研究生讲授全书)。八年来在南京大学课堂以西瓜书为教材进行学习的同学已逾3000人,另有海内外五百余家单位以其为教材进行授课。西瓜书中每章通常提供10道习题,有不少同学希望有更多的习题以供练习。


本书的两位作者都是南京大学人工智能学院的优秀青年教师,在机器学习领域有扎实的研究基础,成果斐然。两位都先后三轮担任本人授课的助教,并已开始独立授课,有较为丰富的教学经验。本书是对南京大学教学实践中使用的课程作业的总结和拓展,书中习题试图从不同角度帮助读者更好地掌握和巩固西瓜书中前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。


希望本书的出版能够辅助读者加深对机器学习的理解,并为教师授课提供有益的补充材料。


——周志华,南京大学副校长

国际人工智能联合会理事会主席、《机器学习》作者




关于本书

  • 本书是“西瓜书”《机器学习》的教学或自学的辅助参考书包含142道习题,题型分为简答题、计算题和编程题,对“西瓜书”中关于基本概念和常用算法的第1~10章内容进行考查,习题涵盖不同难度级别,尽可能兼顾不同读者的学习需求。
  • 本书分为两部分,共16章。第一部分为“基础考评篇”,对应“西瓜书”前10章内容,对书中知识点进行循序渐进地探究。第二部分为“综合应用篇”,考查对“西瓜书”前10章知识点融会贯通的能力。
  • 书中习题均具有详细解答, 给出了出题的主要思路、所考查的知识要点、其他可能的解法,以及相关知识点的关联和拓展,并对以往授课过程中发现的易错点进行了探讨。


作者介绍

  • 叶翰嘉 南京大学人工智能学院副教授、博士生导师。从事机器学习领域研究工作,入选全国高校计算机专业优秀教师奖励计划,获中国计算机学会优秀博士学位论文奖等荣誉。
  • 詹德川 南京大学人工智能学院教授、博士生导师,南京大学科研院副院长。主要研究方向为机器学习、人工智能,入选全国高校计算机专业优秀教师奖励计划,获江苏省科学技术一等奖等荣誉。

内容简介

本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络的优化与应用、EM算法及其应用、集成学习的过拟合现象研究、度量学习及其应用。书中包含简答题、计算题和编程题,涵盖不同难度级别,机器学习初学者可以通过这些习题深入了解和巩固教材的关键概念,对机器学习有一定基础的读者也可以通过习题发现对一些知识点不同角度的解读,为后续机器学习的深入研究打下基础。

本书面向《机器学习》读者以及广大机器学习爱好者,可作为高等院校人工智能、计算机、自动化及相关专业的本科生或研究生的教学辅助书籍,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。


如何使用本书?

本书是“西瓜书”《机器学习》(简称为“教材”)的教学或自学的辅助参考书,包含大量习题、解答和注释,就像一位学习助手从不同角度帮助读者更好地掌握和巩固教材中关于基本概念和常用算法的前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。

本书的142道习题与教材章节末的习题并不重合,包含简答题、计算题和编程题三种题型,一方面可以为教师授课提供作业、考评的思路参考,同时也可帮助学生在上课或自学之余通过习题练习的方式对知识点的掌握情况进行自我评测。

本书分为两部分。第一部分为“基础考评篇”,共10章,对应教材第1~10章以及附录中机器学习数学基础部分的内容,包括105题,以计算题、简答题为主,这部分习题大多采用多个子问题的形式对书中知识点进行循序渐进的探究,部分习题和当前机器学习的前沿研究相结合,对教材中知识点的当前研究进展进行了一定程度的介绍,并给出了相应的参考文献。第二部分为“综合应用篇”,共6章,以“大作业”的形式考查对教材前10章知识点融会贯通的能力,包含37题,以编程题、简答题为主,这部分中每一章节将包含第一部分中一个或多个章节所覆盖的知识点。一方面考查将不同知识点灵活应用于实际问题的能力,另一方面考查对所学内容灵活拓展的能力。

本书提供的编程题的实验环境基于Python 3脚本语言,通过编程实践能够更便捷地在实际数据上探究知识点和算法的性质,同时也能更方便地展示如何在实际问题中应用机器学习算法。

目录

推荐序

前言

基础考评篇

第1章 绪论2

1.1 基本术语2

1.2 假设空间5

1.3 归纳偏好9

1.4 矩阵、优化和概率分布13

参考文献21

第2章 模型评估与选择23

2.1 经验误差与过拟合23

2.2 评估方法26

2.3 性能度量31

2.4 比较检验41

2.5 偏差与方差43

参考文献47

第3章 线性模型49

3.1 线性回归49

3.2 对数几率回归60

3.3 线性判别分析63

3.4 多分类学习74

参考文献78

第4章 决策树80

4.1 基本流程80

4.2 划分选择81

4.3 剪枝处理90

4.4 连续与缺失值93

4.5 多变量决策树100

参考文献105

第5章 神经网络106

5.1 感知机与多层网络106

5.2 误差逆传播算法112

5.3 全局最小与局部极小128

5.4 其他常见神经网络130

参考文献132

第6章 支持向量机134

6.1 间隔、支持向量与对偶问题134

6.2 软间隔与正则化142

6.3 核函数154

6.4 核方法158

参考文献160

第7章 贝叶斯分类器162

7.1 贝叶斯决策论162

7.2 极大似然估计166

7.3 朴素贝叶斯分类器179

7.4 贝叶斯网188

参考文献190

第8章 集成学习191

8.1 Boosting191

8.2 Bagging与随机森林201

8.3 结合策略207

8.4 多样性211

8.5 集成剪枝222

参考文献223

第9章 聚类225

9.1 距离计算225

9.2 k均值算法229

9.3 高斯混合聚类249

9.4 性能度量251

9.5 密度聚类与层次聚类254

参考文献262

第10章 降维与度量学习263

10.1 k近邻学习263

10.2 维数灾难265

10.3 主成分分析268

10.4 核化线性降维287

10.5 低维嵌入与流形学习288

10.6 度量学习291

参考文献295

综合应用篇

第11章 线性模型的优化与复用298

11.1 数据获取和预处理298

11.2 岭回归分类器的优化方法探究302

11.3 线性模型的参数选择314

11.4 线性模型的参数复用320

参考文献324

第12章 面向类别不平衡数据的分类326

12.1 类别不平衡现象与评价指标326

12.2 类别不平衡模型初探334

12.3 基于采样的“再缩放”方法340

12.4 类别不平衡问题的多分类扩展348

参考文献356

第13章 神经网络的优化与应用357

13.1 数值求导和自动求导357

13.2 神经网络优化实例362

13.3 BP算法的回顾与思考374

13.4 SOM神经网络377

参考文献385

第14章 EM算法及其应用387

14.1 数据中的隐变量387

14.2 EM算法的迭代优化视角391

14.3 EM算法的隐变量视角396

14.4 EM算法应用实例——缺失值处理398

参考文献413

第15章 集成学习的过拟合现象研究415

15.1 分布有偏移数据集的构造和划分415

15.2 机器学习中的过拟合现象418

15.3 AdaBoost的多分类算法实现425

15.4 AdaBoost是否会过拟合433

参考文献437

第16章 度量学习及其应用438

16.1 近邻分类器438

16.2 降维方法的评价444

16.3 度量学习448

16.4 度量学习的回顾与思考461

参考文献466

▲上下滑动查看本书目录




  • 本文来源:原创,图片来源:原创、AI配图

  • 责任编辑:郑琳琳,部门领导:宁姗

  • 发布人:白钰

IT阅读排行榜 技术圈的风向标,有趣,有料,有货,有品又有用
评论
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 144浏览
  • 影像质量应用于多个不同领域,无论是在娱乐、医疗或工业应用中,高质量的影像都是决策的关键基础。清晰的影像不仅能提升观看体验,还能保证关键细节的准确传达,例如:在医学影像中,它对诊断结果有着直接的影响!不仅如此,影像质量还影响了:▶ 压缩技术▶ 存储需求▶ 传输效率随着技术进步,影像质量的标准不断提高,对于研究与开发领域,理解并提升影像质量已成为不可忽视的重要课题。在图像处理的过程中,硬件与软件除了各自扮演着不可或缺的基础角色,有效地协作能够确保图像处理过程既高效又具有优异的质量。软硬件各扮演了什么
    百佳泰测试实验室 2025-01-03 10:39 89浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 132浏览
  • 【工程师故事】+半年的经历依然忧伤,带着焦虑和绝望  对于一个企业来说,赚钱才是第一位的,对于一个人来说,赚钱也是第一位的。因为企业要活下去,因为个人也要活下去。企业打不了倒闭。个人还是要吃饭的。企业倒闭了,打不了从头再来。个人失业了,面对的不仅是房贷车贷和教育,还有找工作的焦虑。企业说,一个公司倒闭了,说明不了什么,这是正常的一个现象。个人说,一个中年男人失业了,面对的压力太大了,焦虑会摧毁你的一切。企业说,是个公司倒闭了,也不是什么大的问题,只不过是这些公司经营有问题吧。
    curton 2025-01-02 23:08 247浏览
  • 本文继续介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看系统版本信息查看操作系统版本信息root@ido:/# cat /etc/*releaseDISTRIB_ID=UbuntuDISTRIB_RELEASE=20.04DISTRIB_CODENAME=focalDIS
    Industio_触觉智能 2025-01-03 11:37 106浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 134浏览
  • 在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。挂载镜像首先,将要修改内容的镜像传入虚拟机当中,并创建一个要挂载镜像的文件夹,如下图:之后通过挂载命令将system.img镜像挂载到sys
    Industio_触觉智能 2025-01-03 11:39 94浏览
  • 前言近年来,随着汽车工业的快速发展,尤其是新能源汽车与智能汽车领域的崛起,汽车安全标准和认证要求日益严格,应用范围愈加广泛。ISO 26262和ISO 21448作为两个重要的汽车安全标准,它们在“系统安全”中扮演的角色各自不同,但又有一定交集。在智能网联汽车的高级辅助驾驶系统(ADAS)应用中,理解这两个标准的区别及其相互关系,对于保障车辆的安全性至关重要。ISO 26262:汽车功能安全的基石如图2.1所示,ISO 26262对“功能安全”的定义解释为:不存在由于电子/电气系统失效引起的危害
    广电计量 2025-01-02 17:18 200浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 89浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 126浏览
  • Matter加持:新世代串流装置如何改变智能家居体验?随着现在智能家庭快速成长,串流装置(Streaming Device,以下简称Streaming Device)除了提供更卓越的影音体验,越来越多厂商开始推出支持Matter标准的串流产品,使其能作为智能家庭中枢,连结多种智能家电。消费者可以透过Matter的功能执行多样化功能,例如:开关灯、控制窗帘、对讲机开门,以及操作所有支持Matter的智能家电。此外,再搭配语音遥控器与语音助理,打造出一个更加智能、便捷的居家生活。支持Matter协议
    百佳泰测试实验室 2025-01-03 10:29 109浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦