终于等到你!“西瓜书”《机器学习》官方配套习题集重磅出版

IT阅读排行榜 2025-01-03 10:54

作为人工智能领域(AI)中文教材扛鼎之作,南京大学周志华教授所著的《机器学习》帮助无数AI从业者理清了机器学习的基本原理。在书中,周志华解释机器学习基本术语和问题时,贯穿全书用西瓜进行比喻讲解,因此该书也被读者们昵称为“西瓜书”。

近日,机械工业出版社携手南京大学人工智能学院推出《《机器学习》习题参考》,本书配套周志华教授所著《机器学习》的教学及自学的辅助参考书。


周志华教授撰文推荐


由叶翰嘉和詹德川两位老师合作的《〈机器学习〉习题参考》(以下简称“本书”)是一本配合本人所撰《机器学习》(清华大学出版社于2016年出版,以下采用读者给予的昵称“西瓜书”)的教学参考书。


西瓜书于2016年出版后即被用作南京大学计算机系本科课程“机器学习导论”的教材(讲授前9章),2018年南京大学成立人工智能学院后,又被用作人工智能学院本硕核心必修课的教材(本科讲授前10章、研究生讲授全书)。八年来在南京大学课堂以西瓜书为教材进行学习的同学已逾3000人,另有海内外五百余家单位以其为教材进行授课。西瓜书中每章通常提供10道习题,有不少同学希望有更多的习题以供练习。


本书的两位作者都是南京大学人工智能学院的优秀青年教师,在机器学习领域有扎实的研究基础,成果斐然。两位都先后三轮担任本人授课的助教,并已开始独立授课,有较为丰富的教学经验。本书是对南京大学教学实践中使用的课程作业的总结和拓展,书中习题试图从不同角度帮助读者更好地掌握和巩固西瓜书中前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。


希望本书的出版能够辅助读者加深对机器学习的理解,并为教师授课提供有益的补充材料。


——周志华,南京大学副校长

国际人工智能联合会理事会主席、《机器学习》作者




关于本书

  • 本书是“西瓜书”《机器学习》的教学或自学的辅助参考书包含142道习题,题型分为简答题、计算题和编程题,对“西瓜书”中关于基本概念和常用算法的第1~10章内容进行考查,习题涵盖不同难度级别,尽可能兼顾不同读者的学习需求。
  • 本书分为两部分,共16章。第一部分为“基础考评篇”,对应“西瓜书”前10章内容,对书中知识点进行循序渐进地探究。第二部分为“综合应用篇”,考查对“西瓜书”前10章知识点融会贯通的能力。
  • 书中习题均具有详细解答, 给出了出题的主要思路、所考查的知识要点、其他可能的解法,以及相关知识点的关联和拓展,并对以往授课过程中发现的易错点进行了探讨。


作者介绍

  • 叶翰嘉 南京大学人工智能学院副教授、博士生导师。从事机器学习领域研究工作,入选全国高校计算机专业优秀教师奖励计划,获中国计算机学会优秀博士学位论文奖等荣誉。
  • 詹德川 南京大学人工智能学院教授、博士生导师,南京大学科研院副院长。主要研究方向为机器学习、人工智能,入选全国高校计算机专业优秀教师奖励计划,获江苏省科学技术一等奖等荣誉。

内容简介

本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络的优化与应用、EM算法及其应用、集成学习的过拟合现象研究、度量学习及其应用。书中包含简答题、计算题和编程题,涵盖不同难度级别,机器学习初学者可以通过这些习题深入了解和巩固教材的关键概念,对机器学习有一定基础的读者也可以通过习题发现对一些知识点不同角度的解读,为后续机器学习的深入研究打下基础。

本书面向《机器学习》读者以及广大机器学习爱好者,可作为高等院校人工智能、计算机、自动化及相关专业的本科生或研究生的教学辅助书籍,也可供对机器学习感兴趣的研究人员和工程技术人员阅读参考。


如何使用本书?

本书是“西瓜书”《机器学习》(简称为“教材”)的教学或自学的辅助参考书,包含大量习题、解答和注释,就像一位学习助手从不同角度帮助读者更好地掌握和巩固教材中关于基本概念和常用算法的前10章所涉及的主要知识点,并综合考虑习题的难度和广度,尽可能兼顾不同读者的需求。

本书的142道习题与教材章节末的习题并不重合,包含简答题、计算题和编程题三种题型,一方面可以为教师授课提供作业、考评的思路参考,同时也可帮助学生在上课或自学之余通过习题练习的方式对知识点的掌握情况进行自我评测。

本书分为两部分。第一部分为“基础考评篇”,共10章,对应教材第1~10章以及附录中机器学习数学基础部分的内容,包括105题,以计算题、简答题为主,这部分习题大多采用多个子问题的形式对书中知识点进行循序渐进的探究,部分习题和当前机器学习的前沿研究相结合,对教材中知识点的当前研究进展进行了一定程度的介绍,并给出了相应的参考文献。第二部分为“综合应用篇”,共6章,以“大作业”的形式考查对教材前10章知识点融会贯通的能力,包含37题,以编程题、简答题为主,这部分中每一章节将包含第一部分中一个或多个章节所覆盖的知识点。一方面考查将不同知识点灵活应用于实际问题的能力,另一方面考查对所学内容灵活拓展的能力。

本书提供的编程题的实验环境基于Python 3脚本语言,通过编程实践能够更便捷地在实际数据上探究知识点和算法的性质,同时也能更方便地展示如何在实际问题中应用机器学习算法。

目录

推荐序

前言

基础考评篇

第1章 绪论2

1.1 基本术语2

1.2 假设空间5

1.3 归纳偏好9

1.4 矩阵、优化和概率分布13

参考文献21

第2章 模型评估与选择23

2.1 经验误差与过拟合23

2.2 评估方法26

2.3 性能度量31

2.4 比较检验41

2.5 偏差与方差43

参考文献47

第3章 线性模型49

3.1 线性回归49

3.2 对数几率回归60

3.3 线性判别分析63

3.4 多分类学习74

参考文献78

第4章 决策树80

4.1 基本流程80

4.2 划分选择81

4.3 剪枝处理90

4.4 连续与缺失值93

4.5 多变量决策树100

参考文献105

第5章 神经网络106

5.1 感知机与多层网络106

5.2 误差逆传播算法112

5.3 全局最小与局部极小128

5.4 其他常见神经网络130

参考文献132

第6章 支持向量机134

6.1 间隔、支持向量与对偶问题134

6.2 软间隔与正则化142

6.3 核函数154

6.4 核方法158

参考文献160

第7章 贝叶斯分类器162

7.1 贝叶斯决策论162

7.2 极大似然估计166

7.3 朴素贝叶斯分类器179

7.4 贝叶斯网188

参考文献190

第8章 集成学习191

8.1 Boosting191

8.2 Bagging与随机森林201

8.3 结合策略207

8.4 多样性211

8.5 集成剪枝222

参考文献223

第9章 聚类225

9.1 距离计算225

9.2 k均值算法229

9.3 高斯混合聚类249

9.4 性能度量251

9.5 密度聚类与层次聚类254

参考文献262

第10章 降维与度量学习263

10.1 k近邻学习263

10.2 维数灾难265

10.3 主成分分析268

10.4 核化线性降维287

10.5 低维嵌入与流形学习288

10.6 度量学习291

参考文献295

综合应用篇

第11章 线性模型的优化与复用298

11.1 数据获取和预处理298

11.2 岭回归分类器的优化方法探究302

11.3 线性模型的参数选择314

11.4 线性模型的参数复用320

参考文献324

第12章 面向类别不平衡数据的分类326

12.1 类别不平衡现象与评价指标326

12.2 类别不平衡模型初探334

12.3 基于采样的“再缩放”方法340

12.4 类别不平衡问题的多分类扩展348

参考文献356

第13章 神经网络的优化与应用357

13.1 数值求导和自动求导357

13.2 神经网络优化实例362

13.3 BP算法的回顾与思考374

13.4 SOM神经网络377

参考文献385

第14章 EM算法及其应用387

14.1 数据中的隐变量387

14.2 EM算法的迭代优化视角391

14.3 EM算法的隐变量视角396

14.4 EM算法应用实例——缺失值处理398

参考文献413

第15章 集成学习的过拟合现象研究415

15.1 分布有偏移数据集的构造和划分415

15.2 机器学习中的过拟合现象418

15.3 AdaBoost的多分类算法实现425

15.4 AdaBoost是否会过拟合433

参考文献437

第16章 度量学习及其应用438

16.1 近邻分类器438

16.2 降维方法的评价444

16.3 度量学习448

16.4 度量学习的回顾与思考461

参考文献466

▲上下滑动查看本书目录




  • 本文来源:原创,图片来源:原创、AI配图

  • 责任编辑:郑琳琳,部门领导:宁姗

  • 发布人:白钰

IT阅读排行榜 技术圈的风向标,有趣,有料,有货,有品又有用
评论 (0)
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 281浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 505浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 45浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 72浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 174浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 187浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 333浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 167浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 46浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 613浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 41浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 130浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦