作者:非主流、Jane
来源:CSDN AI 科技大本营(ID:rgznai100)
今天,笔者要给大家推荐一本尽管尚未完结但在 GitHub 上却深受欢迎,已经获得近两万 Star 的深度学习书籍——《深度学习 500 问》。为什么要推荐这本书?
首先,这本书的作者是通过问答的形式,对常用的概率知识、线性代数、机器学习、深度学习、计算机视觉等热点问题进行阐述,清晰明了,方便检索,特别适合初学者。其次,该作者将这本书无偿发布在 GitHub 上,大家可以直接在线阅读或下载学习。最后,这是一本中文书。
所以,虽然这本书还未完工,但是非常适合广大读者点赞、收藏、外加转发。现在,笔者就来为大家介绍这本书的详细内容。
第一章:数学基础
这部分内容可能和大家以往看到的数学理论知识书籍不太一样,这里作者并没有讲解那些知识点,而是帮大家总结整理了知识点间的关系,比如:张量与矩阵的区别,奇异值与特征值的关系,常见概率分布(涵盖 12 种分布;通过分析每种分布的密度函数、数学期望、方差、特征函数等方面进行对比)等等。
第二章:机器学习
机器学习涉及的知识非常的多,作者在这里为大家讲解了常见的算法及它们各自的优缺点,如何根据数据类型来选择模型,如何选择函数,以及不同方法(如:降维方法 LDA、PCA)的优缺点。
第三章:深度学习
从数学基础到机器学习,接下来就是深度学习了。神经网络、前向传播、反向传播、激活函数、超参数、如何应用 Sofxmax、调节 Batch-Size 、归一化、Dropout 这些问题作者已经都为大家准备好了。
第四至六章:经典网络、CNN、RNN
第四章主要是 LetNet、AlexNet、ZFNe、VGG、GoogleNet、Inception 等经典网络模型结构、模型特点的解读。第五章则详细讲解了 CNN 网络的各组成层、卷积核、步长等基础知识,还有图解 12 种不同类型的 2D 卷积,以及 2D 卷积与 3D 卷积的不同之处;第六章为大家讲解 RNN 的特点、拓展和改进的网络和在 NLP 中的典型应用。
有了这样的讲解,还担心自己搞不懂这些网路吗?
第七至十五章
第七、八章主要介绍目标检测、图像分割等技术的运用;第九、十章将带领大家了解这两年大热的强化学习与迁移学习;目前第十一、十二章内容,作者还没有更新;第十三、十四、十五章则从优化算法、超参数调整、正则化内容出发,教你如何更好地训练模型。
看到作者把自己这么用心整理、总结的知识和资源公开发表出来时,CSDN AI 科技大本营第一时间联系到了作者。并采访了作者写这本书的初衷、目前的进展和今后的计划。现在,就来为大家介绍下本书作者——谈继勇。
问:能简单介绍下自己吗?
谈继勇:我是 2018 年硕士毕业于四川大学控制工程专业,并被评为四川大学优秀毕业生。目前就职于顺丰科技有限公司,最近正在做自动驾驶相关的技术。我曾在 Neurocomputing、Asian Journal of Control 等期刊发表论文 8 篇,其中 SCI/EI 6 篇。先后在四川大学 PMCIRI 研究所、中科院信息工程研究所和香港中文大学(深圳)交流学习,并主研过多项课题项目。
问:从什么时候开始关注人工智能?什么原因?
谈继勇:我是本科期间在实验室从事智能机器人、无人机相关研发,那时候觉得智能的工具设备很神奇,从那个时候开始接触。研究生阶段在四川大学 PMCIRI 研究所从事智能控制、计算机视觉相关的技术研究。
问:您是什么时候开始写《深度学习 500 问》的?初衷是什么?
谈继勇:我是 2017 年 9 月份开始整理,最初的想法是现有的书籍很难回答开发者各种各样的问题,市面上的书籍大多要么是一套使用方法工具类书籍,要么是理论类书籍,而经验不足的开发者想要快速开发、找到对症下药的解决方案变得很低效,所以想搜集整理这些问题成书,方便相关开发者更快的解决问题。
问:您是怎样搜集资料的?做了哪些准备?
谈继勇:主要根据现有大牛书籍、国内外知名学者个人网站、知名论坛、请教专业大牛,再结合自身理解,做了这些整理。
问:《深度学习 500 问》主要是面向什么类型的读者?为什么要采用问答的形式?
谈继勇:这个项目里面的内容以问答方式,针对不同的问题,给出解决方案,有需要的开发者或多或少都能从中受益。以问答的方式主要是方便快速解决问题,对症下药,并且能提高读者兴趣。
问:《深度学习 500 问》大概什么时候完成?目前还缺少两章节的内容有什么样的规划?
谈继勇:本来打算一年内完成,但由于项目、paper 等众多因素影响,精力有限,使得计划延期。我也希望有意者可以合作,加快完善进度。以便早成体系。
缺少的两章内容中,第十一章是近来受到大家关注的生成对抗网络——GAN;第十二章是非常干货的内容——网络框架搭建实践经验分享,我会根据自己的操作和实践经验总结那些容易出现问题的解决方法,相信这部分内容对大家在学习和工作中的帮助会非常大,敬请期待!(注:本文首发于 2018 年 10 月,目前第十一、十二章均已更新)
问:关于人工智能的学习和实践,您有什么经验可以分享的吗?
谈继勇:以做工程的角度看,需要多动手 debug,多积累实际经验。以理论角度看,加强理论知识的理解,不要跑跑模型就觉得可以了。
项目传送门:
https://github.com/scutan90/DeepLearning-500-questions