强化学习入门神器！

OpenCV学堂 2021-08-20 16:14

示波器品牌知多少？ 参与示波器调研，人人有份！65W氮化镓充电头等你拿！

这几天，我收到很多留言关于如何入门强化学习，希望我能推荐Paper学习路径。

这里，我整理了关于深度强化学习的必读经典论文篇目：

深度强化学习DRL · 入门必读经典Paper

① Deep Q-learning(Mnih, Volodymyr, et al. "Playing atari with deep reinforcement learning." arXiv preprint arXiv:1312.5602 (2013).) 也叫DQN

② 对DQN的改进

i. Double Q-learning(Hasselt, Hado van et al. “Deep Reinforcement Learning with Double Q-Learning.” AAAI (2015).)

i. C51(Bellemare, M. G., Dabney, W., & Munos, R. (2017, August). A distributional perspective on reinforcement learning. In Proceedings of the 34th International Conference on Machine Learning-Volume 70 (pp. 449-458). JMLR. org.)

ii. QR-DQN(Dabney, W., Rowland, M., Bellemare, M. G., & Munos, R. (2018, April). Distributional reinforcement learning with quantile regression. In Thirty-Second AAAI Conference on Artificial Intelligence.)

分布式的方法，Distributional methods

③ REINFORCEMENT (Sutton, Richard S., et al. "Policy gradient methods for reinforcement learning with function approximation." Advances in neural information processing systems. 2000.)

④DDPG (Lillicrap, Timothy P., et al. "Continuous control with deep reinforcement learning." arXiv preprint arXiv:1509.02971 (2015).)

⑤ PPO (Schulman, John, et al. "Proximal policy optimization algorithms." arXiv preprint arXiv:1707.06347 (2017).)

⑥ TD3 (Fujimoto, Scott, Herke van Hoof, and David Meger. "Addressing function approximation error in actor-critic methods." arXiv preprint arXiv:1802.09477(2018).)

⑦ SQL(Reinforcement learning with deep energy-based policies)

⑧ SAC (Haarnoja, Tuomas, et al. "Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor." arXiv preprint arXiv:1801.01290(2018).)

以上论文都是强化学习中经典的基石Paper，特别是DQN。是第一篇成功的结合了强化学习和深度学习的工作的论文，在许多游戏环境中超越人类水平，展示了深度强化学习的巨大潜力。

想从强化学习领域发表论文，就一定要理解并掌强化学习领域的经典Paper，这样才能高效梳理出主要的知识框架，节约更多的时间。

所以，给大家也推荐 深度之眼 《强化学习：Deep Q-learning 论文精讲班》，跟着前辈学习可以大大节约你学习的时间。

↓ 扫描下方二维码添加班主任 ↓

↓ 回复：强化学习即可免费报名参加 ↓

↑ 班主任：加我进直播群、领取资料哦 ↑

1

强化学习高手方法论，教你系统学习论文

深度之眼Quincy导师结合自己工作及学习经验，并配合深度之眼教研团的打磨，总结出一条强化学习的高效学习路径：

2

2场直播+录播夯实强化学习

Step1：系统了解强化学习 技术演化路径及发展历史

Step2：精讲强化学习基石论文 — DQN

《 PIaying Atari with Deep Reinforcement Learning 》，简称DQN。是第一篇成功的结合了强化学习和深度学习的工作的论文，在许多游戏环境中超越人类水平，展示了深度强化学习的巨大潜力。

1套系统方法论：2步走教你啃透论文

Step1：深挖研究背景

提纲挚领，从4大维度介绍论文，深入讲解论文发表的研究背景、成果及意义，介绍论文中取得的核心成果，对比解决同一问题，已有解决方法和论文中提出的新的解决方法的优缺点，熟悉论文的整体思路和框架，建立对本篇论文的一个概貌性认识。

Step2：死磕算法模型

老师会重点讲解论文中的模型原理，深入拆解模型结构，对关键公式逐步推导，让你了解算法每一个因子是如何对结果产生影响的，掌握实验手段及结果，老师会帮你拎出论文中的关键点、创新点和启发点，节约你自己摸索的时间。

3

高手伴学，实现高效学习

· 3天高质量社群服务，导师全程陪伴

· 2场直播+录播，带给你完整的论文复现流程

· 200+学员同群交流，学习经验up up⬆⬆⬆

· 助教24小时答疑，再也不怕debug

· 专属班主任私信督学，治疗学习拖延症

重点是，如果你不知道怎么学习，购买课程后，班主任1v1给你制定学习计划！

4

完课即赠价值298元学习大礼包

为了激励大家完成学习，我们还准备了价值298元的算法工程师面试锦囊。只要完成全部课程的学习，你就能私信班主任获取！

5

学员好评，真香！

这一次，我给粉丝们申请了50个直播福利名额，参加即赠秘籍：《效率提升3倍的Paper阅读方法》

↓ 扫描下方二维码添加班主任 ↓

↓ 回复：强化学习即可免费报名参加 ↓

↑ 班主任：加我进直播群、领取资料哦 ↑

如果你不知道怎么读论文、不知道如何正确复现论文，一定要跟着这门课程学习一次，因为正确的方法可以节约你10倍的阅读时间。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

OpenCV学堂专注计算机视觉开发技术分享,技术框架使用,包括OpenCV,Tensorflow,Pytorch教程与案例,相关算法详解,最新CV方向论文,硬核代码干货与代码案例详解!作者在CV工程化方面深度耕耘15年,感谢您的关注!

进入专栏

评论

OpenCV学堂专注计算机视觉开发技术分享,技术框架使用,包括OpenCV,Tensorflow,Pytorch教程与案例,相关算法详解,最新CV方向论文,硬核代码干货与代码案例详解!作者在CV工程化方面深度耕耘15年,感谢您的关注!

文章：1757篇粉丝：26人

最近文章

广告

推荐

参与入门级示波器调研，赢取65W氮化镓充电头！

示波器的最低带宽多少？

精密双向电流传感放大器，提供精准测量

【直播】创新芯片重塑机器人未来

在线研讨会

EE直播间

Fabless100系列技术和应用直播 —实时控制、BMS：国产MCU迈向高性能应用直播时间：02月18日 10:00
高效协同与版本管理：Cliosoft助力现代芯片设计直播时间：02月26日 10:00
第三代功率半导体器件测试解决方案直播时间：03月06日 10:00

E聘热招职位

资料

文库

帖子

博文

分享到

评论

点赞