第10章-强化学习系统

简介

近年来，强化学习不断发展，强化学习的应用在学术界和工业层出不穷，让人留下了深刻印象。例如，2016年的AlphaGo[1]通过自我对弈数以万计盘进行练习强化，在一场五番棋比赛中4:1击败顶尖职业棋手李世石。而深度强化学习真正的发展归功于神经网络、深度学习以及计算力的提升。纵观近年的顶级会议论文，强化学习的理论进步，应用领域逐渐爆发式增广。

然而，不同于深度学习，强化学习的框架处于百花齐放的状态。这是由于强化学习仍然在系统上仍然面临许多挑战。在这个章节里，我们将描述强化学习有别于机器学习的地方，以及由此带来的在框架和系统上的需求和挑战。

本章将围绕以下主题展开叙述:

强化学习的基本概念（包括与传统机器学习，自动机器学习的区别）。 2）当前的分布式机器学习算法。 3）强化学习对系统提出的需求和挑战。 4）当前分布式强化学习的框架和应用。

内容概览

本章包含以下内容：

参考文献

[1] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. nature, 2016, 529(7587): 484-489.

第10章-强化学习系统

# 简介

# 内容概览

# 参考文献

ON THIS PAGE

简介

内容概览

参考文献