第10章-强化学习系统
简介
近年来,强化学习不断发展,强化学习的应用在学术界和工业层出不穷,让人留下了深刻印象。 例如,2016年的AlphaGo[1]通过自我对弈数以万计盘进行练习强化,在一场五番棋比赛中4:1击败顶尖职业棋手李世石。 而深度强化学习真正的发展归功于神经网络、深度学习以及计算力的提升。纵观近年的顶级会议论文,强化学习的理论进步,应用领域逐渐爆发式增广。
然而,不同于深度学习,强化学习的框架处于百花齐放的状态。这是由于强化学习仍然在系统上仍然面临许多挑战。 在这个章节里,我们将描述强化学习有别于机器学习的地方,以及由此带来的在框架和系统上的需求和挑战。
本章将围绕以下主题展开叙述:
- 强化学习的基本概念(包括与传统机器学习,自动机器学习的区别)。 2)当前的分布式机器学习算法。 3)强化学习对系统提出的需求和挑战。 4)当前分布式强化学习的框架和应用。
内容概览
本章包含以下内容:
参考文献
- [1] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. nature, 2016, 529(7587): 484-489.