第10章-强化学习系统

简介

近年来,强化学习不断发展,强化学习的应用在学术界和工业层出不穷,让人留下了深刻印象。 例如,2016年的AlphaGo[1]通过自我对弈数以万计盘进行练习强化,在一场五番棋比赛中4:1击败顶尖职业棋手李世石。 而深度强化学习真正的发展归功于神经网络、深度学习以及计算力的提升。纵观近年的顶级会议论文,强化学习的理论进步,应用领域逐渐爆发式增广。

然而,不同于深度学习,强化学习的框架处于百花齐放的状态。这是由于强化学习仍然在系统上仍然面临许多挑战。 在这个章节里,我们将描述强化学习有别于机器学习的地方,以及由此带来的在框架和系统上的需求和挑战。

本章将围绕以下主题展开叙述:

  1. 强化学习的基本概念(包括与传统机器学习,自动机器学习的区别)。 2)当前的分布式机器学习算法。 3)强化学习对系统提出的需求和挑战。 4)当前分布式强化学习的框架和应用。

内容概览

本章包含以下内容:

参考文献

  • [1] Silver D, Huang A, Maddison C J, et al. Mastering the game of Go with deep neural networks and tree search[J]. nature, 2016, 529(7587): 484-489.
Last Updated 2023-04-02 14:55:00
ON THIS PAGE