增强学习

第 1 章,介绍

  1. 简介
  2. 材料
  3. 编程

第 2 章,决策学习

  1. 决策网络
  2. 马尔可夫决策过程
  3. MDP 数学模型
  4. 贝尔曼方程
  5. 贝尔曼最优方程

第 3 章,增强学习

  1. 简介
  2. 值函数和 Q-Learning
  3. 深度增强学习和 DQN
  4. 模拟策略学习
  5. Policy Gradient
  6. Actor Critic
  7. TRPO 和 PPO
  8. TRPO数理基础-NPG自然策略梯度
  9. Reward 学习
  10. 反向学习
  11. 基于模型的学习
  12. 离线学习
  13. 基于分布的学习
  14. 约束下的学习
  15. 部分可观察的序列学习
  16. 领域之间的知识转移
  17. 应用
  18. 挑战

第 4 章,多臂老虎机

  1. 简介
  2. 启发式算法
  3. 贝叶斯算法
  4. 上下文算法

第 5 章,博弈

  1. 博弈论
  2. 多智能体强化学习


Index Next