约束下的学习
如果学习是有目标等约束,这就是约束下的学习。
课程材料
- 滑铁卢 CS885 RL PPT Constrained RL
- 上海交大伯禹增强学习 Lec 13 目标导向的强化学习
练习
- 上海交大伯禹增强学习 练习 第19章-目标导向的强化学习.ipynb
- CS885 练习 3,PPO Penalty algorithm
- 斯坦福 CS224R DRL HW 4: Goal conditional RL, Meta RL
论文
滑铁卢 论文
- Ray, Achiam, Amodei, Benchmarking Safe Exploration in Deep Reinforcement Learning.
- Liu, Alev, Liu, Policy Learning with Constraints in Model-free Reinforcement Learning: A Survey, IJCAI, 2021
课本材料
N/A
Index | Previous | Next |