挑战

增强学习依然有很多问题没有解决。具体挑战如下:

定理证明

大模型

参数化行动空间

Batch 增强学习

研究现状

Hierarchical RL and Skill Discovery

斯坦福 CS 224r PPT 和论文

Bayesian RL

滑铁卢 CS885 RL PPT

论文:

Maximum entropy RL

滑铁卢 CS885 RL PPT

论文:

Soft 策略迭代

伯克利 Berkeley CS285


Index Previous Next