离线学习

如果我们已经有大量的实验数据,如何从中学出最佳策略?这就是离线学习。

课程材料

论文

斯坦福 CS 224r 论文 Offline RL

滑铁卢 论文

练习

课本材料

N/A


Index Previous Next