反向学习

除了直接学习 Reward,还可以从示例中学习奖励函数。这就是反向强化学习。

课程材料

论文

滑铁卢 Inverse RL

课本材料

N/A

练习

N/A


Index Previous Next