深度强化学习(DRL 4) - DQN的实战(DQN, Double DQN, Dueling DQN)

╰半橙微兮° 2024-02-23 07:54 14阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,14人围观)

还没有评论,来说两句吧...

相关阅读

    相关 强化学习六、DQN

    到目前为止已经介绍了强化学习的基本方法:基于动态规划的方法、基于蒙特卡罗的方法、基于时间差分的方法。这些方法都有一个基本的前提条件:状态空间和动作空间是离散的,而且都不能太大。