快乐的强化学习6——DDPG及其实现方法

绝地灬酷狼 2024-04-17 05:23 90阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,90人围观)

还没有评论,来说两句吧...

相关阅读

    相关 强化学习6

    1 关键词 DDPG(Deep Deterministic Policy Gradient): 在连续控制领域经典的RL算法,是DQN在处理连续动作空间的一个扩充。