强化学习(一):基本概念02【Markov decision processes/马尔可夫决策过程】

男娘i 2024-02-18 12:07 58阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,58人围观)

还没有评论,来说两句吧...

相关阅读

    相关 决策过程

    在强化学习中,马尔科夫决策过程(Markov decision process, MDP)是对完全可观测的环境进行描述的,也就是说观测到的状态内容完整地决定了决策的需要的特征。