具无界递归报酬函数的非时齐马尔科夫决策规划
来源期刊:昆明理工大学学报(自然科学版)1993年第2期
论文作者:章芸 郭世贞
文章页码:73 - 81
关键词:马尔科夫决策规划;递归报酬函数;最优策略;ε—最优策略;
摘 要:研究一类具有无界递归报酬函数的非时齐马尔科夫决策模型,建立了模型的最优方程,证明了ε—最优马氏策略的存在性,给出了一个策略为最优及该模型存在最优策略的充要条件。
章芸,郭世贞
昆明工学院基础部
摘 要:研究一类具有无界递归报酬函数的非时齐马尔科夫决策模型,建立了模型的最优方程,证明了ε—最优马氏策略的存在性,给出了一个策略为最优及该模型存在最优策略的充要条件。
关键词:马尔科夫决策规划;递归报酬函数;最优策略;ε—最优策略;