具无界递归向量值报酬函数的非时齐马尔科夫决策规划
来源期刊:昆明理工大学学报(自然科学版)1995年第2期
论文作者:章芸 郭世贞
关键词:马尔科夫决策规划;递归向量值报酬函数;向量ε─最优策略;有效策略;最优策略。;
摘 要:研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。
章芸,郭世贞
昆明工学院基础部
摘 要:研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。
关键词:马尔科夫决策规划;递归向量值报酬函数;向量ε─最优策略;有效策略;最优策略。;