简介概要

具无界递归向量值报酬函数的非时齐马尔科夫决策规划

来源期刊:昆明理工大学学报(自然科学版)1995年第2期

论文作者:章芸 郭世贞

关键词:马尔科夫决策规划;递归向量值报酬函数;向量ε─最优策略;有效策略;最优策略。;

摘    要:研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。

详情信息展示

具无界递归向量值报酬函数的非时齐马尔科夫决策规划

章芸,郭世贞

昆明工学院基础部

摘 要:研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。

关键词:马尔科夫决策规划;递归向量值报酬函数;向量ε─最优策略;有效策略;最优策略。;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号