简介概要

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

来源期刊:昆明理工大学学报(自然科学版)1997年第6期

论文作者:张继红 谭兴华 王跃宏

关键词:非时齐折扣MDP;时齐折扣MDP;模型转化;(S_t,ε)最优策略;最优策略;ε最优策略;

摘    要:在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分,这就带来了非时齐折扣模型的完满结论,并且这一转化过程揭示了非时齐与时齐折扣模型的内在联系

详情信息展示

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

张继红,谭兴华,王跃宏

昆明理工大学基础部新疆有色金属工业学校云南工业大学

摘 要:在状态和行动集均可数,报酬函数有界条件下,建立起非时齐折扣MDP的对应时齐折扣MDP模型,并证明两者等价从而把非时齐折扣MDP问题转化为一个与之等价的时齐折扣MDP问题,使时齐折扣MDP的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分,这就带来了非时齐折扣模型的完满结论,并且这一转化过程揭示了非时齐与时齐折扣模型的内在联系

关键词:非时齐折扣MDP;时齐折扣MDP;模型转化;(S_t,ε)最优策略;最优策略;ε最优策略;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号