简介概要

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

来源期刊：昆明理工大学学报(自然科学版)1997年第6期

论文作者：张继红谭兴华王跃宏

关键词：非时齐折扣MDP;时齐折扣MDP;模型转化;（S_t，ε）最优策略;最优策略;ε最优策略;

摘要：在状态和行动集均可数，报酬函数有界条件下，建立起非时齐折扣ＭＤＰ的对应时齐折扣ＭＤＰ模型，并证明两者等价从而把非时齐折扣ＭＤＰ问题转化为一个与之等价的时齐折扣ＭＤＰ问题，使时齐折扣ＭＤＰ的结果对非时齐情况也成立鉴于时齐折扣模型的讨论比较充分，这就带来了非时齐折扣模型的完满结论，并且这一转化过程揭示了非时齐与时齐折扣模型的内在联系

详情信息展示

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

张继红，谭兴华，王跃宏

昆明理工大学基础部新疆有色金属工业学校云南工业大学

关键词：非时齐折扣MDP;时齐折扣MDP;模型转化;（S_t，ε）最优策略;最优策略;ε最优策略;

简介概要

详情信息展示

MDP 中非时齐折扣模型向时齐折扣模型的转化问题

相关论文

相关知识点