一类Markov决策过程自适应决策的新方法
来源期刊:控制与决策2001年第4期
论文作者:李江红 胡照文
文章页码:415 - 419
关键词:Markov决策过程;有偏极大似然估计器;自适应决策;近似最优;
摘 要:提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求的决策精度对参数集进行有限分区 ,利用有偏极大似然估计器估计未知参数 ,并在决策过程中根据估计参数所在的分区获得控制对 Markov过程进行决策。
李江红,胡照文
上海交通大学电子信息学院!上海200030中南大学铁道校区!湖南长沙410075
摘 要:提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求的决策精度对参数集进行有限分区 ,利用有偏极大似然估计器估计未知参数 ,并在决策过程中根据估计参数所在的分区获得控制对 Markov过程进行决策。
关键词:Markov决策过程;有偏极大似然估计器;自适应决策;近似最优;