简介概要

一类Markov决策过程自适应决策的新方法

来源期刊:控制与决策2001年第4期

论文作者:李江红 胡照文

文章页码:415 - 419

关键词:Markov决策过程;有偏极大似然估计器;自适应决策;近似最优;

摘    要:提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求的决策精度对参数集进行有限分区 ,利用有偏极大似然估计器估计未知参数 ,并在决策过程中根据估计参数所在的分区获得控制对 Markov过程进行决策。

详情信息展示

一类Markov决策过程自适应决策的新方法

李江红,胡照文

上海交通大学电子信息学院!上海200030中南大学铁道校区!湖南长沙410075

摘 要:提出一种计算效率高且能以任意给定精度实现决策近优的新方法。该方法的原理是根据要求的决策精度对参数集进行有限分区 ,利用有偏极大似然估计器估计未知参数 ,并在决策过程中根据估计参数所在的分区获得控制对 Markov过程进行决策。

关键词:Markov决策过程;有偏极大似然估计器;自适应决策;近似最优;

<上一页 1 下一页 >

相关论文

  • 暂无!

相关知识点

  • 暂无!

有色金属在线官网  |   会议  |   在线投稿  |   购买纸书  |   科技图书馆

中南大学出版社 技术支持 版权声明   电话:0731-88830515 88830516   传真:0731-88710482   Email:administrator@cnnmol.com

互联网出版许可证:(署)网出证(京)字第342号   京ICP备17050991号-6      京公网安备11010802042557号