基于Monte Carlo粒子滤波的POMDPs在线算法
来源期刊:控制与决策2013年第6期
论文作者:仵博 吴敏
文章页码:925 - 929
关键词:部分可观察马尔可夫决策过程;信念状态;Monte Carlo;粒子滤波;在线算法;
摘 要:针对部分可观察马尔可夫决策过程(POMDPs)的信念状态空间是一个双指数规模问题,提出一种基于Monte Carlo粒子滤波的POMDPs在线算法.首先,分别采用粒子滤波和粒子映射更新和扩展信念状态,建立可达信念状态与或树;然后,采用分支界限裁剪方法对信念状态与或树进行裁剪,降低求解规模.实验结果表明,所提出算法具有较低的误差率和较快的收敛性,能够满足系统实时性的要求.
仵博1,2,3,吴敏1,2
1. 中南大学信息科学与工程学院2. 中南大学先进控制与智能自动化湖南省工程实验室3. 深圳职业技术学院教育技术与信息中心
摘 要:针对部分可观察马尔可夫决策过程(POMDPs)的信念状态空间是一个双指数规模问题,提出一种基于Monte Carlo粒子滤波的POMDPs在线算法.首先,分别采用粒子滤波和粒子映射更新和扩展信念状态,建立可达信念状态与或树;然后,采用分支界限裁剪方法对信念状态与或树进行裁剪,降低求解规模.实验结果表明,所提出算法具有较低的误差率和较快的收敛性,能够满足系统实时性的要求.
关键词:部分可观察马尔可夫决策过程;信念状态;Monte Carlo;粒子滤波;在线算法;