基于拉普拉斯特征映射的启发式Q学习
来源期刊:控制与决策2014年第3期
论文作者:朱美强 李明 程玉虎 张倩 王雪松
文章页码:425 - 430
关键词:强化学习;启发式策略选择;Q学习;拉普拉斯特征映射;
摘 要:在基于目标的强化学习任务中,欧氏距离常作为启发式函数用于策略选择,其用于状态空间在欧氏空间内不连续的任务效果不理想.针对此问题,引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出一种基于谱图理论的启发式策略选择方法.所提出的方法适用于状态空间在某个内在维数易于估计的流形上连续,且相邻状态间的连接关系为无向图的任务.格子世界的仿真结果验证了所提出方法的有效性.
朱美强,李明,程玉虎,张倩,王雪松
中国矿业大学信息与电气工程学院
摘 要:在基于目标的强化学习任务中,欧氏距离常作为启发式函数用于策略选择,其用于状态空间在欧氏空间内不连续的任务效果不理想.针对此问题,引入流形学习中计算复杂度较低的拉普拉斯特征映射法,提出一种基于谱图理论的启发式策略选择方法.所提出的方法适用于状态空间在某个内在维数易于估计的流形上连续,且相邻状态间的连接关系为无向图的任务.格子世界的仿真结果验证了所提出方法的有效性.
关键词:强化学习;启发式策略选择;Q学习;拉普拉斯特征映射;