未知环境下基于有先验知识的滚动Q学习机器人路径规划
来源期刊:控制与决策2010年第9期
论文作者:胡俊 朱庆保
文章页码:1364 - 1368
关键词:滚动路径规划;移动机器人;先验知识;Q学习;未知环境;
摘 要:提出一种未知环境下基于有先验知识的滚动Q学习机器人路径规划算法.该算法在对Q值初始化时加入对环境的先验知识作为搜索启发信息,以避免学习初期的盲目性,可以提高收敛速度.同时,以滚动学习的方法解决大规模环境下机器人视野域范围有限以及因Q学习的状态空间增大而产生的维数灾难等问题.仿真实验结果表明,应用该算法,机器人可在复杂的未知环境中快速地规划出一条从起点到终点的优化避障路径,效果令人满意.
胡俊1,朱庆保2
1. 南京师范大学计算机科学与技术学院2. 江苏省信息安全保密技术工程研究中心
摘 要:提出一种未知环境下基于有先验知识的滚动Q学习机器人路径规划算法.该算法在对Q值初始化时加入对环境的先验知识作为搜索启发信息,以避免学习初期的盲目性,可以提高收敛速度.同时,以滚动学习的方法解决大规模环境下机器人视野域范围有限以及因Q学习的状态空间增大而产生的维数灾难等问题.仿真实验结果表明,应用该算法,机器人可在复杂的未知环境中快速地规划出一条从起点到终点的优化避障路径,效果令人满意.
关键词:滚动路径规划;移动机器人;先验知识;Q学习;未知环境;