简介概要

基于强化学习算法的多机器人系统的冲突消解策略

来源期刊：控制与决策2006年第4期

论文作者：任燚陈宗海

文章页码：430 - 873

关键词：多机器人;过程奖赏;优先扫除;强化学习;

摘要：多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.

详情信息展示

基于强化学习算法的多机器人系统的冲突消解策略

任燚，陈宗海

摘要：多机器人系统中,随着机器人数目的增加,系统中的冲突呈指数级增加,甚至出现死锁.本文提出了基于过程奖赏和优先扫除的强化学习算法作为多机器人系统的冲突消解策略.针对典型的多机器人可识别群体觅食任务,以计算机仿真为手段,以收集的目标物数量为系统性能指标,以算法收敛时学习次数为学习速度指标,进行仿真研究,并与基于全局奖赏和Q学习算法等其他9种算法进行比较.结果表明所提出的基于过程奖赏和优先扫除的强化学习算法能显著减少冲突,避免死锁,提高系统整体性能.

关键词：多机器人;过程奖赏;优先扫除;强化学习;

<上一页 1 下一页 >

相关论文

锦屏一级水电站地下厂房系统对穿预应力锚索孔孔斜控制施工技术

高大空间印刷厂房分层空调2D-PIV模型实验研究

龙滩水电站地下厂房开挖爆破震动衰减规律研究

分层空调下高大焊接厂房双扩散对流

水电站地下厂房洞室群施工期围岩变形特征与稳定性

澜沧江某水电站左岸地下式厂房岩体质量分级

减振技术在水电站扩建工程厂房基础爆破开挖中的应用

瀑布沟水电站地下厂房顶拱层开挖与爆破震动控制

钢锚墩在锦屏一级水电站地下厂房的运用

江口水电站地下厂房顶拱观测仪器埋设的施工方法

相关知识点

水电站主厂房空调

水电站副厂房空调通风

水电站工程概况

水电站地下厂房湿度检测与控制

水电站地下厂房主要设计资料

地下厂房分层开挖

高滩水电站主厂房渗漏原因分析及治理方案探讨

核电厂主厂房布置

炼钢电弧炉对主厂房建筑及安全设施的要求

水电地下洞室布置

矿井制冷空调降温

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号