基于强化学习的无线自组网络多节点干扰策略
来源期刊:控制与决策2018年第7期
论文作者:颛孙少帅 杨俊安 刘辉 黄科举
文章页码:1199 - 1206
关键词:无线自组网络;强化学习;拓扑网络;干扰决策;奖赏标准;
摘 要:为了实现无线自组网络通信拒止的干扰需求,构建无线自组网络模型,并针对该模型提出一种基于强化学习理论的未知拓扑网络多节点干扰策略选择算法,以实时交互的方式进行在线学习.该算法无需获悉网络拓扑等先验知识,仅以网络流数目作为反馈信息,以多节点联合干扰的方式逐步学习最佳干扰节点.在不同参数的无线自组网中的仿真结果表明,所提算法在累积阻断网络流方面优于现有算法,且在新的奖赏标准下,所提算法仍具有优异的干扰性能.
颛孙少帅,杨俊安,刘辉,黄科举
国防科技大学电子对抗学院安徽省电子制约技术重点实验室
摘 要:为了实现无线自组网络通信拒止的干扰需求,构建无线自组网络模型,并针对该模型提出一种基于强化学习理论的未知拓扑网络多节点干扰策略选择算法,以实时交互的方式进行在线学习.该算法无需获悉网络拓扑等先验知识,仅以网络流数目作为反馈信息,以多节点联合干扰的方式逐步学习最佳干扰节点.在不同参数的无线自组网中的仿真结果表明,所提算法在累积阻断网络流方面优于现有算法,且在新的奖赏标准下,所提算法仍具有优异的干扰性能.
关键词:无线自组网络;强化学习;拓扑网络;干扰决策;奖赏标准;