简介概要

自适应RBF网络Q学习控制

来源期刊：控制与决策2010年第2期

论文作者：徐明亮须文波

文章页码：303 - 306

关键词：RBF网络;自组织;Q学习;连续空间;优化;

摘要：利用RBF网络逼近连续空间的Q值函数,实现连续空间的Q学习.RBF网络输入为状态-动作对,输出为该状态-动作对的Q值.状态由系统的状态转移特性确定,动作由优化网络输出得到的贪婪动作与服从高斯分布的噪声干扰动作两部分叠加而成.利用RNA算法和梯度下降法自适应调整网络的结构和参数.倒立摆平衡控制的实验结果验证了该方法的有效性.

详情信息展示

自适应RBF网络Q学习控制

徐明亮，须文波

江南大学信息工程学院

摘要：利用RBF网络逼近连续空间的Q值函数,实现连续空间的Q学习.RBF网络输入为状态-动作对,输出为该状态-动作对的Q值.状态由系统的状态转移特性确定,动作由优化网络输出得到的贪婪动作与服从高斯分布的噪声干扰动作两部分叠加而成.利用RNA算法和梯度下降法自适应调整网络的结构和参数.倒立摆平衡控制的实验结果验证了该方法的有效性.

关键词：RBF网络;自组织;Q学习;连续空间;优化;

<上一页 1 下一页 >

相关论文

基于混合编码方式的RBF网络遗传训练算法

采用模糊RBF网络控制的煤矿瓦斯抽排系统

RBF网络在地质样品元素含量预测中的应用

单交叉口信号配时的离线Q学习模型研究

蚁群算法求解连续空间优化问题

全局优化RBF网络的一种新算法

未知环境下基于有先验知识的滚动Q学习机器人路径规划

基于一种进化模型的RBF网络参数优化

基于ART2的Q学习算法研究

自适应分组差分萤火虫算法求解连续空间优化问题

相关知识点

钛合金微观组织模拟

锻造过程微观组织模拟研究现状

微观组织分析

微观组织预测模型

ES变形微观组织

典型微观组织

微观组织预测模型概述

热轧过程中的微观组织的演变

钛合金的微观组织和性能

Cu-Cr-Zr合金微观组织演变

Cu-Ni-Sn合金微观组织分析

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号