简介概要

基于强化学习的倒立摆分数阶梯度下降RBF控制

来源期刊：控制与决策2021年第1期

论文作者：薛晗邵哲平方琼林刘晓佳

关键词：强化学习;径向基神经网络;倒立摆;分数阶;梯度下降;神经网络控制;

摘要：为了提高强化学习的控制性能,提出一种基于分数梯度下降RBF神经网络的强化学习算法.通过评价神经网络和执行神经网络组成强化学习系统,利用神经网络记忆和联想,学会控制倒立摆,提高控制精度,使误差趋于零,直至学习成功,并证明闭环系统的稳定性.通过倒立摆的物理实验发现,当分数阶阶数较大,微分的作用更显著,对角速度和速度的控制效果更好,角速度和速度的均方误差和平均绝对误差较小;当分数阶阶数较小,积分的作用更显著,对倾斜角和位移的控制效果更好,因此倾斜角和位移的均方误差和平均绝对误差较小.仿真实验的结果表明,所提算法动态响应好,超调量小,调整时间短,精度高,泛化性能好.它优于基于RBF神经网络的强化学习算法和传统强化学习算法,能有效地加快梯度下降法的收敛速度,提高其控制性能.在引入适当的干扰后,所提算法能够快速地自我调节并恢复稳定状态,控制器的鲁棒性和动态性能满足实际要求.

详情信息展示

基于强化学习的倒立摆分数阶梯度下降RBF控制

薛晗，邵哲平，方琼林，刘晓佳

集美大学航海学院

摘要：为了提高强化学习的控制性能,提出一种基于分数梯度下降RBF神经网络的强化学习算法.通过评价神经网络和执行神经网络组成强化学习系统,利用神经网络记忆和联想,学会控制倒立摆,提高控制精度,使误差趋于零,直至学习成功,并证明闭环系统的稳定性.通过倒立摆的物理实验发现,当分数阶阶数较大,微分的作用更显著,对角速度和速度的控制效果更好,角速度和速度的均方误差和平均绝对误差较小;当分数阶阶数较小,积分的作用更显著,对倾斜角和位移的控制效果更好,因此倾斜角和位移的均方误差和平均绝对误差较小.仿真实验的结果表明,所提算法动态响应好,超调量小,调整时间短,精度高,泛化性能好.它优于基于RBF神经网络的强化学习算法和传统强化学习算法,能有效地加快梯度下降法的收敛速度,提高其控制性能.在引入适当的干扰后,所提算法能够快速地自我调节并恢复稳定状态,控制器的鲁棒性和动态性能满足实际要求.

关键词：强化学习;径向基神经网络;倒立摆;分数阶;梯度下降;神经网络控制;

<上一页 1 下一页 >

相关论文

机械臂系统自组织模糊径向基神经网络控制器设计

直线一级倒立摆分数阶控制器设计及仿真

基于粒子群算法倒立摆分数阶PID参数优化

二级倒立摆的状态变量合成模糊神经网络控制

状态变量合成三级倒立摆模糊神经网络控制

状态变量合成的三级倒立摆的模糊神经网络控制

二级倒立摆的Sugeno型模糊神经网络控制

基于内部回归神经网络的强化学习

非线性旋转倒立摆智能控制的实验研究

基于径向基神经网络的语音识别技术

相关知识点

磨矿过程的溢流浓度的神经网络控制

预测沉积坯体质量的神经网络技术

多层前向网络和BP算法

含铌微合金耐火结构钢

结构钢铌微合金化的历史展望

生产微合金化钢的几点考虑

高强度和超高强度钢的低合金设计

采用新合金元素开发新型铝合金

Nb微合金化技术在预硬化工具钢厚板中的应用

高强度Nb微合金化热轧结构钢卷(定尺板)

铌在舞钢建筑结构用宽厚钢板中的应用

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号