简介概要

带饱和执行器的非线性离散时滞系统的最优控制

来源期刊：东北大学学报(自然科学版)2014年第4期

论文作者：王涛罗艳红

文章页码：461 - 465

关键词：近似动态规划;启发式动态规划;值函数;神经网络;最优控制;

摘要：主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.

详情信息展示

带饱和执行器的非线性离散时滞系统的最优控制

王涛，罗艳红

东北大学信息科学与工程学院

摘要：主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.

关键词：近似动态规划;启发式动态规划;值函数;神经网络;最优控制;

<上一页 1 下一页 >

相关论文

基于数据的启发式动态规划在分解炉温度控制中的应用

带饱和执行器非线性时滞系统的自适应动态规划

自适应评价设计的执行依赖方法

基于单网络ADP的一类未知非线性系统的近似最优控制

含饱和执行器的离散时滞系统的镇定

非线性时滞系统次优控制的逐次逼近法

带正弦干扰的线性时滞系统的次优控制

一类非线性动态系统基于强化学习的最优控制

基于DHP算法的集中供热系统热源优化控制

一类具有非线性饱和执行器的不确定时滞系统鲁棒控制

相关知识点

基于神经网络的混合非线性电阻率反演成像的展望

神经网络的概念和研究历史

BP神经网络的基本结构

基于FIR神经网络的热连轧机时滞动态模型辨识

神经网络法

基于神经网络的混合非线性电阻率反演成像的总结

RBF神经网络的第二阶段学习

采矿系统工程中使用的神经网络

AGC板厚控制系统中对时滞非线性问题的有效控制方法

人工神经网络的发展史

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号