带饱和执行器的非线性离散时滞系统的最优控制
来源期刊:东北大学学报(自然科学版)2014年第4期
论文作者:王涛 罗艳红
文章页码:461 - 465
关键词:近似动态规划;启发式动态规划;值函数;神经网络;最优控制;
摘 要:主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.
王涛,罗艳红
东北大学信息科学与工程学院
摘 要:主要针对带有饱和执行器的时滞非线性离散时间系统更加一般的形式,通过启发式动态规划(HDP)算法求解无限时间最优控制策略问题,并在值函数中引入折扣因子.首先通过迭代HDP算法给出值函数序列和相应的控制序列,并给出了收敛性证明,即值函数序列收敛到值函数的最优值,以及控制序列收敛到最优控制;其次为了实现HDP算法,引入3个神经网络:模型网络、评判网络、控制作用网络.模型网络用来近似系统模型,评判网络用来近似值函数,控制作用网络用来近似控制;最后通过一个仿真例子说明上述方法的可行性.
关键词:近似动态规划;启发式动态规划;值函数;神经网络;最优控制;