简介概要

基于强化学习的大时延过程控制策略研究

来源期刊：控制工程2021年第1期

论文作者：邓颢楠刘树波李丹曹辉

文章页码：35 - 41

关键词：模型预测控制;强化学习;大时延;过程控制;长时收益;

摘要：具有长时延的过程控制被公认为是较难的系统过程控制。模型预测控制（MPC）是一种适用于大时延过程的新的过程控制方法。相比于PID等传统的控制方法,MPC基于模型对未来状态的预测进行决策,能够兼顾及时反馈与长期规划。但MPC对于过程的预测步数依然是有限的。强化学习作为机器学习的重要部分,原则上能够预测策略在无限长时间内的收益。作者基于强化学习方法改进混凝剂添加过程中的控制算法,利用大量仿真数据训练模型,成功提升了该过程的控制效果。通过对该方法进行仿真模拟,并与传统的MPC方法进行对比,证明了使用强化学习改进过的控制方法在大时延过程控制中的总体表现优于传统MPC方法。

详情信息展示

基于强化学习的大时延过程控制策略研究

邓颢楠¹，刘树波¹，李丹²，曹辉¹

1. 武汉大学计算机学院2. 湖北省水利水电科学研究院

摘要：具有长时延的过程控制被公认为是较难的系统过程控制。模型预测控制（MPC）是一种适用于大时延过程的新的过程控制方法。相比于PID等传统的控制方法,MPC基于模型对未来状态的预测进行决策,能够兼顾及时反馈与长期规划。但MPC对于过程的预测步数依然是有限的。强化学习作为机器学习的重要部分,原则上能够预测策略在无限长时间内的收益。作者基于强化学习方法改进混凝剂添加过程中的控制算法,利用大量仿真数据训练模型,成功提升了该过程的控制效果。通过对该方法进行仿真模拟,并与传统的MPC方法进行对比,证明了使用强化学习改进过的控制方法在大时延过程控制中的总体表现优于传统MPC方法。

关键词：模型预测控制;强化学习;大时延;过程控制;长时收益;

<上一页 1 下一页 >

相关论文

带终端滑模约束的非线性模型预测控制方法

步进梁加热炉神经网络模型预测控制

多模型预测控制在磨矿分级过程中的应用

具有大时延的网络控制系统的稳定性分析

氧化铝晶种分解温度的分散自适应模型预测控制

基于高速收敛粒子群优化算法的非线性系统无模型预测控制

非线性系统的多模型预测控制方法

大时延遥操作系统的波变量双边自适应控制

基于网络演算计算交换式工业以太网中的最大时延

基于模型残差基准的模型预测控制性能监控

相关知识点

主要过程控制

工艺过程控制异常

生产过程控制及操作

再结晶过程控制

过程控制系统的组成

镀锌板表面粗糙度统计过程控制

氧化铝生产计算机过程控制的熟料烧成

氧化铝生产计算机过程控制的高压溶出

熔体过程控制

生产过程控制

过程控制系统的分类

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号