DOI: 10.11817/j.issn.1672-7207.2020.10.007

基于滑模干扰观测器的机械臂终端滑模控制
韩俊庆,吴爱国,董娜
(天津大学 电气自动化与信息工程学院,天津,300072)
摘要:针对多自由度机械臂在实现轨迹跟踪控制时过于依赖动力学模型和跟踪精度低等问题,提出一种将时延估计、终端滑模控制和滑模干扰观测器相结合的控制方法。首先,使用时延估计方法对机械臂系统的模型信息和外部干扰等进行估计,使机械臂的动力学模型简化成一个局部模型;然后对这个局部模型设计非奇异准终端滑模控制器,以解决传统终端滑模中的奇异问题,提高控制精度;针对时延估计的误差,设计一种有限时间滑模干扰观测器,将时延误差看作外部干扰进行补偿,实现不依赖模型的高精度控制。利用Lyapunov理论证明系统的滑模变量和估计误差能在有限时间内收敛至0。最后,以2-DOF机械臂仿真模型和Denso VP6242串联机械臂为对象进行验证。研究结果表明:该控制方法能够有效地提高控制精度,增强对干扰的鲁棒性。
关键词:机械臂;轨迹跟踪;时延估计;滑模干扰观测器;终端滑模控制;有限时间收敛
中图分类号:TP241;TP273 文献标志码:A 开放科学(资源服务)标识码(OSID)
文章编号:1672-7207(2020)10-2749-09
Terminal sliding mode control for robotic manipulator based on sliding mode disturbance observer
HAN Junqing, WU Aiguo, DONG Na
(School of Electrical and Information Engineering, Tianjin University, Tianjin 300072, China)
Abstract: To deal with the problem of relying too much on the precise mathematical model and low tracking accuracy, a control method combining the time delay estimation, the terminal sliding mode control and the sliding mode disturbance observer was proposed for trajectory tracking of multi-degree of freedom robotic manipulator. Firstly, the time-delay estimation method was used to estimate the model information and external disturbances of robotic manipulator, so that the dynamic model of manipulator could be simplified into a local model. Then, a non-singular quasi-terminal sliding mode controller was designed for this local model, which solved the singularity problem in traditional terminal sliding mode and improved the control precision. A finite time sliding mode disturbance observer was designed to compensate for the time delay error which was regarded as external disturbance, and then the model-free and high-precision trajectory tracking control was realized. The Lyapunov theory was used to prove that the sliding mode variables and estimation errors of the system could converge to zero in a finite time. Finally, the control method was applied to the simulation model of 2-DOF manipulator and the Denso VP6242 manipulator for verification. The results show that the proposed control method can improve the control accuracy and increase robustness against disturbances.
Key words: robotic manipulator; trajectory tracking; time-delay estimation; sliding mode disturbance observer; terminal sliding mode control; finite time convergence
目前,机械臂已经被广泛应用于工业领域,它能够帮助人们快速完成工业过程中一些复杂和重复的任务,如装配、运输、钻孔和倒角等,这些任务都要求机械臂能够对期望轨迹进行高精度的轨迹追踪。然而,机械臂是一个复杂的非线性系统,它本身存在的模型不确定性等因素使得它的精确数学模型难以建立,这给机械臂的高精度估计追踪带来一定的困难,所以研究不依赖模型的高精度控制方法对于机械臂系统尤为重要。针对机械臂的轨迹追踪控制问题,学者们提出了很多控制方法,如反步控制法[1]、自适应控制法[2]、滑模控制法[3-7]、鲁棒控制法[8]、时延控制法[9-10]和神经网络控制法[11]。其中,滑模控制方法(SMC)由于结构简单,控制精度高,对外部干扰鲁棒性强等优点,被广泛应用于机械臂控制领域。传统的滑模控制采用线性滑模面,使处于滑模面的状态变量逐渐地趋近于零,但不能在有限时间内收敛;为了解决这个问题,提高控制精度,MAN等[4]提出了终端滑模(TSMC)的方法,使处于滑模面的状态变量能在有限时间收敛到零,但该方法存在奇异性问题。为了解决奇异性问题,FENG等[5]提出非奇异终端滑模控制(NTSMC)方法,并应用于机械臂轨迹追踪控制中,但该方法会在切换控制项中引入指数项,它的存在可能造成收敛停滞;WANG等[7]根据传统的终端滑模设计了一种准终端滑模面,当跟踪误差收敛到某个邻域时将终端滑模面切换为另一种非线性滑模面,这种方法既消除了奇异性问题,又不会使滑模趋近律项中引入状态的指数项,可以充分发挥终端滑模的优势。虽然滑模控制算法有很多优势,但它是一种基于模型的控制方法,直接用于具有模型不确定性的机械臂系统控制中往往达不到预期的控制效果。为了解决这一问题,JIN等[12-13]根据时延控制的思想,将时延估计(TDE)与滑模控制相结合用于机械臂控制,通过时延估计来估计系统的模型信息以及外部干扰,将机械臂模型简化,然后设计非奇异终端滑模控制器,实现了不依赖模型的机械臂控制;但这种方法没有考虑对时延估计误差的补偿,而是通过鲁棒项加以抑制,这使控制器设计存在一定保守性。TRAN等[14]将神经网络与终端滑模相结合,以径向基神经网络来逼近机械臂模型中各个元素,实现了无模型控制;但这种方法的计算量很大,不利于实时控制。ZHU等[15]将自适应滑模干扰观测器与终端滑模相结合用于空间机械臂控制,该方法以自适应滑模干扰观测器来补偿模型的不确定项和外部干扰,实现自抗扰控制;但这种方法在控制器设计时需要机械臂的名义模型,不能实现完全不依靠模型的控制。本文作者根据时延控制、非奇异准终端滑模与滑模干扰观测器的优点,提出一种基于干扰观测器的终端滑模控制方法,并以仿真和实验数据验证了该方法的有效性。
1 模型描述
一个n自由度的机械臂动力学模型[16]可以表示为
(1)
式中:
,
,分别为机械臂系统的角位置、角速度和角加速度向量;
,为非奇异的惯性矩阵;
,为离心力和科里奥利力矩阵;
,为重力向量;
,为摩擦力矩阵;
,为外部干扰向量;
,为控制力矩向量。
通常机械臂的动力学模型具有如下性质:
是一个对称正定矩阵,它的范数满足
,其中,
和
为正常数。
为了简化机械臂的动力学模型,引入一个常对角矩阵
,将式(1)转化为
(2)
由式(2)求得
,表示机械臂系统所有模型信息与外部干扰的总和。
控制目标:设计合适的控制器,使机械臂的关节角位置
能在有限时间内跟踪期望轨迹
。
定义系统的跟踪误差
及其导数如下:
,
,
。
2 控制器设计
控制器设计方法分为3步:1) 根据时延估计的思想,确定式(2)中的
项,将机械臂的动力学模型转化为局部模型;2) 选择终端滑模面,设计终端滑模控制器;3) 设计滑模干扰观测器(SMDO)对时延估计的误差进行补偿。所设计的控制器的结构形式如图1所示。

图1 控制器结构框图
Fig. 1 Block diagram of controller
2.1 机械臂局部模型
由式(2)可以看出,只有
是未知项。本文采用时延估计的思想,以上一个采样时刻的控制输入和系统输出来估计当前时刻的
项:
(3)
式中:
为采样时间间隔,
越小,时延估计的误差越小;t为时间。时延估计的误差
可以表示为
(4)
基于时延估计的机械臂简化模型(2)仅仅在一个采样时间间隔内有效,故称为机械臂的局部模型。
2.2 终端滑模控制器设计
引理1[10]:当矩阵
满足
并且
时,其中,
为单位矩阵,时延估计误差
及其导数都存在上界,使机械臂第i个关节模型的时延误差
及其导数满足
,
,其中,
均为正常数。
为了简化表达式,定义
(5)
式中:
为常数;
。
设计滑模控制器,首先需要选择合适的滑模面来保证理想的滑动模态。本文选择非奇异准终端滑模变量矩阵
为
(6)
式中:
,为正常数对角矩阵。
为由一组非线性函数组成的向量,
。
(7)
式中:
;
;
均为正常数。
对式(6)求导得:
(8)
式中:
。
(9)
使
可以得出等效控制项
:
(10)
从式(9)和(10)可以看出:当追踪误差小于某个设定的邻域时,等效控制项中没有非奇异项,说明本文使用的非奇异准终端滑模面可以消除传统终端滑模的奇异性问题。
选择合适的滑模面之后,下一步是设计滑模控制器的切换控制项。本文选择快速型终端趋近律作为切换控制项
:
(11)
式中:
,
,均为正常数对角矩阵。
2.3 滑模干扰观测器设计
基于时延估计的机械臂简化模型存在时延估计误差,而时延误差的存在会影响控制器的控制性能。为了消除时延估计误差的影响,本文将时延误差看作一种外部干扰,设计滑模干扰观测器对它进行补偿,干扰补偿项
如下:
(12)
式中:
为设计的干扰观测器对时延误差的补偿项:
(13)
式中:
为中间辅助量;
,
,均为正常数对角矩阵。
综上,本文设计的控制器的控制输出可以表示为


(14)
3 有限时间收敛性证明
定理1:针对机械臂的动力学简化模型(2),选择如式(6)所示的非奇异准终端滑模面、式(14)所示的控制器以及式(13)所示的滑模干扰观测器,并且当控制器参数和观测器参数满足一定条件时,滑模变量和观测器误差能在有限时间内收敛到0。
证明:将控制器输出式(14)代入机械臂简化模型(2)可得
(15)
式中:
,为滑模干扰观测器的估计误差。由式(13)可得
(16)
为了简化证明过程,将动态系统式(15)和(16)转化为n个子系统:
(17)
式中:
。
根据引理1,第i个时延估计误差的导数可以写成
(18)
式中:
为一个有界的时变函数,满足
。
定义
,有
(19)
式(19)可以进一步表示为
(20)
式中:
,
。
选取二次型Lyapunov函数
:
(21)
(22)
式中:
为对称正定矩阵,
和
为正常数。可以看出,当
,
时,矩阵
总是正定的。由式(22)可知,Lyapunov函数
满足:
(23)
式中:
和
分别为矩阵
的最大特征值和最小特征值。
对Lyapunov函数
求导得


(24)
式中:
,
,均为对称矩阵。
(25)
当控制器和观测器参数
,
,
和
满足式(26)所示关系时,矩阵
和
均为对称正定矩阵。

(26)
则式(24)可以转化为
(27)
式中:
分别为矩阵
的最小特征值。
由式(23)可得
(28)
由
可知,
,则式(27)可以进一步转化为

(29)
由文献[17]中的有限时间收敛定理可知,
与
能在有限时间收敛至0,则系统的滑模变量和观测器误差能在有限时间收敛至0,定理1得证。
4 仿真
为了验证本文所提出的控制方法的有效性,使用一个2-DOF的机械臂作为仿真对象,如图2所示。其动力学方程如下:
(30)
(31)
(32)
(33)
(34)
式中:
为关节
的角度,i=1,2;
,
,
和
分别表示
,
,
和
。连杆的长度为
,
;g为重力加速度;连杆的质量为
;黏滞摩擦因数选择为
;库仑摩擦因数选择为
;2个关节受到外部干扰分别为
;2个关节角度初始值均为30°,角速度和角加速度初始值均为0。2个关节的期望输出轨迹
和
均为
,仿真时间为10 s。

图2 2-DOF机械臂仿真模型
Fig. 2 Simulation model of 2-DOF robot manipulator
通过MATLAB进行仿真,仿真采用式(14)所示的控制律和式(13)所示的滑模观测器,记为TDE-SMO-TSMC,仿真参数为:
,
,
,
,
,
,
,
。采样时间间隔设置为
。
为了体现TDE-SMO-TSMC控制律的优越性,将其记为控制器1,分别与以下2种控制器进行比较。
控制器2:为了体现滑模干扰观测器(13)对于控制器性能的提升,去掉滑模干扰观测器补偿项,记为TDE-TSMC,其控制器输出为

(35)
式中:仿真参数
,
,
,
,
,
和L的选取与控制器1的相同。
控制器3:为了体现非奇异准终端滑模面(6)对于控制精度的提升,基于线性滑模面构建滑模控制器,记为TDE-SMO-SMC,其控制律为


(36)
式中:仿真参数
,
,
,
,
和L的选取与控制器1的相同,参数
。
关节1和2的追踪误差及观测器输出的仿真结果分别如图3~6所示。从图3和4可以看出,3种控制器都能够完成对机械臂的轨迹追踪控制,且能在非线性时变干扰下完成高精度的轨迹追踪,这说明时延估计对于机械臂的高精度控制起到了一定的作用。由图3和图4还可以看出:本文提出的控制器TDE-SMO-TSMC控制性能最佳。

图3 仿真中关节1的追踪误差
Fig. 3 Tracking error of joint 1 in simulation

图4 仿真中关节2的追踪误差
Fig. 4 Tracking error of joint 2 in simulation

图5 仿真中关节1的观测器输出
Fig. 5 Observer output of joint 1 in simulation

图6 仿真中关节2的观测器输出
Fig. 6 Observer output of two joint 2 in simulation
对比图3和图4中的控制器TDE-SMO-TSMC与TDE-SMO-SMC,两者的区别是采用的滑模面不同,从仿真结果可以看出TDE-SMO-TSMC大约在0.7 s追踪误差收敛至0附近,而TDE-SMO-SMC大约在1.3 s追踪误差收敛至0附近,说明非奇异准终端滑模面(6)的使用可以提高轨迹追踪的收敛速度;由图3和图4中局部放大图可以看出,对于控制器TDE-SMO-SMC,外部干扰使关节1和2产生的误差峰值分别为2°和1°,而对于控制器TDE-SMO-TSMC,外部干扰使关节1和2的误差峰值均为0.5°左右,误差峰值分别降低了约75%和50%,说明非奇异准终端滑模面(6)的使用可以提高控制器对干扰的鲁棒性。
对比控制器TDE-SMO-TSMC与TDE-TSMC(TDE-TSMC是去掉了滑模观测器的终端滑模控制器),从图3和图4中的放大图可以看出,对于控制器TDE-TSMC,外部干扰使关节1和2产生的误差峰值分别为1.3°和1.8°,相比于控制器TDE-SMO-TSMC,误差峰值分别升高了约53.8%和72.2%,说明滑模干扰观测器(13)的使用可以提高控制器对干扰的鲁棒性。
对比图5和图6可以看出,滑模干扰观测器可以很好地观测出时延估计误差,说明本文提出的滑模干扰观测器能够有效地补偿时延估计误差,提高控制器的抗干扰性。
为了定量地分析3种控制器的控制精度,借助数理统计中均方差E的概念作为衡量指标:
(37)
式中:N为采样数。
从图3和图4可以看出,系统的初始误差不为0,这是由于机械臂系统关节角度的初始值与期望轨迹初始值不相同造成的,而不是控制器本身的原因,因此,这里只考虑2 s后跟踪误差的均方差,结果如表1所示。由表1可见:与控制器TDE-TSMC相比,控制器TDE-SMO-TSMC使关节1和2的均方差分别下降了60.1%和62.5%,与控制器TDE-SMO-SMC相比,控制器TDE-SMO-TSMC使关节1和2的均方差分别下降了69.5%和56.5%,说明非奇异准终端滑模面(6)和滑模干扰观测器(13)的使用可以有效提升控制器的控制精度。
仿真结果表明,本文设计的控制方法能够有效地提高机械臂轨迹追踪的控制精度,消除系统抖振。
表1 3个控制器作用下追踪误差的均方差
Table 1 Mean square of tracking error of three controllers

5 轨迹追踪实验
为了验证本文设计的控制器在实际应用中的控制效果,在Quanser公司开发的Denso 6-DOF实验平台下进行轨迹追踪实验,实验平台如图7所示。该实验平台包括软件和硬件系统,其硬件系统包括Denso VP-6242G 6-DOF机械臂本体、上位机和伺服控制器;软件系统包括MATLAB 2014a和实时控制软件Quarc。用户可以在Simulink环境下编写自己的控制器程序,然后通过Quarc软件生成可执行文件,实现实时在线运行。上位机控制器计算出输出控制力矩,经过以太网和数据采集模块送入伺服控制器,驱动机械臂中的驱动电机;机械臂运行过程中的关节位置信息由编码器测量得到,通过以太网和数据采集系统送往上位机,完成机械臂的闭环控制器。实验过程中采样时间间隔为0.001 s。

图7 机械臂实验平台
Fig. 7 Experiment platform of robot manipulator

图8 机械臂各关节信息
Fig. 8 Information of each joint of the robot manipulator
在实验中选择Denso 6-DOF机械臂的关节2和关节3作为实验对象,其他关节锁死,机械臂各关节信息如图8所示。实验平台有2.8 s的响应时间,在2.8 s后机械臂才开始有动作,所以设置关节2和关节3的期望轨迹为
(38)
其中,实验时间为15 s。
实验中TDE-SMO-TSMC控制器参数选择为
,
,
,
,
,
,
,
,采样时间间隔设置为
。
同仿真实验相同,将控制器TDE-SMO-TSMC与控制器TDE-TSMC和TDE-SMO-SMC的控制效果进行对比。
TDE-TSMC参数
,
,
,
,
,
和L与控制器TDE-SMO-TSMC参数相同。
TDE-SMO-SMC参数
,
,
,
,
和L与TDE-SMO-TSMC参数相同,参数
。
关节2和3的追踪误差实验结果分别如图9和图10所示。由图9和图10可以看出,3种控制器都能够实现高精度的轨迹追踪,这体现了时延估计方法的优越性。

图9 实验中关节2的追踪误差
Fig. 9 Tracking error of joint 2 in experiment

图10 实验中关节3的追踪误差
Fig. 10 Tracking error of joint 3 in experiment
为了定量地分析3种控制器在实际应用中的控制性能,使用4 s后的均方差作为控制性能的衡量标准,则3种控制器作用下关节追踪误差的均方差如表2所示。
表2 3个控制器作用下追踪误差的均方差
Table 2 Mean square of tracking error under three controllers

分析表2可知:相比于控制器TDE-TSMC,控制器TDE-SMO-TSMC使关节2和3的追踪误差均方差下降了约61.5%和62.1%,说明滑模干扰观测器的使用能够在实际应用中有效提升轨迹追踪的控制精度;相比于控制器TDE-SMO-SMC,控制器TDE-SMO-TSMC使关节2和3的追踪误差均方差下降了约43.8%和42.1%,说明准终端滑模面的使用能够在实际应用中有效提升轨迹追踪的控制精度。
实验结果表明,本文提出的控制方法能够在实际应用中提高机械臂系统的控制性能。
6 结论
1) 使用时延估计方法将机械臂的动力学模型转化为一个局部模型,并基于滑模干扰观测器和非奇异终端滑模控制思想提出TDE-SMO-TSMC控制律。
2) 通过构造二次型Lyapunov函数证明了系统的滑模变量和观测器误差能在有限时间内收敛至0。
3) 本文设计的控制器能够有效地提高机械臂轨迹追踪的控制精度,增强对干扰的鲁棒性。
参考文献:
[1] YU Yao, LU Geng, SUN Changyin, et al. Robust backstepping decentralized tracking control for a 3-DOF helicopter[J]. Nonlinear Dynamics, 2015, 82(1/2): 947-960.
[2] ZHOU Jing, WEN Changyun, WANG Wei. Adaptive control of uncertain nonlinear systems with quantized input signal[J]. Automatica, 2018, 95: 152-162.
[3] QURESHI M S, SWARNKAR P, GUPTA S. A supervisory on-line tuned fuzzy logic based sliding mode control for robotics: an application to surgical robots[J]. Robotics and Autonomous Systems, 2018, 109: 68-85.
[4] MAN Zhihong, PAPLINSKI A P, WU H R. A robust MIMO terminal sliding mode control scheme for rigid robotic manipulators[J]. IEEE Transactions on Automatic Control, 1994, 39(12): 2464-2469.
[5] FENG Yong, YU Xinghuo, MAN Zhihong. Non-singular terminal sliding mode control of rigid manipulators[J]. Automatica, 2002, 38(12): 2159-2167.
[6] TIAN Bailing, LIU Lihong, LU Hanchen, et al. Multivariable finite time attitude control for quadrotor UAV: theory and experimentation[J]. IEEE Transactions on Industrial Electronics, 2018, 65(3): 2567-2577.
[7] WANG Liangyong, CHAI Tianyou, ZHAI Lianfei. Neural-network-based terminal sliding-mode control of robotic manipulators including actuator dynamics[J]. IEEE Transactions on Industrial Electronics, 2009, 56(9): 3296-3304.
[8] KHOO S, XIE Lihua, MAN Zhihong. Robust finite-time consensus tracking algorithm for multirobot systems[J]. IEEE/ASME Transactions on Mechatronics, 2009, 14(2): 219-228.
[9] HSIA T C S, LASKY T A, GUO Z. Robust independent joint controller design for industrial robot manipulators[J]. IEEE Transactions on Industrial Electronics, 1991, 38(1): 21-25.
[10] KALI Y, SAAD M, BENJELLOUN K, et al. Super-twisting algorithm with time delay estimation for uncertain robot manipulators[J]. Nonlinear Dynamics, 2018, 93(2): 557-569.
[11] CUONG P, WANG Yaonan. Adaptive trajectory tracking neural network control with robust compensator for robot manipulators[J]. Neural Computing and Applications, 2016, 27(2): 525-536.
[12] JIN Maolin, LEE J, CHANG P H, et al. Practical nonsingular terminal sliding-mode control of robot manipulators for high-accuracy tracking control[J]. IEEE Transactions on Industrial Electronics, 2009, 56(9): 3593-3601.
[13] BAEK J, JIN Maolin, HAN S. A new adaptive sliding-mode control scheme for application to robot manipulators[J]. IEEE Transactions on Industrial Electronics, 2016, 63(6): 3628-3637.
[14] TRAN M D, KANG H J. Adaptive terminal sliding mode control of uncertain robotic manipulators based on local approximation of a dynamic system[J]. Neurocomputing, 2017, 228: 231-240.
[15] ZHU Yukai, QIAO Jianzhong, GUO Lei. Adaptive sliding mode disturbance observer-based composite control with prescribed performance of space manipulators for target capturing[J]. IEEE Transactions on Industrial Electronics, 2019, 66(3): 1973-1983.
[16] 霍伟. 机器人动力学与控制[M]. 北京: 高等教育出版社, 2005: 50-70.
HUO Wei. Robot dynamics and control[M]. Beijing: Higher Education Press, 2005: 50-70.
[17] YU Shuanghe, YU Xinghuo, SHIRINZADEH B, et al. Continuous finite-time control for robotic manipulators with terminal sliding mode[J]. Automatica, 2005, 41(11): 1957-1964.
(编辑 伍锦花)
收稿日期: 2020 -03 -01; 修回日期: 2020 -04 -28
基金项目(Foundation item):国家自然科学基金资助项目(61773282) (Project(61773282) supported by the National Natural Science Foundation of China)
通信作者:吴爱国,教授,从事机械臂控制、制冷机节能控制、楼宇自动化等研究;E-mail:agwu@tju.edu.cn.