水下系缆机器人(ROV)作为水下作业的重要工具,不仅要求其具备上浮下潜、前进后退等基本功能,而且应具备在复杂环境下的定点悬停功能,如海底石油管道和线缆检测、大坝桥梁检修及深海探测等都要求ROV具有较好的定点悬停能力.由此可知ROV的定点悬停能力是衡量其性能的一项重要指标[1].然而,ROV模型具有很强的非线性,且由于制作装配时材料、零件等的位置不对称,导致机器人在水中受力不均,控制难度大[2-3],因此研究并实现ROV稳定悬停控制,具有重要意义.目前,国内外已有大量学者对ROV定点悬停控制进行了研究,并取得了一系列研究成果.文献[4]采用无味卡尔曼实时估计水下机器人的状态,并设计了非奇异终端滑模控制器.文献[5]结合滑模控制原理和径向基函数(RBF)神经网络逼近未知函数的方法,实现了近水面的悬停控制.文献[6]提出一种二阶滑模控制结合反向传播神经网络控制方案.文献[7]采用滑模控制,且利用模糊逻辑动态调节滑膜控制器的增益系数,实现了ROV悬停控制.尽管在ROV悬停控制的研究上国内外学者已取得大量成果,但是目前的研究方法大多都依赖准确的数学模型.反观实际情况,ROV的模型参数不确定且准确的模型获取困难,导致基于模型的控制算法存在一定的局限性.而基于数据驱动的无模型自适应控制(MFAC)无须建立物理模型,成功避免了控制器对模型的依赖,具有较好的鲁棒性、自适应性、结构简单等优点[8],能有效解决模型不确定问题,且在机械臂、无人车等[9-11]智能体上得到验证.传统的ROV控制系统主要采用时间触发机制,此时系统的控制律须周期性更新,增大了推进器的磨损,而事件触发机制可通过抑制控制律更新次数,以减小推进器磨损.所谓事件触发机制,即事先设定触发条件,当系统的输入或输出参数达到这一条件时,事件被触发,同时更新控制输出[12].文献[13-16]将事件触发机制应用在无人艇和水下机器人等智能体上,并通过仿真实验验证,与时间触发机制相比,事件触发更新的控制次数更少,磨损更低.进一步,传统的MFAC方法仅利用系统的在线I/O数据进行控制器设计,所以数据的准确与否将显著影响系统鲁棒性的优劣.为解决这一问题,可借用事件触发机制,为控制器设置死区,当系统输入变化较小时,系统输入停止更新,以降低测量扰动的影响.基于上述分析,本研究提出一种基于事件触发的无模型自适应控制方法.结合传统相对阈值和固定阈值的时间触发机制,设计了一种复合型相对阈值事件触发机制;将事件触发机制与无模型自适应控制相结合,用以处理模型不确定性和控制输出更新频率高等问题;借用事件触发机制为控制器设计死区,抑制测量扰动的影响,分析了整个控制系统的稳定性.1 ROV模型建立1.1 ROV船舶运动数学模型为便于描述ROV在三维状态下的运动状态,建立如图1所示的两种坐标系,分别为大地坐标系oo-xo-yo-zo和跟随坐标系o-x-y-z,图中:大地坐标系原点oo为空间中任意一点;ooxo指向正东方;ooyo指向正北方;oozo指向地心,且原点确定后位置保持不变.跟随坐标系则始终位于ROV上,并且随着ROV运动,其中:原点o位于ROV质心;ox,oy和oz分别指向ROV的正前方、正右方和正下方.ROV的各运动参数如表1所示.10.13245/j.hust.230140.F001图1三维坐标示意图10.13245/j.hust.230140.T001表1ROV运动参数及符号定义矢量名称力/力矩线/角速度位置纵荡τxux横荡τyvy垂荡τzwz横摇τkpφ纵摇τmqθ首摇τnrψROV的水下运动为六自由度空间运动,但考虑到ROV的质心与坐标系原点重合,质心与浮心所在的直线指向地心,故在低速情况下可将六自由度模型简化为四自由度,其平面坐标系如图2所示,图中:θc为水流的流向角;ϑ为跟随坐标系与大地坐标系的夹角.四自由度模型为10.13245/j.hust.230140.F002图2二维坐标示意图x˙0y˙0z˙0=Tx˙y˙z˙=Tuvw;(1)Mυ˙+Dυ=τ+τd,(2)式中:T为坐标转换矩阵,有T=cosϑ-sinϑ0sinϑcosϑ0001;(3)(x0,y0,z0)为大地坐标系下的位置;M和D分别为质量矩阵和阻尼矩阵,且有M=m-Xu˙0000m-Yv˙0000m-Zw˙0000Iz,(4)D=Xu+Xu|u|0000Yv+Yv|v|0000Zw+Zw|w|0000Nr+Nr|r|,(5)其中,m为ROV质量,其余均为水动力参数;υ=[u,v,w,r]为速度向量;υ˙=[u˙,v˙,w˙,r˙]为加速度向量;Iz为转动惯量;τ=[τx,τy,τz,τn]为控制力和力矩组成的向量;τd为环境干扰力和力矩组成的向量.1.2 环境干扰模型当ROV在水下航行时,不受风的作用,且受波浪的影响小,只须考虑水流的影响即可.一般来说,水流从时间上可以分为定常流和非定常流,从空间上可分为均匀流和非均匀流,本研究主要研究非定常均匀流下ROV的定点悬停能力.假设在大地坐标系下的水流流速为Vc,则流速相对于在随体坐标系下的速度分量为:uc=Vccos(θc-ϑ);vc=Vcsin(θc-ϑ). (6)在随体坐标系下,ROV的速度分量分别为u和v,则ROV相对于水流的速度为:ur=u-uc;vr=v-vc. (7)结合式(6)和式(7),求导后获得速度分量为:u˙r=u˙-ucr+V˙ccos(θc-ϑ);v˙r=v˙+vcr+V˙csin(θc-ϑ), (8)式中r为艏摇角速度.将静水中ROV运动方程中的速度参数转换为ROV与水流的相对运动参数,即可得到考虑水流影响的ROV运动方程.2 控制器设计2.1 无模型自适应控制针对形式未知的复杂非线性模型,无模型自适应控制算法采用伪偏导的思想,对闭环系统建立一个动态线性模型,通过控制动态模型实现对非线性系统的控制.目前,建立动态线性化模型的方法有三种,分别为紧格式动态线性化、偏格式动态线性化和全格式动态线性化.其中,全格式动态线性化同时考虑系统输入和输出的变化量,具有更多的可调自由度,且控制器设计灵活性更强[17],因此本研究选用全格式实现模型动态线性化.由文献[17]的结论可知:低阶的伪阶数能降低计算复杂度,但会导致偏导参数估计困难.而高阶伪阶数将增加计算复杂度,因此本研究设定伪阶数Ly=2,Lu=1,即控制输出线性化长度为2,系统输入线性化长度为1,考虑多输入多输出的ROV模型(2),无模型自适应控制器设计为: Φ^2,1(k)=Φ^2,1(k-1)+ηΔH2,1(k-1)μ+ΔH2,1(k-1)2⋅[ΔY(k)-ΔH2,1(k-1)Φ^2,1T(k-1)]; τ(k)=τ(k-1)+Φ^3T(k)ρ3e(k)λ+Φ^3(k)2-Φ^3T(k)Σi=12ρiΦ^i(k)ΔY(k-i+1)λ+Φ^3(k)2. (9)此时,有ΔYT(k+1)=Φ1(k)ΔYT(k)+Φ3(k)ΔτT(k)+Φ2(k)ΔYT(k-1), (10)式中:Y(k)=x(k),y(k),z(k),ψ(k)为系统输出,即ROV当前位置状态向量;ΔY(k)为输出变化向量;Δτ(k)为控制输出变化向量;e(k)=Y*(k)-Y(k)为跟踪误差向量;H2,1(k)=[ΔY(k-1),ΔY(k),Δτ(k)]T∈R12为系统输入和输出信号向量所组成的向量;Φ^2,1(k)=[Φ^1(k),Φ^2(k),Φ^3(k)]T∈R4×12为伪偏导参数的估计矩阵;Φ^i(k)∈R4×4;Rm×n为m×n阶矩阵;Rn为n维向量的实数集;η和ρi为步长因子;λ和μ为权重因子.2.2 事件触发机制为解决控制输出频繁更新导致推进器机械磨损的问题,针对ROV模型(2)设计事件触发机制,具体流程如图3所示.10.13245/j.hust.230140.F003图3事件触发控制系统框图首先,控制器由偏差e(k)和参数辨识模块获得的模型参数计算出控制输出τ(k).随后,事件触发机制根据传感器的测量信息Y(k)判断是否触发,当测量信号达到事件触发条件时,控制输出更新;当测量信号未达到触发条件时,控制输出将在零阶保持器的作用下保持上一触发时的控制输出,直到下次事件触发,控制输出更新,即τ(t)=τ(tk) (t∈[tk,tk+1)),(11)式中tk为事件触发的时间序列.最后,实际控制律作用于ROV模型(10),输出更新;同时,参数辨识模块根据系统实际输入τ⌣(k)和输出Y(k)估计出伪偏导参数.针对ROV悬停前后的不同运动状态,本研究设计了一种复合型相对阈值事件触发机制,当ROV跟踪误差较大时,系统输入和输出的变化率较大,为保证能减小触发次数,需要较大的阈值.而当跟踪误差较小时,系统输入及输出变化率较小,此时无须频繁更新控制律.结合上述两种情况,设计如下事件触发机制,即tk+1=min[α∈N*Y(k+α)-Y(k)≥e(k)/m+β]h+tk, (12)式中h为控制周期.注1 e(k)/m+β为触发阈值,当e(k)/m=0时,即为固定阈值的事件触发控制;当e(k)/m=0和β=0时,即为时间触发控制.对于上述事件触发机制,当存在测量扰动时,若包含扰动的测量数据未达到触发条件,则系统输入将保持不变,降低了测量扰动的影响.2.3 稳定性分析假设1 对于函数y(k+1)=f(y(k),y(k-1),⋯,y(k-d1),u(k),u(k-1),⋯,u(k-d2)), (13)其系统输入u(k)、输出y(k)和非线性函数f(⋅)偏导数都是连续的函数.假设2 系统(13)的表达式为广义利普希茨函数,必须满足条件Δy(k+1)bΔHLy,Lu(k),其中∀k和ΔHLy,Lu≠0.引理1[8] 在满足假设1和假设2的前提下,则一定存在时变参数ΦLy,Lu(k)b,能使非线性系统全格式动态线性化.定理 1 对于多输入多输出的ROV悬停控制系统(2),在满足假设1和假设2的条件下,控制律(9)和事件触发条件(12)下的闭环控制系统中的所有状态变量误差均半全局一致最终有界(SGUUB).证明 文献[18]已证明伪偏导参数Φ^Lu,Ly(k)的有界性,则一定存在不等式0Φ^3(k)λ+Φ^3(k)2≤Φ^3(k)2λΦ^3(k)=12λmin=q1≤0.5b, (14)式中λmin=maxb2,4bmax{1,b4}4ρ34.因此,存在常数M1,有M1=Φ3(k)Φ3(k)λ+Φ3(k)2≤Φ3(k)Φ3(k)2λΦ3(k)≤12.(15)定义矩阵A(k)=0I000I0Ψ1(k)Ψ2(k)∈R12×12,(16)式中:I为单位矩阵;Ψi(k)=-Φ^i(k)ρiΦ^3(k)λ+Φ^3(k)2(i=1,2,3). (17)结合式(10)的控制律,ΔH2,1(k)可改写为ΔH2,1(k)=[ΔY(k),ΔY(k-1),Δτ(k)]T=A(k)[0,ΔY(k),ΔY(k-1)]T+ρ3Φ^3(k)λ+Φ^3(k)2BeT(k). (18)定义矩阵B(k)=000Φ1(k)Φ2(k)Φ3(k)I00∈R12×12,(19)则存在[0,ΔY(k),ΔY(k-1)]T=B(k-1)ΔH2,1(k-1), (20)因此有ΔH2,1(k)=A(k)B(k-1)ΔH2,1(k-1)+ρ3Φ^3(k)λ+Φ^3(k)2BeT(k). (21)由跟踪误差e(k)=Y*(k)-Y(k),(22)可知e(k+1)=Y*(k+1)-Y(k)+Y(k)-Y(k+1)=e(k)-Φ2,1T(k)H2,1(k). (23)考虑事件触发机制,在事件触发之前有y⌣(k)=y(tk) (t∈[tk,tk+1)),(24)式中y⌣(k)表示在事件触发之前控制器保留上一个更新的事件触发数据.假设事件触发误差为e0(k)=Y⌣(k)-Y(k),则事件触发误差满足e0(k)e(k)/m+β.(25)控制输出中的跟踪误差为e⌣(k)=Y*(k)-Y⌣(k)=Y*(k)-Y(k)+Y(k)-Y⌣(k)=e(k)-e0(k). (26)取范数e⌣(k)=e(k)-e0(k)≤(1+1/m)e(k)+β. (27)结合式(21)、式(23)和式(26),有e(k+1)=I-ρ3Φ3(k)Φ3(k)λ+Φ3(k)e(k)+ρ3Φ3(k)Φ3(k)λ+Φ3(k)e0(k)-Φ2,1T(k)C(k)⋅ΔH2,1(k-1). (28)取范数,由相容性原理可知e(k+1)≤I-ρ3Φ3(k)Φ^3(k)λ+Φ^3(k)v⋅e(k)+ρ3Φ3(k)Φ^3(k)λ+Φ^3(k)ve0(k)+Φ2,1(k)vC(k)vΔH2,1(k-1), (29)式中:⋅v为诱导范数;C(k)=A(k)B(k-1).(30)由相容性原理可将式(30)改写为C(k)v≤A(k)vB(k-1)v.由文献[20]中的结论可知,一定存在M2使如下不等式成立,即z3maxi=1,2,3ρiM21,(31)式中z为矩阵A(k)的特征值,其诱导范数满足A(k)vS(A)+ε.根据引理1,对于B(k)而言,考虑Φ2,1(k)的有界性,其上限为b,则S(B(k))≤Φ2,1(k)≤b,因此存在B(k)vS(B(k))+εb+ε.此时C(k)v(b+ε),因为ε为任意小的正常数,所以C(k)v=d2=maxi=2,3ρiM2bb.根据上述结论,不等式(29)可改写为e(k+1)≤d3e(k)+M1β+d2Φ2,1(k)ΔH2,1(k-1), (32)式中d3=1-M1+M1/m.令m1,则有1/2d31.因此,式(32)可改写为e(k+1)d3k-1e(2)+∑i=1k-1dd3i-1M1β+d2d4∑i=1k-1dd3k-i-1∑i=1id2i-je⌣(j)+(d3k-2+d3k-3d2+⋯+d2k)d2ΔH2,1(0)=g(k+1)+∑i=1k-1dd3i-1M1β,式中d4=ρ3M1Φ2,1T(k)vρ3b/2.则g(k+2)=d3g(k+1)+d2d4∑j=1k-1d2k-je⌣(j)+d2d4e⌣(k)+d2kbΔH2,1(0)d3g(k+1)+d2d4⋅∑j=1k-1d2k-je⌣(j)+d2d4m+1m(g(k)+∑i=1k-2dd3i-1M1β+β+d2kbΔH2,1(0).定义函数h(k)=d2d4∑j=1k-1d2k-je⌣(j)+d2kbΔH2,1(0)+d2d4m+1m(g(k)+∑i=1k-2dd3i-1M1β+β,已知调整ρ3参数可保证d41/2d3,故h(k)d2d3∑j=1k-1d2k-je⌣(j)+d2kbΔH2,1(0)+d2d3m+1m(g(k)+∑i=1k-2dd3i-1M1β+βd2d31+m+1m⋅∑i=1k-2dd3i-1M1β+d3m+1mg(k+1).因此g(k+2)d3+m+1md2g(k+1)+d2d3β+m+1m∑i=1k-2dd3i-1M1β.调整参数ρ2和ρ3可保证limk→∞e(k)limk→∞g(k)+M1β1-d3d2d3β+m+1mM1β1-d31-d3-m+1md2+M1β1-d3.因此系统误差一致且有界.定义事件触发时间差为Δtk,则由式(12)可知Δtk+1=tk+1-tk≥h.两次触发的时间间隔不小于采样周期h,故芝诺行为不可能发生.3 仿真结果及分析为验证本研究提出方法的有效性,对其进行定点悬停仿真,并与比例积分微分控制(PID)算法[19]及全格式无模型自适应控制算法[17]进行仿真对比实验,本次控制对象为开架式观测型ROV,其水动力及尺寸等参数见文献[19].为验证所提出的方法的性能,采用连续悬停定位仿真,悬停位置为:Y1=[6,7,2,π/4];Y2=[4,3,3,π/8];Y3=[5,4,1,π/4];Y4=[4,2,4,3π/8].每两个悬停位置之间时间间隔为500 s.本研究主要研究非定常均匀流下的悬停定位,t=0~700 s间的水流流速为Vc=0.5m/s,t=700~900 s间的水流流速缓慢变化,速度为Vc=0.5-0.002(t-700),t=900~2 000 s间的水流流速保持Vc=0.1 m/s,整个过程中流向角为θ=π/4,且保持不变.控制周期为0.1 s.本研究采用高斯白噪声作为仿真测量噪声.传统增量式PID控制器比例、积分和微分项仿真参数Kp,Ki和Kd分别为:Kp=1.00.00.00.00.00.80.00.00.00.01.00.00.00.00.00.2;Kd=110000160000500003;Ki=0.050.000.000.000.000.010.000.000.000.000.050.000.000.000.000.02.在无模型自适应控制器中,控制参数为:η=0.2,μ=0.4,λ=0.3,ρ1=75,ρ2=0.15,ρ3=0.03.无模型自适应事件触发控制器控制参数与无模型自适应控制参数一致,事件触发机制参数为:m=50,β=0.001.图4为ROV四自由度的悬停定位图,定义北向位置、东向位置、深度位置及转艏角分别为N,E,D和W.由图4可知:在三种控制器的作用下,ROV悬停控制系统的跟踪误差均能收敛,但事件触发MFAC和传统的MFAC控制方法下的误差收敛速度更快.另外,在时变环境干扰下,即t=700~900 s间,PID控制下的跟踪误差更大,而事件触发MFAC和传统的MFAC控制方法下的跟踪误差较小,由此可知:事件触发MFAC和传统的MFAC控制方法具有一定的自适应性能.另一方面,由图4可知:在存在测量误差的情况下,本研究提出的基于事件触发的MFAC控制方法下的控制输出较为平缓,而传统的MFAC受测量扰动的影响而发生抖动.因此,借用事件触发机制设计控制器死区能有效抑制测量扰动对控制系统的影响.10.13245/j.hust.230140.F004图4ROV悬停定位图图5为事件触发的控制输出时间间隔图,图中Δtk为第k个触发时刻的触发时间间隔.图5(a)描述的是当m=50,β=0.001时触发的时间间隔.结合图4可知:在系统收敛前后,事件触发机制均有效地运行.与图5(b)相比,当跟踪误差较小时,其事件触发效果接近,表现出相似的触发效果.但是当跟踪误差较大时,图5(b)中的触发机制失效,如图所示,期望位置改变时图中触发时间出现凹陷.与图5(c)相比,当跟踪误差较大时,图5(a)中的触发时间间隔接近,具有相同的触发效果.但当跟踪误差较小时,图5(a)中的触发时间间隔更大,效果更好.结合参数可知:当m=∞,β=0.001时,为固定阈值的事件触发机制,由图4可知跟踪误差与位置变化速率呈正相关.因此,当跟踪误差较大时,位置变化大,导致每个控制周期的事件均被触发.而当m=50,β=0时,阈值只与跟踪误差有关,误差越大,位置变化率越大,阈值同样越大,保证了当跟踪误差较大时事件触发的有效性,当跟踪误差小时,控制律变化率较小,无须频繁更新控制律,但该参数下的更新频率依旧较高.参数m=50,β=0.001结合了上述两种参数的优点,既能保证当跟踪误差较大时事件触发机制的有效性,又能保证当跟踪误差较小时事件触发时间间隔足够大.10.13245/j.hust.230140.F005图5控制输出时间间隔图具体的触发次数如表2所示,触发率ητ=nτ/n,其中:nτ为控制律更新次数;n为采样次数.由表2可知:当m=50,β=0.001时,触发的次数最少,表明该参数下事件触发效果更好.10.13245/j.hust.230140.T002表2不同参数下的控制触发次数表参数nτητ/%m=50,β=08 98344.915m=∞,β=0.0015 29526.475m=50,β=0.0014 40222.01结合图5(a)和表2可知:在存在测量扰动的情况下,PID和MFAC控制下的系统控制输出变化剧烈且频繁,而基于事件触发的MFAC方法下的控制输出更新次数较小,减小了因不必要的控制律更新导致的推进器机械磨损.综上,本研究提出的事件触发的无模型自适应控制在保证其良好的自适应能力的前提下,借助事件触发机制设置死区,既抑制了测量扰动对无模型控制系统的影响,又降低了控制更新次数,从而减小了推进器的机械磨损.4 结语本研究采用无模型自适应控制算法,对非定常均匀流下的ROV定点悬停控制问题进行了研究,解决了模型不确定问题,同时控制器具有一定的自适应性.进一步,考虑无模型自适应控制方法易受测量扰动的影响,借助事件触发机制设置死区,抑制了测量扰动对系统的干扰,降低了ROV悬停时控制律更新的次数.并证明了悬停系统稳定性,同时验证了闭环系统状态变量误差一致并有界.仿真实验验证了所提出的方法的有效性.
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读