随着生活水平的提高和社会老龄化的加剧,脑卒中和神经损伤导致的运动障碍发病率也在逐年上升.传统康复治疗中由于时间和资源的限制,人工理疗方法无法提供足够的训练频率和强度[1].康复机器人的使用不受上述限制,可以帮助脑卒中患者更快地从损伤中恢复[2],且能在一定程度上帮助长期瘫痪的中风患者恢复主动控制身体的能力[3].与传统康复机器人采用的电机和液压驱动方式不同,气动肌肉驱动器由于其轻量和高功率体积比,具有很好的柔顺性[4].气动肌肉驱动的康复机器人可以安全地辅助患者进行康复训练.康复初期阶段患者下肢主动力缺失,根据临床建议,可由机器人牵引患肢进行重复的康复训练[5],以逐渐恢复其肌肉活动及运动能力[6].由于重复性特点,无模型自适应迭代学习控制(MFAILC)可应用于被动康复训练阶段[7],同时避免建立气动肌肉复杂的数学模型.为提高MFAILC的控制性能,控制律和参数设计得到了较多的研究.文献[8]结合径向基神经网络(RBFNN)学习系统动态线性化参数,得到了较快的收敛速度,但模型引入了过多的参数,提高了MFAILC的复杂度.文献[9]在控制律中引入高阶误差信号提高了算法的收敛速度,但控制性能依赖初始拟伪偏导选取.文献[10]将误差高阶形式应用到终端过程控制中,在特定场景下提高了算法的收敛速度,但较多的误差信号会降低算法的鲁棒性.文献[11]通过在MFAILC控制律中引入高阶控制信号并应用于轮式移动机器人的速度跟踪中,算法的收敛速度依赖于初始拟伪偏导的选取.文献[12]将高阶形式引入到MFAILC的拟伪偏导学习律中,提高算法对拟伪偏导的整定能力,但算法未对控制律进行修改.在重复轨迹跟踪控制中,学习算法的收敛速度是衡量其性能的重要指标.在MFAILC中,收敛速度依赖初始拟伪偏导的选择,较大的初始拟伪偏导会降低算法的收敛速度[13],而系统中的噪声也会影响算法的控制性能.本研究主要应用零化神经网络(noise-tolerant zeroing neural network)的误差递归式求解动态线性化方程,重新设计MFAILC控制律,提高了算法抗噪声能力,并结合改进的高阶拟伪偏导方法提高MFAILC的收敛速度.最后应用于气动肌肉驱动的脚踝康复机器人运动控制中,验证了本方法的实用性和有效性.1 问题描述与控制方法1.1 无模型自适应迭代学习控制考虑如下非线性非仿射离散单输入单输出系统,即yk(t+1)=f(yk(t),yk(t-1),…,yk(t-ny),uk(t),uk(t-1),…,uk(t-nu)), (1)式中:uk(t)和yk(t)分别为系统在t时刻和第k次迭代的输入和输出,t∈{0,1,…,T-1},其中T为重复轨迹的周期;nu和ny分别为系统输入和输出的阶数;f(⋅)为未知的非线性函数.在满足以下假设的前提下,建立系统(1)在迭代域下的等效数据模型.假设1 非线性系统函数f(⋅)对uk(t)的偏导存在且连续.假设2 系统(1)满足广义李普希茨条件,即对于所有的时刻t和迭代周期k,如果Δuk(t)≠0,那么系统(1)满足Δyk(t+1)≤bΔuk(t),(2)式中:Δyk(t+1)=yk(t+1)-yk-1(t+1);b为有界正数;Δuk(t)=uk(t)-uk-1(t).假设1可满足于大多数非线性系统[9].对于柔性脚踝康复机器人,式(1)对应气动肌肉驱动器,uk(t)为比例阀的控制信号,在实际控制中,采用冗余力分配方法保证了气动肌肉时刻处于拉伸状态,因此f(⋅)对uk(t)的偏导相当于单根气动肌肉形变的速度,形变的速度和范围是连续有界的.对于假设2,比例阀输入气压会使气动肌肉产生有界位移.根据以上假设,有如下定理[7].定理1 如果系统(1)满足假设1和假设2,并且对于所有的Δuk(t)≠0,那么存在一个函数ϕk(t),可以将系统(1)转换为如下的紧格式动态线性化(CFDL)模型,即Δyk(t+1)=ϕk(t)Δuk(t),(3)式中ϕk(t)为系统的拟伪偏导函数,满足ϕk(t)≤b.由于ϕk(t)未知,设计如下的准则函数估计ϕk(t)的值,即J(ϕ^k(t))=Δyk-1(t+1)-ϕ^k(t)Δuk-1(t)2+μϕ^k(t)-ϕ^k-1(t)2, (4)式中:μ为权重参数;ϕ^k(t)为ϕk(t)的估计值.式(4)的等号后第一项可以看作CFDL模型的估计误差,第二项为拟伪偏导的增量.使准则函数对ϕ^k(t)的偏导为0,求解拟伪偏导在迭代域更新的公式,即ϕ^k(t)=ϕ^k-1(t)+ηk,tΔuk-1(t)μ+Δuk-1(t)2∙(Δyk-1(t+1)-ϕ^k-1(t)Δuk-1(t)), (5)式中ηk,t为拟伪偏导更新律权重参数.为确保CFDL模型的正确性和补偿系统时变参数ϕ^k(t),使用如下的重置算法更新拟伪偏导的值,即ϕ^k(t)=ϕ^0(t)    (ϕ^k(t)≤ε或Δuk(t)≤ε),(6)式中ε为算法重置阈值.采用同样的方法定义控制信号的准则函数为J(uk(t))=yd(t+1)-yk(t+1)2+λuk(t)-uk-1(t)2, (7)式中:λ为权重参数;yd为期望轨迹.将式(3)代入式(7),并对准则函数求导使其为0,得到控制信号的更新公式为uk(t)=uk-1(t)+ρk,tϕk(t)λ+ϕk(t)2ek-1(t+1),(8)式中:ρk,t为控制器的步长参数;ek-1(t+1)为跟踪误差,有ek-1(t+1)=yd(t+1)-yk-1(t+1).式(8)是基于CFDL模型建立的控制律在迭代域的更新公式,其增益由系统拟伪偏导估计算法式(5)和式(6)自适应调整.1.2 改进型高阶拟伪偏导参数估计算法在实际控制过程中,由于缺少先验条件,MFAILC算法的收敛速度依赖于初始拟伪偏导的选取.本研究在CFDL模型基础上,对MFAILC的拟伪偏导估计方法进行改进,引入高阶的线性化模型误差整定初始拟伪偏导,增加误差项的增益来改进控制的收敛速度.迭代学习控制中高阶形式[14]为uk(t)=∑i=1luaiuk-i(t)+∑j=1lebjek-j(t),(9)式中:ai和bj为系数,且有∑i=1luai=1,∑j=1lebj=1;lu和le分别为控制信号和误差的阶数,利用固定窗口内的数据更新当前迭代控制输入uk(t).文献[9]在式(7)中引入高阶误差信号来提高算法的收敛速度,采用类似的方法改写拟伪偏导准则式(4),即J(ϕ^k(t))=Δyk-1(t+1)-ϕ^k-1(t)∙Δuk-1(t)-(ϕ^k-ϕ^k-1)Δuk-1(t)2+μϕ^k(t)-ϕ^k-1(t)2. (10)在式(10)等号后的第一项中引入高阶系统线性化模型估计误差,改写式(10)为J(ϕ^k(t))=Δyk-1(t+1)-ϕ^k-1(t)∙Δuk-1(t)-ϕ^k-∑i=1mαiϕ^k-iΔuk-1(t)2+μϕ^k(t)-ϕ^k-1(t)2. (11)通过式(11)对ϕ^k(t)求偏导为0得到改进高阶拟伪偏导的更新公式为ϕ^k(t)=ηk,t(μ-Δuk-12(t))ϕ^k-1(t)μ+Δuk-12(t)+Δuk-1(t)Δyk-1(t+1)μ+Δuk-12(t)+Δuk-12(t)∑i=1mαiϕ^k-i(t)μ+Δuk-12(t). (12)引入高阶模型估计误差可以解决控制性能对于初始拟伪偏导依赖的问题.改进后的拟伪偏导估计方法可以快速整定拟伪偏导参数,降低CFDL模型的估计误差.改进高阶拟伪偏导公式为:ϕ^k(t)=    ϕ^k-1(t)+ηk,tΔuk-1(t)μ+Δuk-1(t)2[Δyk-1⋅(t+1)-ϕ^k-1(t)Δuk-1(t)]    (2≤km);    ηk,t(μ-Δuk-12(t))ϕ^k-1(t)μ+Δuk-12(t)+Δuk-1(t)Δyk-1(t+1)+Δuk-12(t)∑i=1mαiϕ^k-i(t)μ+Δuk-12(t)(k≥m). (13)在式(13)中,设置第1次迭代ϕ^k(t)初始值ϕ^0(t),第m次迭代采用高阶估计,利用前m次系统线性化模型误差和拟伪偏导值,沿迭代轴对当前拟伪偏导进行更新,其中系数αi的选择同迭代学习控制中的遗忘因子,有α1≥α2≥…≥αm,∑i=1mαi=1.1.3 基于ZNN误差递归的控制律设计对于时变线性方程组A(t)x(t)=b(t),(14)式中:A(t)∈Rm×n为满秩矩阵;b(t)∈Rm为向量;x(t)∈Rn为未知向量.定义解的误差向量为e(t)=A(t)x(t)-b(t).(15)设计误差积分形NTZNN模型误差递归公式[15],即e˙(t)=-γe(t)-λ∫0te(δ)dδ (γ0, λ0).(16)将式(16)代入到式(15)中可以得到未知向量x(t)解的迭代计算公式.MFAILC控制律中将未知非线性系统式(1)利用系统观测数据建立等效的线性化方程式(3),因此可以采用NTZNN误差递归公式求解CFDL模型方程,并重新设计控制律.定义误差函数为ek(t+1)=yd(t+1)-yk(t+1)=yd(t+1)-yk-1(t+1)-ϕ^k(t)Δuk(t). (17)设e(t)=ek(t+1),A(t)=-ϕ^k(t),x(t)=Δuk(t),b(t)=yk-1(t+1)-yd(t+1),须要注意对于单输入单输出系统式(14)应改为标量形式.由于误差方程式(17)与式(15)具有相同的形式,文献[16]给出了其离散形式,即(1+h1)ek-ek-1+h2∑i=0kei=0.(18)将式(17)代入到式(18)得出控制律为uk+1(t)=uk(t)+1ϕ^k+1(t)∙h11+h1ek(t+1)+h21+h1∑i=0kei(t+1). (19)为了减小累积误差对学习律的影响,在式(19)的误差累积中设定固定长度为L的窗口更新当前控制信号,即uk+1(t)=uk(t)+huϕ^k+1(t)∙h11+h1ek(t+1)+h21+h1∑i=k-L+1kei(t+1), (20)式中hu0为控制率参数.基于NTZNN设计的控制律为式(20),拟伪偏导估计公式和重置算法分别为式(13)和式(6).2 实验及结果分析2.1 仿真实验为验证NT-HOPPD控制算法的抗噪声能力,并能快速整定初始拟伪偏导参数,提高控制的收敛速度,设计带有时变参数的非线性系统进行仿真实验,其中时变参数α(t)=0.1round(t/50)为非重复干扰(round为Matlab中的四舍五入函数),非线性系统函数用来近似气动肌肉驱动器的非线性特点,该系统的表达式为:y(t+1)=y(t)/(1+y2(t))+u3(t)    (0≤t≤50);    [y(t)y(t-1)y(t-2)u(t-1)∙(y(t-2)-1)+α(t)u(t)]/(1+y2(t-1)+y2(t-2))    (50t≤100). (21)期望轨迹为:yd(t+1)=0.5(-1)round(t/10)    (0≤t≤30);0.5sinπt10+0.3cosπt10    (30t≤70);0.5(-1)round(t/10)    (70t≤100). (22)对于NT-HOPPD设置拟伪偏导重置阈值εϕ=1,控制信号稳态阈值εu=0.01,拟伪偏导学习律式(13)步长η=0.6,权重μ=2;控制律参数h1=7,h2=0.1,hu=8;高阶参数α1=0.6,α2=α3=0.2.对于MFAILC[7]和HOPPD-MFAILC[12]设置同样的参数,重置阈值ε=0.01,控制律权重λ=1,步长ρ=1;拟伪偏导估计算法权重μ=2,步长η=0.6.HOPPD-MFAILC的高阶参数设置同NT-HOPPD.在初始拟伪偏导ϕ^0(t)={20,40}下分别进行无噪声和有噪环境下轨迹跟踪对比实验.图1为无噪声干扰下三种算法最大跟踪误差收敛曲线.在相同的初始拟伪偏导条件下,NT-HOPPD的最大跟踪误差最小,均在0.01以内.增大初始拟伪偏导,MFAILC的HOPPD的最大跟踪误差上升,而不会影响NT-HOPPD的控制性能.当ϕ^0(t)=40时,对比HOPPD和NT-HOPPD的跟踪轨迹,如图2所示,对于系统第10次迭代输出,NT-HOPPD只在[5,40]内存在偏差,而HOPPD在整个时间段上存在较大偏差;NT-HOPPD在第20次收敛,HOPPD则需要40次迭代.实验结果表明:NT-HOPPD在无噪声环境下的控制精度和收敛速度较MFAILC和HOPPD均有所提升.10.13245/j.hust.230509.F001图1无噪声下三种算法最大跟踪误差收敛曲线10.13245/j.hust.230509.F002图2ϕ^0(t)=40无噪声下轨迹跟踪对比为验证NT-HOPPD抗噪声性能,在仿真系统式(21)中添加均值为0、幅值在[-0.8,0.8]内的有色噪声重复实验,算法的误差收敛曲线和噪声曲线如图3所示.在噪声干扰下,NT-HOPPD具有最小的跟踪误差和收敛迭代次数,且初始拟伪偏导不会影响其控制性能.三种算法收敛所需迭代次数相较于无噪声环境均有所增加.系统存在噪声ϕ^0(t)=40下的跟踪轨迹如图4所示.NT-HOPPD的第10次迭代只在包含输入三次项的系统函数下存在跟踪偏差,实验结果表明:NT-HOPPD在噪声干扰下的性能要优于HOPDD,且对复杂时变系统具有一定鲁棒性.10.13245/j.hust.230509.F003图3白噪声下三种算法最大跟踪误差和噪声曲线10.13245/j.hust.230509.F004图4ϕ^0(t)=40有色噪声下轨迹跟踪对比2.2 柔性脚踝康复机器人控制实验为验证NT-HOPPD算法对实际机器人的控制性能,在柔性脚踝康复机器人平台上设计控制对比实验,如图5所示.实验中使用逆运动学将末端角度转换为驱动器位移长度,通过对比期望位移与实际位移验证控制算法对脚踝机器人的控制效果.设置NT-HOPPD的控制律参数h1=4,h2=0.1,hu=5,拟伪偏导估计权重μ=2,步长参数η=0.8,高阶参数为α1=0.7,α2=0.2,α3=0.1;HOPPD和MFAILC设置相同的参数,控制律权重λ=1,步长参数ρk,t=1,拟伪偏导估计律权重μ=2,步长参数ηk,t=0.6.HOPPD的高阶参数设置与NT-HOPPD相同,分别在初始拟伪偏导ϕ^0(t)={20,40}条件下进行实验.10.13245/j.hust.230509.F005图5柔性脚踝康复机器人实验平台三种算法的气动肌肉驱动器实际控制输出和期望位移跟踪曲线如图6所示,不同初始条件下算法平均误差如图7所示.由图6可知:在相同的初始拟伪偏导下,NT-HOPPD均以最少的迭代次数实现轨迹的精确跟踪.增大初始拟伪偏导,MFAILC和HOPPD在13次迭代内控制效果下降,NT-HOPPD在7次迭代内可以实现轨迹精准跟踪,收敛速度不受初始拟伪偏导的影响,相比HOPPD,其学习收敛速度更快.值得说明的是:实验中初始控制信号为u1=0,即第1次迭代的气动肌肉在未充气状态下,位移传感器测得位移不为0,即系统传感器存在标定误差.10.13245/j.hust.230509.F006图6初始拟伪偏导为20和40下MFAILC,HOPPD和NT-HOPPD的气动肌肉轨迹跟踪10.13245/j.hust.230509.F007图7不同初始拟伪偏导下三种算法的平均误差收敛曲线由图7可知:对比相同初始条件下的收敛速度,NT-HOPPD性能较HOPPD提高了50%,随着拟伪偏导增大,NT-HOPPD在5次迭代内收敛,收敛时的平均误差在0.01 cm以内,而HOPPD收敛时的平均误差为0.01 cm,表明NT-HOPPD能够实现脚踝康复机器人的精准位置控制.3 结语本研究基于柔性脚踝康复机器人控制需求重新设计了MFAILC控制方案,结合NTZNN误差递归改进了控制律的设计,提高了噪声环境下的控制性能;结合高阶拟伪偏导估计提高了算法的收敛速度.虽然控制方案不须要建立气动肌肉数学模型,但是实际应用中仍须要结合康复机器人逆运动学模型,将角度转换为驱动器的期望输出,再应用NT-HOPPD进行控制,实验结果也验证了该方法可以实现康复机器人的精准位置控制.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读