当抽水蓄能机组运行在恶劣的环境中且启停变化频繁时,机组部件会逐渐产生疲劳损伤和结构劣化.随着疲劳程度的累计,机组的健康性能下降[1-2].准确的健康性能趋势预测可及时发现机组异常运行状态,有效降低故障率和运维成本.趋势预测的基础是健康性能指标(health performance index,HPI)的提取[3].Guo等[4]基于振动监测数据构建一维HPI预测轴承的剩余使用寿命.Hu等通过提取上机架的HPI实现水电机组劣化趋势预测[5].然而,上述健康指标主要由单个传感器数据或单个对象构建,无法全面评估整个设备的退化情况.因此,应研究利用多个对象的多维监测数据构建综合健康性能指标.区间预测可给出序列未来可能变化的范围,进而提供较多的不确定性信息,便于风险评估和决策分析.张亚超等[6]提出一种改进的风速区间预测模型单目标函数,并采用优化算法寻求最佳权重因子.然而,单目标区间预测模型中的权重系数难以较好地兼顾多个目标约束.Li等[7]提出以预测区间覆盖率(prediction interval coverage probability,PICP)和区间平均宽度(prediction interval normalized average width,PINAW)为目标约束的多目标风速预测模型.在多目标区间预测中,构建合适的目标约束是获取可靠且准确区间预测结果的关键.为获取机组健康性能的可能波动范围,本研究提出一种基于信息融合与多目标智能优化的区间预测模型.首先,为有效描述机组的运行特性,建立基于高斯过程回归(Gaussian process regression,GPR)的机组健康状态模型.引入熵权理论对机组不同部件的健康信息进行融合,构建可表征机组整体性能水平的综合健康指标(integrated health index,IHI).进一步,以PICP和PINAW为目标约束,提出基于多目标粒子群优化(multi-objective particle swarm optimization,MOPSO)和极限学习机(kernel extreme learning machine,KELM)模型参数的全局寻优策略,获取机组设备健康性能的波动范围.1 基于熵权的综合健康性能指标构建为有效量化机组健康水平,通过对具有不同监测点的抽水蓄能机组各部件构建相应的HPI,利用熵权法将多个部件HPI进行信息融合获得IHI指标,较好地保留不同部件的HPI指标中的关键信息.1.1 部件健康性能指标构建1.1.1 标准健康状态建模对机组不同运行工况下历史监测数据进行综合分析,构建基于高斯过程回归(GPR)的标准健康模型.该建模方法可有效利用历史监测数据准确描述机组的运行状态,获得机组运行参数数据与状态监测数据之间的映射关系.GPR通过高斯先验知识对时间序列建模,在处理复杂的拟合问题中具有较强的泛化能力和适应性[8].对于输入数据X={xi∈Rm},i=1,2,⋯,n,n为观测数据的个数;观测数据为y={yi∈R},含有高斯白噪声的回归问题可表示为y=f(X)+ξ;(1)f(X)=XTw,(2)式中:f(X)为目标函数;ξ为噪声;w为权重.依据贝叶斯规则可得观测值与预测值的联合先验分布为yy*=N0,K(X,X)+σn2IK(X,x*)K(x*,X)k(x*,x*),(3)式中:N为高斯分布函数;σn2为预测值序列的协方差;I为单位矩阵;K(X,x*)为X与新输入测试点x*间的协方差矩阵;k(x*,x*)为x*自身的协方差;y*为预测值.预测值y*的后验分布可表示为y¯*=K(x*,X)(K(X,X)+σn2I)-1y,(4)式中y¯*为预测值y*的均值.由于抽水蓄能机组的运行受水力-机械-电磁因素的影响较大,因此选择工作水头(H)、有功功率(P)、导叶开度(G)和振动摆度(F)分别作为GPR模型的输入和输出,构建机组标准健康状态模型F=f(H,P,G).(5)1.1.2 机组健康性能指标构建机组在运行数年后,部件的性能水平降低,导致机组实际振动V与工作水头、有功功率、导叶开度之间的非线性映射关系发生偏离.因此,利用健康状态模型和在线监测数据构建机组部件的HPI.将(H,P,G)数据代入健康状态模型中,计算当前工况下机组设备状态监测数据的理论值F,定义健康性能指标J=(| F-V |/F)×100%,(6).1.2 综合健康指标构建在熵权理论(entropy weight,EW)中,信息熵值E与其混乱程度密切相关.EW可充分利用各部件HPI序列中所蕴含的关键信息,避免人为选取指标序列的主观性.基于熵权法的综合健康指标(IHI)的计算步骤如下.步骤1 构建原始HPI指标序列矩阵Z并归一化.步骤2 计算各指标序列的熵值E及相应的权重Wi=1-Eik-∑Ei(i=1,2,⋯,k), ∑jnWj=1,(7)式中k为HPI指标序的个数.步骤3 根据各HPI序列的权重获取综合健康指标IHI序列M=WZ,(8)式中Z为由多个HPI指标序列构建的矩阵.2 健康性能区间预测的多目标优化获取的机组健康性能指标IHI序列具有较强的非线性,须利用拟合性能较好的KELM对健康性能区间进行预测,并通过多目标粒子群算法优化KELM参数,以提升模型的预测性能.2.1 核极限学习机KELM利用稳定核矩阵映射代替ELM中的随机映射[8-9],将输入样本从低维空间映射到高维隐藏层空间中ΩELM=h(xi)h(xj)=H(Xi,Xj),(9)式中:xi和xj分别为低维空间的输入样本,Xi和Xj分别为映射至高维空间后的样本值;H(∙)为核函数.选取RBF核函数,则KELM的输出为              f(x)=[H(x,x1),H(x,x2),⋯,H(x,xN)]∙(I/C+ΩELM)-1T,(10)式中:C为正则化系数;I为单位矩阵,T为期望输出.2.2 多目标粒子群优化算法粒子群优化算法通过个体极值Ob和全局极值Qb更新自身的速度和位置信息[10]vij=wνijk+(Obijk-xijk)c1r1+(Qbijk-xijk)c2r2; (11)xijk+1=vijk+1+xijk,(12)式中:w为惯性权重;c1和c2为学习因子和社会因子;r1和r2为[0,1]之间的随机数.多目标粒子群优化算法(MOPSO)引入Pareto解集的概念来更新个体最优位置.此外,MOPSO算法增加了外部种群,用于保存每一次迭代后种群中所有具有支配地位的精英个体.3 预测区间的构建与预测结果评价通过构造预测区间的上限和下限,以预测区间的准确性和可靠性为约束目标,预测IHI序列可能波动的范围,同时利用评价指标对区间预测结果进行评估.通过区间宽度控制系数构造可变的预测区间(prediction interval,PI),对于给定的IHI序列Y={y1,y2,⋯,yN},PI的上界和下界可表示为:Yu=Y(1+αu);Yl=Y(1-αl), (13)式中αu和αl为区间宽度控制系数.将预测区间覆盖率(PICP,β)和区间平均宽度(PINAW,d)作为模型的优化目标[11]β=1n∑i=1nρi;     ρi=1   (yi∈[Yil,Yiu]),0   (yi∉[Yil,Yiu]); (14)d=1nR∑i=1nYiu-Yil,(15)式中:n为预测样本个数;ρi为布尔量;Yil和Yiu分别表示第i个预测值的上界和下界;R为预测目标值的范围.进行区间预测时,最理想的情况是预测结果的可靠性较强且准确性较高,即预测区间PICP最大且PINAW值最小.然而,这两个目标却是相互对立的.为较好地兼顾预测结果的可靠性与准确性,以PICP和PINAW为多目标优化准则,用MOPSO算法对区间预测模型参数进行寻优,即:minα=1-β;mind. (16)区间覆盖率-宽度(coverage width-based criterion,CWC)为S=d{1+γexp[-η(β-μ)]}; (17)γ=0(β≥μ),1(βμ), (18)式中:μ为置信水平,值为0.95;η为惩罚系数;γ控制核函数的宽度.4 机组健康性能区间预测模型4.1 区间预测多目标优化策略为使预测区间覆盖率高、平均宽度小,利用MOPSO算法对KELM的正则化系数C、核函数参数γ及区间宽度控制系数αu和αl进行寻优,优化策略如图1所示,图中:Cu和γu为上界预测模型中待优化的KELM参数;Cl和γl为下界预测模型待优化的KELM参数.10.13245/j.hust.238803.F001图1区间预测多目标优化策略对于获取的IHI序列,首先通过αu和αl构造初始上边界和下边界,然后分别对上、下边界构建KELM预测模型得到上下边界预测值,以PICP和PINAW为MOPSO的优化目标,更新粒子的速度、位置和全局最优,迭代后得到最优参数.该模型的预测步长为单步,即依据当前的IHI序列预测下一个时间步长的IHI值.4.2 区间预测模型基于信息融合与多目标优化的区间预测模型的步骤如下.步骤1 构建标准健康状态模型.选择工作水头、有功功率、导叶开度和振动摆度分别作为GPR模型的输入和输出,建立标准健康状态模型.步骤2 提取综合健康性能指标IHI.依据式(6)获得机组不同部件的HPI序列,结合熵权法对各部件HPI序列进行信息融合得到综合健康性能指标IHI序列.步骤3 构建多目标区间预测模型.以PICP和PINAW为目标约束,利用MOPSO对区间宽度控制系数和KELM模型参数进行寻优.步骤4 健康性能区间预测与评价.根据寻优得到的最佳模型参数预测得到序列的区间,并对模型的预测性能进行评价.5 实例分析5.1 数据获取采用国内某抽水蓄能电站机组不同测点的监测数据验证所提区间预测方法的有效性.获取机组的工作水头、有功功率、导叶开度、下导x方向摆度、下导y方向摆度、下机架x方向振动、下机架y方向振动.机组运行工况的频繁转换,各测点的振动与摆度变化极其复杂,难以准确分析机组下机架实际的健康水平.5.2 综合健康性能指标构建利用机组运行初期2008年7月31日—2009年12月25日间性能状态良好时的状态监测数据分别构建基于GPR的标准健康状态模型.下导x方向摆度、下导y方向摆度和下机架x方向振动和下机架y方向振动的拟合结果的相关系数分别为0.971 4,0.971 6,0.963 4和0.953 9,表明该模型可有效获取机组运行参数与振动摆度之间的映射关系.选取2010年1月2日—2011年12月15日机组监测数据代入相应的健康状态模型中,获得不同部件的摆度HPI序列(F1x,F1y,F2x,F2y),如图2~5所示.可知:各HPI序列波动情况不同,表明振动与摆度对机组健康性能的反映各不相同,但随机组运行时间的累计,各HPI序列总体趋势呈波动上升,表明机组健康水平随时间推移开始下降.10.13245/j.hust.238803.F002图2下导x方向摆度HPI序列10.13245/j.hust.238803.F003图3下导y方向摆度HPI序列10.13245/j.hust.238803.F004图4下机架x方向振动HPI序列10.13245/j.hust.238803.F005图5下机架y方向振动HPI序列为降低不同HPI序列的不规则波动对机组健康水平表征的影响,采用熵权法计算各HPI序列的信息熵值及其权重,如表1所示,并依据式(8)计算得到IHI序列,该序列可较大程度地保留原始HPI序列中的关键信息.10.13245/j.hust.238803.T001表1各HPI序列的信息熵值及其权重参数下导下机架x方向摆度y方向摆度x方向振动y方向振动信息熵值0.955 50.968 60.985 70.976 8权重0.391 50.276 80.126 00.204 75.3 机组健康性能区间预测在将IHI序列送入预测模型之前,采用自相关系数(ACF)对模型的输入数据进行自相关分析[12].当时滞为12时,ACF值在95%置信线下,前11个IHI序列值对预测其未来趋势的贡献最大,因此确定模型的输入长度为11.利用MOPSO算法对区间宽度控制系数和KELM模型的参数进行寻优.寻优范围分别为:α∈(0,0.2),C∈[1,100] ,γ∈[1,100].MOPSO算法中最大迭代次数为100,粒子数为80,外部种群的容量为50.MOPSO算法以PICP和PINAW为约束获取Pareto最优解集,采用满意度评价方法从Pareto前沿中确定最佳折衷解[13],进而获得相应的参数(α,C和γ)最佳值,将具有最佳性能的预测模型用于健康性能区间预测中.图6为MOPSO-KELM(MK)模型的预测结果.预测区间基本能覆盖原始IHI序列,预测结果能以较窄的区间追踪IHI序列的变化,说明该模型能在保证预测区间可靠性的同时准确预测IHI趋势的波动变化.10.13245/j.hust.238803.F006图6基于MOPSO-KELM(MK)模型预测结果5.4 对比模型预测结果分析为对比所提模型区间预测的效果,进行了不同预测模型的对比实验.各预测模型的量化评价指标如表2所示,t为训练时间.10.13245/j.hust.238803.T002表2不同预测模型量化评价指标预测模型βdSt/sPSO-KELM(PK)0.8980.1170.23646.48NSGA-II-KELM(NIIK)0.9510.0920.09256.53MOPSO-KELM(MK)0.9590.0870.08758.79在单目标优化模型中,模型的参数通过粒子群优化算法(PSO)进行寻优,以CWC为目标函数,惩罚系数为0.2.图7所示为PK模型的预测结果.结合表2进行对比分析可知:PK模型预测结果的PINAW值相对较小,但其PICP值为0.898,存在较多的IHI序列点落在预测区间外的现象,预测结果的准确度稍差.多目标算法的训练时间较长,主要是由于多目标优化模型须考虑PICP和PINAW两个约束,计算成本较高.10.13245/j.hust.238803.F007图7PK模型预测结果采用NSGA-II对模型参数进行寻优[14],NIIK模型预测结果如图8所示.与单目标优化模型相比,不同的多目标优化模型均能较好地预测IHI序列未来的波动情况,如序列上升、下降等变化,区间宽度相对较窄.与NIIK模型相比,MK模型的PICP值与PINAW值均相对较小,说明MOPSO的寻优性能较好,可提高模型的准确率和精度.10.13245/j.hust.238803.F008图8NIIK模型预测结果6 结语引入熵权理论融合不同部件健康指标中蕴含的关键信息,获取可表征整体健康水平的IHI;提出基于MOPSO的预测模型最佳参数全局优化策略,构建基于多目标优化的健康性能区间预测模型.通过抽水蓄能机组监测数据对所提模型进行实例验证,结果表明:所提模型能通过多目标算法推求具有不确定性的区间,可较好地兼顾区间预测的可靠性和准确性.然而,利用多目标优化算法获取区间预测结果增加了模型的计算成本.在未来的研究中,将对预测模型进行改进,以提升模型的预测效率.此外,将对下机架多测点、多维度的监测数据如下导轴承、上导轴承的温度、位移、油温及顶盖振动等进行分析,构建更加全面、准确的健康性能指标因子,以期充分反映下机架的健康性能.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读