间歇过程具有附加值高、生产批量小、满足个性化需求等优点,被广泛用于半导体、制药、注塑等生产中,是现代制造业的一种重要生产模式.当前,生产过程规模日趋大型化、一体化及复杂程度不断提高,故障发生几率也不断增大,隐含巨大的安全风险.对工业设备的运行状态实时监控,保证及时、准确地检测系统故障具有重要的意义[1-3].传统基于多元统计的故障检测方法如多向典型变量分析(multiway canonical variate analysis,MCVA)[4]、多向偏最小二乘(multiway partial least squares,MPLS)[5]等,可直接利用获得的过程数据直接建模,无需精确的机理模型和丰富的经验知识,在间歇过程故障检测中取得较大的发展.多元统计的方法更多关注全局结构,而流形学习在降维过程中作为更加关注局部流行结构的方法得到广泛关注,如非线性全局降维的等度规映射(isometric mapping,ISOMAP)[6]、基于谱图理论的拉普拉斯特征映射(Laplacian eigenmaps,LE)[7]及线性局部降维的局部线性嵌入(locally linear embedding,LLE)[8].LLE算法重构误差时保持数据局部邻域的几何性质,重构的权值使得样本点的线性重构误差达到最小.文献[9]提出了邻域保持嵌入(neighborhood preserving embedded,NPE)算法,它比LLE算法能更加精确地得到映射矩阵,实用性更好,在数据可视化、图像处理、信息检索及模式分类等领域得到了大量的应用[10-13],近年来也被应用到故障检测领域[14-16]中.NPE算法进行故障检测时没有考虑数据的时序相关性,实际间歇过程存在的动态特性不满足传统方法独立采样的假设,检测效果不佳.文献[17]通过建立时间序列的增广矩阵,考虑过程数据之间的时序自相关特性的同时消除动态特性对故障检测造成的影响,但增广后的数据矩阵维度增高、数据量更大,导致算法的计算效率降低;文献[18]采用滑动窗的方式将原始矩阵扩展成动态矩阵,可以较好地表征时间序列的自相关特性,但检测效果易受到选取窗口宽度的影响;文献[19]利用时序扩展NPE算法建立基于空间和时间结构的信息提取策略,通过对时间序列数据特性的学习,获取数据随时间变化的动态相关性,但检测性能易受所选近邻点个数的影响.间歇过程存在动态特性的同时也具有多模态特性,多模态同样也是导致故障检测效果不利的重要因素.文献[20]将原始数据空间划分为模态空间和残差空间,并建立贝叶斯监控策略来监测多模态过程;文献[21]通过聚类的方式利用隶属度变化划分间歇过程的模态,针对不同模态实现过程测量数据异常检测;这类方式对模态划分的精度要求高,一般需要先验知识,划分结果影响故障检测的效果.文献[22]采用K近邻的方法通过统计局部近邻距离信息有效降低多模态中心的影响,当模态方差太大时检测性能降低;文献[23]采用局部近邻标准化(local neighborhood standardization,LNS)策略,有效解决了传统标准化方法无法处理数据多模态特性的问题,但当故障数据的邻域属于多模态时,故障数据的邻域标准差可能会被放大,导致故障样本与正常样本混叠,降低检测率.针对上述问题,本研究提出了一种基于加权双近邻标准化(WDNS)的稀疏加权邻域保持嵌入(SWNPE)的故障检测方法.该方法通过寻找样本的双层近邻进行加权构造加权双近邻集标准化样本,将多模数据转化为近似的单模数据,且近似单模数据服从高斯分布,消除数据多模态特性;在计算最优局部稀疏表示的基础上采用反距离加权的方式求取增强的局部稀疏结构,有效消除数据的动态特性影响,同时增强模型对异常点的鲁棒性,通过构建T2和平方预测误差(SquaredPredictionError,SPE)统计量进行故障检测.1 基于WDNS-SWNPE故障检测1.1 加权双近邻标准化采用局部近邻标准化(local neighborhood standardization,LNS)方法进行标准化,当故障数据的邻域属于多模式时,故障数据的邻域标准差可能会被夸大,此时经过LNS标准化后的数据接近于0,与正常样本数据归为一类,当k的个数大于任意子模式训练数据集的个数时,LNS方法得到的结果并不令人满意.在文献[24]的基础上提出一种加权双近邻标准化(WDNS)策略.当对样本进行标准化时,为了避免近邻样本点来自于不同模态,对每个样本的近邻样本集中的样本求取近邻集,并对结果作加权平均化处理,在消除统计波动的同时,通过权值大小来凸显训练数据在数据标准化过程中作用效果的不同,权值越大,作用效果越显著.具体步骤如下.首先寻找样本xi的前k个近邻样本,按照升序排列构成近邻样本集N(xi);然后对N(xi)中的每个样本寻找前l个近邻构成新的近邻集N(xfi);最后,求取N(xfi)的平均值和标准差,对xi进行WDNS标准化,即xi*=1k∑f=1kwfxi-m(N(xf(i)))s(N(xf(i))),(1)式中:xi*为标准化后的样本;m(N(xf(i)))和s(N(xf(i)))为近邻样本集的平均值和标准差;wf为权重函数,wf=exp(-d(xfi,xi)2/θ2)∑f=1kexp(-d(xfi,xi)2/θ2),(2)其中,d(xfi,xi)为两个样本之间的欧氏距离,θ为调谐参数,其值为所有样本间欧式距离的平均值.权重系数满足约束条件∑f=1kwf=1.1.2 稀疏加权邻域保持嵌入传统NPE算法在数据降维过程中,易受噪声和离群点的干扰,且在保持局部流形结构过程中忽略不同邻域元素的距离特性对表征局部结构重要性不同的影响.引入稀疏加权思想[25-26],提出一种基于SWNPE的故障检测算法,充分考虑邻域内距离大小、噪声的影响以及离群点的干扰,更好地提取局部结构.局部稀疏表示为minsi∑i=1m||xi-XN(xi)si||22+λ∑i=1m|| si||1,(3)式中:XN(xi)为样本xi的前k个近邻集合;si为稀疏重构系数;λ为平衡稀疏性的正则化参数,由谱半径确定[27].为了更好地提取局部结构,采用反距离加权方式进一步优化局部稀疏系数,加权后的稀疏表示为minsi∑i=1m||xi-XN(xi)si||22+λ∑i=1m|| disi||1,(4)式中di为样本xi与近邻点之间的权重向量,di=hi-p/∑j=1khj-p,(5)其中,hi为样本与近邻之间的距离;p为反距离的幂指数值,是正整数,通常为0.5~3时可以获得更合理的结果,参考文献[28]取值2.式(4)进一步可以改写为minS||X-X·S||22+λ||D·S||1,(6)式中:X为原始数据矩阵;S为局部稀疏矩阵;D为样本间权重矩阵.利用凸优化工具箱CVX求解出式(6)中最优化的局部稀疏矩阵S,将稀疏矩阵引入可得SWNPE目标函数为ΦS=min||∑i=1nATxi-AT∑j=1nsijxj||2,(7)式中:A为降维映射矩阵;sij为两样本间的稀疏系数.通过加权稀疏改进的NPE算法在降维过程中不仅更好地保持局部流形结构,而且对离群点和噪声干扰具有较强的鲁棒性.进一步可将式(7)转化为Φs =min[ATX(I-S)T(I-S)XTA]=min(ATXM⌢XTA), (8)式中M⌢=(I-S)T(I-S),约束条件为ATXM⌢XTA=I.引入拉格朗日乘子法,将式(8)的求解问题转化为XM⌢XTα=λXXTα,(9)式中:α为特征向量;最小的d个特征值对应的特征向量(α1,α2,⋯,αd)构成映射矩阵A.1.3 故障检测指标经过SWNPE降维后所得映射矩阵A,并将原始空间划分为特征空间和残差空间,则原始数据X和降维后数据Y之间存在如下关系X=X̂+X˜=BY+E;Y=ATX=(BTB)-1BTX, (10)式中:X̂为特征空间;X˜为残差空间;E为残差矩阵;B为转换矩阵,满足AT=(BTB)-1BT;(BTB)-1BT为变换矩阵.对于新测量的数据xnew满足如下关系xnew=x̂new+x˜new= BATxnew+(xnew-BATxnew), (11)式中:x̂new为新测量数据的特征空间;x˜new为新测量数据的残差空间.在特征空间和残差空间构建T2和SPE统计量(PSPE),为T2=ynewΛ-1ynewT;(12)PSPE=||xnew-BATxnew||2,(13)式中:ynew为新测量的数据降维后的数据,满足ynew=AxnewT;Λ为样本协方差矩阵,即Λ-1=YTY/(n-1).1.4 故障检测步骤基于WDNS-SWNPE算法的故障检测包括离线模型建立和采集数据进行在线检测两部分.A.离线模型步骤 1 在正常工况下,采集多模态样本数据组成训练样本集X∈Rm×n,将三维数据按照批次-变量方式展开成二维数据;步骤 2 使用式(1)对原始样本集中每个样本xi进行标准化得到xi*,组成新的标准化样本集X*;步骤 3 通过式(6)求取稀疏矩阵S代入到式(7),求解式(9)可得映射矩阵A;步骤 4 由核密度估计确定T2和SPE统计量的控制限.B.在线检测步骤 1 采集在线检测样本xnew,使用式(1)对在线数据进行标准化,获得标准化样本xnew*.步骤 2 由离线阶段求得矩阵A,利用降维关系Y=ATX求取低维投影ynew;步骤 3 根据式(12)和(13)求取在线样本的T2和SPE统计量;步骤 4 将T2和SPE统计量分别与各自的控制限比较,若有一个超过控制限,则判定为故障样本,否则为正常样本.2 青霉素发酵过程故障检测青霉素发酵过程是一个典型的动态特性和多模态特性共存的间歇生产过程.采用青霉素发酵仿真平台Pensim2.0实现过程故障检测的仿真,研究表明该仿真平台具有较强的实用性和有效性[29-30].通过Pensim2.0产生间歇过程的仿真数据,设定反应时间为400 h,采样时间间隔为1 h,在正常工况下生成两个模态数据:模态1初始CO2浓度设定为0.5 mmol/L,通过调整初始变量值产生15个批次,为稀疏模态;模态2初始CO2浓度设定为1 mmol/L,通过微调初始变量值产生15个批次,为密集模态[31].共生成两种模态30批正常数据样本.为了使过程数据更加符合实际发酵过程,将数据中所有变量均加入均值为0、方差为0.1的高斯噪声.表1所示为故障批次样品参数.10.13245/j.hust.220107.T001表1故障批次样本参数故障编号变量名扰动幅值/%引入时段/hF1通风速率阶跃6.0100~200F2通风速率斜坡2.0250~400F3搅拌速率阶跃8.0250~350F4搅拌速率斜坡6.0250~400F5底物加速率阶跃10.0200~300F6底物加速率斜坡0.8250~400DNPE,TNPE,LNS-NPE,SWNPE及WDNS-SWNPE算法对故障F1~F6的检测效果如表2所示.对比发现:故障F1最容易被检测,所有算法均能完全检测出来;对于故障F5和F6,本文算法具有更高的检测率.通过阶跃扰动故障和斜坡扰动故障对比发现:斜坡故障扰动因其变量变化缓慢而更难被检测出,三种变量引起故障中,底物流加速率变量所引起的故障更难被检测,原因在于反应底物传播速度较慢,故障特征不能及时显现;当SPE统计量检测到故障时表明这种统计模型所代表的正常工况下的变量关系被破坏,T2统计量检测到故障发生时表明过程或者工况发生变化而产生故障;由表2可知,本文算法具有更好的检测效果.10.13245/j.hust.220107.T002表2五种算法对故障F1~F6的检测效果故障编号DNPETNPELNS-NPESWNPEWDNS-SWNPET2PSPET2PSPET2PSPET2PSPET2PSPEF11.001.001.001.001.001.001.001.001.001.00F20.900.940.900.950.920.950.950.950.980.97F30.880.900.890.900.820.910.920.940.910.96F40.690.670.700.710.720.730.790.820.810.89F50.910.920.910.930.930.920.920.950.940.95F60.340.370.400.390.550.590.610.630.710.80图1~5为故障F2分别采用DNPE,TNPE,LNS-NPE,SWNPE及本文算法的故障检测结果.10.13245/j.hust.220107.F001图1故障F2采用DNPE的故障检测结果10.13245/j.hust.220107.F002图2故障F2采用TNPE的故障检测结果10.13245/j.hust.220107.F003图3故障F2采用LNS-NPE的故障检测结果10.13245/j.hust.220107.F004图4故障F2采用SWNPE的故障检测结果10.13245/j.hust.220107.F005图5故障F2采用本文算法的故障检测结果图1中T2统计量在第265个采样点检测到故障,SPE统计量在第258个采样点检测到故障,两个统计量均存在较大的延迟;图2中T2和SPE统计量分别在第264和第257个采样点检测到故障,相较于DNPE算法有所提高,但仍然有很大的延迟;图3中两个统计量分别在第262和第257个采样点检测到故障,较前两种算法故障被检测时间有所提高,但仍然存在一定的延迟;图4中T2统计量在第257个采样点检测到故障,响应更快,但SPE统计量并未得到改善,并存在延迟;图5中T2和SPE统计量分别在第253和第254个采样点检测到故障.与DNPE,TNPE,LNS-NPE和SWNPE相比,本文算法故障被检测出的时间更早,能够在故障发生时及时检测到故障,表现出更加满意的检测效果.3 结语提出了一种基于改进邻域保持嵌入的故障检测方法.该方法利用加权双近邻标准化过程样本的方式将多模态数据融合为一个模态,消除多模态中心点差异,有效解决多模态特性;通过稀疏加权优化局部特征,使得NPE算法在降维过程中增强噪声和离群点的鲁棒性.青霉素发酵仿真研究表明:所提算法相比传统算法在提高故障检测率的同时能够更快地检测出故障.
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览