引言风机作为流体传输设备在电厂中被广泛应用。在发电趋于自动化、智能化的背景下,各设备之间以及同一设备的不同部分间的耦合程度高,风机发生故障可能“链式”影响整个电厂设备的安全经济性。风机耗电量在厂用电量中占据较大比例,常用风机中离心风机约占1/2。为了保证电厂设备的正常运行,对电厂离心风机进行及时准确的故障诊断十分重要。离心风机常见故障包括部件松动摩擦、转子转动不平衡、不对称以及旋转失速等[1]。目前,常见的故障诊断方法包括频谱分析法、专家系统分析法、神经网络智能分析法、支持向量机分析法以及深度学习法[2]。频谱分析法将信号转化并分解为若干个单一分量,以判断故障类型,针对故障类型众多的情况,该方法的精确度较低[3]。专家系统分析法不断地输入专家相关的诊断知识,系统掺杂了人为因素,对新的故障预测能力不足[4]。支持向量机分析法在小样本、非线性的故障诊断中可以完成分类与回归,并且具有较好的机器学习能力[5-6]。神经网络以及深度学习成为学者们研究故障诊断的焦点。深度学习具有极强的机器学习能力,但其网络层数较多,诊断时间较长,且极具飞行事故记录器的特性,无法清晰阐明诊断原理[6]。网格搜索能够解决KNN算法中k值选取的问题,并且依据距离以及投票得分计算公式,以此作为故障分类的依据。采用投票加权网格搜索-k近邻算法(GS-KNN)进行离心风机的故障诊断,对实验涉及的G4-73No8D风机所含的9种运行状态故障进行诊断。1研究原理1.1k近邻原理k近邻(KNN)算法是简单的有监督机器学习算法。KNN算法原理如图1所示。在待分类数据附近最近的k个邻居中进行投票操作,得到投票得分,判定待分类数据归属于投票得分高的类别。KNN算法的准确度较高,k值选取合理时,该算法对异常值和噪声有较高的容忍度[7],对交叉项以及重复项比例较高的样本集具有较高的识别以及分类能力。10.3969/j.issn.1004-7948.2024.01.014.F001图1KNN算法原理KNN算法中两个重要的影响因素为k值选取与距离的度量函数。KNN算法中距离的度量普遍采用欧氏距离,如A(x1,x2,x3...xn)与B(y1,y2,y3...yn)之间的欧氏距离d为:d=∑i=1n(yi-xi)2 (1)各分量的量纲范围波动较大时,每个分量由于量纲不同对距离的影响程度不同。如果第一个分量的变化范围为[0,0.1],另一个分量的变化范围为[0,100],则第一个分量较后者的波动影响很小,会在一定限度上对准确度量距离产生不利影响。在KNN算法的投票环节,无论距离远近,投票时的贡献均等,仅根据投票个数判决分类存在缺陷。实际情况中,样本间的距离越近表明相似度越高,归属于同一类的可能性越大,投票环节无视距离的影响会降低故障诊断的准确率。1.2标准欧式距离采用标准欧氏距离作为度量距离的方法,引入相对应的方差,可以消除量纲相差太大所导致的诊断准确率下降问题[8]。A与B之间的标准欧氏距离d'为:d'=∑i=1n(yi-xi)2si2 (2)式中:si——方差。标准欧式距离相当于对数据进行了归一化,消除了量纲大小对度量距离的影响。1.3投票加权针对投票环节距离贡献考虑均等的缺陷,将在投票前给已选出的前k个近邻的权值,加权公式为:λm=1-dm∑i=1kdi (3)dm越小,对应的权值越大,对投票得分的贡献值越大。赋权的范围仅限于投票环节涉及的k个近邻,权值的范围控制在(0,1)之间。加权个数投票得分:对于k个近邻样本,根据每个类别所含样本的权值之和计算每一类对应的投票得分,得分最高的类别即为待分类数据的类型。PA=∑m∈Aλm (4)式中:m——前k个近邻样本中属于类别A的样本;PA——A类别的投票得分值。投票加权只给前k个近邻进行加权,相较于距离加权,其模型的运行效率得到提高。1.4网格搜索k值KNN算法的结果不仅与距离有关,对k值的选取也十分敏感[9]。k值过小会陷入过拟合问题;k值过大时,模型复杂程度增加,会出现欠拟合现象。常见的有关k值选取的方式主要包括:交叉验证法和其他智能寻优法,如遗传学算法等[10]。文中依据网格搜索取得最优的k值,并将其应用于故障诊断模型。网格搜索(Grid Search, GS)又称为穷举搜索,通用性强且简单高效,在所有候选参数中通过循环遍历所有的可能性,选出表现最佳的参数。网格搜索的优点在于过程中无随机因素,不会影响超参数的搜索结果,避免了局部最优值的出现。但对于待定参数较多的模型,网格搜索耗时较长。在GS-KNN故障诊断模型中仅需搜寻超参数k的值,可以快速准确地找到最合适的k值,有效克服模型过拟合和欠拟合的缺陷,提高模型的整体诊断效率和泛化能力。2故障诊断模型2.1投票加权GS-KNN算法分类步骤投票加权GS-KNN算法通过计算待分类数据与样本数据之间的距离,网格搜索k值,求取k个最近距离,根据投票加权公式计算每一类的得分,将待分类数据划分到得分高的类别。分类步骤如下:(1)距离:计算待分类数据与其他已知分类标签样本数据的加权标准欧式距离。(2)排序:距离按照升序排列。(3)k值:网格搜索选取合适的k值。(4)数据:在已排序好的距离中选取前k组数据。(5)加权:根据前k组数据的距离,进行相应的权值计算。(6)投票得分:根据加权投票公式计算前k组数据分类得分情况,若k组数据中A类的加权投票得分最高,相当于投票过程A的得票最高。(7)结果:根据加权投票得分,待分类数据归属于得分最高的类别中。2.2故障诊断模型KNN算法可以通过分类完成对未知标签数据组的预测诊断[11]。投票加权GS-KNN模型利用已知数据标签的数据集进行训练,通过输入未知故障类型相关特征数据预测故障类型,完成故障诊断。投票加权GS-KNN故障诊断模型流程如图2所示。10.3969/j.issn.1004-7948.2024.01.014.F002图2投票加权GS-KNN故障诊断模型流程3投票加权GS-KNN对离心风机进行故障诊断3.1风机数据及故障产生原因在G4-73No8D风机实验台上进行故障模拟,得到故障样本作为待处理数据集。G4-73No8D风机是被国内电站广泛应用的系列风机之一,该实验台模拟得到的故障数据集对故障诊断研究具有实践意义[12]。离心风机故障模拟平台如图3所示。10.3969/j.issn.1004-7948.2024.01.014.F003图3离心风机故障模拟平台风机安装以及运行过程中,摩擦磨损以及松动产生的风机转子与电机转子的不同心,会引发风机的不对中故障。在风机的实际运行过程中,不均匀的腐蚀以及磨损、转子附着物的掉落、转子检修后未进行相关的动平衡调整会造成不平衡故障。风机工作的时间越长,各部件之间由于碰撞以及摩擦磨损造成动静碰摩越严重,而轴承紧力不足甚至消失以及垫块接触不均匀是导致轴承松动的主要原因[13-14]。对这些常见的离心风机运行故障进行实验模拟,并收集相关实验数据。风机故障各工况如表1所示。离心风机各运行状态下的数据时域曲线如图4所示。10.3969/j.issn.1004-7948.2024.01.014.T001表1风机故障各工况工况运行状况风机故障形式1正常无故障2角度不对中实验台使用的联轴器为刚性联轴器,实验中分别模拟风机和电机之间的刚性联轴器角度不对中和平行不对中故障(小程度)。3平行不对中(小)4不平衡(1)在前盘接近外缘处等角度的6个位置处加不平衡的质量块,通过调节不平衡块的质量、位置和不同位置不平衡块的组合模拟不同程度的不平衡故障和状态。5不平衡(2)6碰摩(1)分别对单点、多点及局部面进行不同程度的碰磨故障进行模拟。7碰摩(2)8轴承松动全松(小)通过调整轴承不同部位螺栓的松紧程度模拟松动故障。9轴承松动左侧松动(小)10.3969/j.issn.1004-7948.2024.01.014.F004图4离心风机各运行状态下的数据时域曲线离心风机属于从动设备,设备振动是绝对的。离心风机正常运行时其数据时域图如图4(a),振动较为平稳,且在一定的允许范围内。运行发生故障时,振动信号表现不稳定,出现峰值,且不同故障的振动信号范围不同。大量的数据有利于构建更加准确的诊断模型。按照7∶3的比例将数据划分为训练集和数据集,利用投票加权GS-KNN进行故障诊断。3.2投票GS-KNN进行离心风机故障诊断利用实验台所得数据进行模型训练,依据模型运行结果,绘制了传统KNN模型、GS-KNN模型以及投票加权GS-KNN的故障诊断准确率,如图5所示。10.3969/j.issn.1004-7948.2024.01.014.F005图5不同模型的故障诊断准确率对比由图5可知,网格搜索k值可以克服由于传统KNN模型k值选取不合适导致的准确率低下的缺陷,提高故障诊断准确率。根据离心风机实验台得到的数据样本进行模型训练,在k=5时,投票加权GS-KNN模型对9种运行状况的甄别准确率可达100%,在k=6(稍加偏离最优k值)的情形下准确度仍然不受影响。投票加权GS-KNN模型在故障诊断上的整体表现优于传统的KNN模型以及GS-KNN模型。4结语投票加权GS-KNN算法采用标准欧式距离作为近邻度量方式,消除了由于数据量纲不同产生的误差。算法以加权投票得分作为分类标准,依据距离近的样本相似度更高的原理,构建与距离值呈现负相关的权值,在投票环节依据得分公式进行分类。利用网格搜索选取合适的k值,避免了人工选取k值所存在的主观因素,另一方面k值将根据训练数据选取,提高了模型的泛化能力。使用投票加权GS-KNN故障诊断模型对G4-73No8D风机的9种运行情况进行故障诊断,诊断准确率可以达到100%。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览