旋转机械在经过长期运行后,不可避免地会出现故障或损坏,导致机器停止运行,因此实现旋转机械故障诊断是机械制造行业一直以来研究的热点[1-3].例如文献[4]采用深度自编码器提取齿轮箱监测信号中的故障信息.文献[5]利用卷积神经网络处理从轴承振动信号中提取的循环谱相干信息.文献[6]提出一种生成对抗网络,解决了不平衡数据下轴承故障诊断问题.虽然上述方法均取得不错的故障诊断效果,但仍需要大量训练样本,因此如何利用小样本训练集实现精度较高的故障诊断成为了研究的重点.传统的小样本训练集诊断方法主要有数据增强、对抗学习等,这些方法的性能好坏取决于已有的数据能否反映真实的数据分布.此外,以生成对抗网络为代表的数据生成模型存在网络容量大、训练速度慢的问题.近年来,越来越多的学者将图理论应用于故障诊断[7-8].其中,构造图数据建立样本之间的关系,并从中提取振动信号高层次故障特征是解决小样本问题的有效手段[9].为了从所构建的图数据中挖掘故障特征,相关研究人员提出利用图卷积神经网络,通过图上的卷积操作从离散空间结构中提取信号特征,并在语义判别、行为识别领域取得成功应用[10-11].在机械故障诊断领域,国内相关学者已开展图卷积神经网络的相关研究工作,并取得不错的效果.例如文献[8]将样本数据点作为图中节点构造图数据,建立深度图卷积神经网络模型实现滚动轴承故障分类.但是基于信号原始幅值的图数据容易受噪声信号影响.文献[12]提出一种基于旋转机械振动信号特征指标的图卷积神经网络.该方法能够在少量的标签下取得较高的整体准确率,但仍存在提取的振动信号指标无法反映某些故障特性,导致某类故障诊断准确率偏低.概括来说,图数据构建与挖掘通常面临以下挑战:特征向量的质量会影响图数据质量;图数据节点信息通过边传播进行学习更新,其节点连接方式会影响图数据中故障特征信息表征;进一步挖掘所构建图数据中蕴含的故障特征信息,提高诊断效果.为了解决上述问题,提出一种基于图数据深度挖掘的旋转机械故障诊断方法,提取信号奇异值向量作为图数据构建的特征向量,并将原始信号转化为无向全连接图,从而构建图卷积神经网络模型,利用模型对旋转机械故障状态进行诊断.1 理论背景1.1 归一化处理对振动信号进行归一化可以加快神经网络训练时的收敛速度,并改善训练效果,同时能在一定程度上消除噪声对原始信号的干扰.对于一个信号X,其最大最小归一化定义为Xnorm=(X-Xmin)/(Xmax-Xmin),(1)式中:Xnorm为归一化信号;Xmax和Xmin分别为X中最大元素和最小元素.1.2 奇异值分解为能够对信号X=(x1,x2,…,xn)进行奇异值分解,须要进行信号重塑.考虑到汉克尔矩阵具有零相移、类小波特性[13],将原始信号X重塑为汉克尔矩阵,即H(X)=x1x2…xm-h+1x2x3…xm-h+2…xhxh+1…xm,(2)式中:(m-h+1)为矩阵列数;h为矩阵行数.当矩阵为方阵时,奇异值分解能取得最好的效果,设置 h=(m+1)/2.随后汉克尔矩阵经过奇异值分解后得到3个矩阵,具体为H(X)=UΣVH,(3)式中:U∈Rh×h,V∈Rh×h,Σ∈Rh×h为对角矩阵;对角线上的元素为奇异值σ1,σ2,…,σh.提取奇异值作为信号的特征向量F=[σ1,σ2,…,σh].1.3 图数据构建图定义为G={V,E,W},其中:V为图节点,表示监测信号,节点数量为K;E为图边;W为权重矩阵.定义边Ei,j的权重值为Wi,j=||Fi-Fj||2,(4)式中Fi∈Rh为节点i的奇异值特征向量.按照上述定义,利用奇异值分解构建的图数据如图1所示,其中所有特征信息均以节点形式体现.带标签且已知相同故障类别节点、不带标签且未知相同故障类别节点均采用无向全连接形式进行连接,但是二者在空间中没有相互连接.10.13245/j.hust.210901.F001图1无向图1.4 图卷积神经网络在图谱分析中,拉普拉斯矩阵定义为L=In-D-1/2WD-1/2,(5)式中:L∈Rn×n为拉普拉斯矩阵,n为节点个数;In∈Rn×n为单位矩阵;D∈Rn×n为对角度矩阵;W∈Rn×n为权重矩阵.由于拉普拉斯矩阵为实对称矩阵,对其进行正交分解,具体为L=UΛUT,(6)式中:Λ=diag{λ0,λ1,⋯,λn-1}的对角线元素为特征值;U=[u0,u1,…,un-1]由特征向量组成.一种基于拉普拉斯矩阵的切比雪夫图卷积算式定义为[8]y=∑k=0K-1θkTkL˜x;(7)T0(x)=1,T1(x)=x,Tk(x)=2xTk-1(x)-Tk-2(x) (k≥2); (8)L˜=(2/λmax)L-In,(9)式中:x∈Rn为节点特征;y∈Rs为图卷积输出;K为切比雪夫多项式阶数;gθ=diag[θ]为滤波器;θk∈Rn为切比雪夫相关系数向量;Tk(x)为递归计算式;L˜∈Rn×n为拉普拉斯矩阵正则化形式.所构建的图卷积神经网络结构用公式表述为Z=QsoftmaxWUWUWXW0W1W2,(10)式中:Qsoftmax为激励函数;U为线性激活函数;W∈RN×N为权重矩阵,N为样本数量;W0∈RC×H,W1∈RH×I,W2∈RI×J分别为第一、二、三层图卷积权重矩阵,C为输入矩阵特征维度,H,I,J分别为第一、二、三层卷积层输出特征维度.2 诊断基本流程提出的旋转机械故障诊断方法流程框图如图2所示.首先,利用数据获取系统采集监测振动信号;然后,对监测振动信号进行最大最小归一化处理并构造汉克尔矩阵;在此基础上,对汉克尔矩阵进行奇异值分解并获取其节点表示形式——奇异值特征向量;进一步地,构造基于奇异值特征向量的图数据并将其输入到图卷积神经网络,以实现高层次特征表达;最后,利用softmax分类器辨识监测信号故障类别.10.13245/j.hust.210901.F002图2诊断流程框图3 实验验证3.1 实验说明利用凯斯西储大学(CWRU)公开数据集中不同负载下(0 hp,1 hp,2 hp和3 hp)的振动监测信号进行分析诊断,以验证所提方法性能[14].其中,每种负载条件包含11种故障类型信号,详细信息如表1所示.振动信号采样频率为12 kHz,每个样本数据长度设置为419,而旋转机械旋转一圈所收集的最大样本点数量为400.从每类故障数据中选取40个样本来构造小样本数据集,其中每种工况各10个,共包含440个数据样本.在实验验证过程中,30%的数据样本用作模型训练,35%的数据样本用作模型验证,剩余35%的数据样本用作模型测试.本文算法均由python 3.8编写,并利用配置为Intel Core i7-8700K CPU,32 GB RAM的服务器进行数据运算.10.13245/j.hust.210901.T001表1单一工况下CWRU数据集信息故障直径/mm故障位置故障类型标签0.177 8内圈IR0071滚珠B0072外圈OR007@630.355 6内圈IR0144滚珠B0145外圈OR014@660.533 4内圈IR0217滚珠B0218外圈OR021@690.711 2内圈IR02810滚珠B028113.2 参数设置根据数据样本长度和汉克尔矩阵定义,将信号重塑为210阶汉克尔矩阵,此时所提取的奇异值向量维度为210.图卷积神经网络卷积层3的输出维度J设置为11,与故障标签数量相同.而图卷积神经网络卷积层1和2的输出维度H和I,以及切比雪夫多项式项数K则须要通过实验来确定.3.2.1 图卷积神经网络结构参数选择为选取合适的图卷积神经网络结构参数,固定切比雪夫多项式项数K=3,并设置了4种不同卷积层输出维度下的比较实验,分别为H=105,I=50;H=105,I=25;H=50,I=25;H=50,I=16.10次实验平均结果分别为98.70%±0.86%,94.29%±1.87%,95.13%±1.83%,94.61%±1.65%.当H=105,I=50时,测试集的准确率比其他三种结构都要高,达到了98.7%,且标准差最小,仅为0.86%.因此,图卷积神经网络卷积层1和2的输出维度设置为H=105, I=50.3.2.2 切比雪夫多项式项数K的设置为确定切比雪夫多项式项数K,比较分析了不同K下的测试集分类准确率,其中,采用3.2.1节中的维度设置H=105,I=50.10次实验平均结果显示,当K从2增大到5时,测试集准确率由95.89%增加到最大值99.28%,而当K继续增大时,测试集准确率大幅度下降至95.57%.此外,当K=7时,训练集准确率在129个周期前无法稳定,结果如图3所示,因此只考虑K=[2,6]范围内的切比雪夫多项式项数K.10.13245/j.hust.210901.F003图3K=7的训练集准确率曲线根据上述参数设置讨论,当选取H=105,I=50,K=5时,在30%的训练样本条件下,测试集准确率能达到99.28%,具备良好的故障诊断性能.4 结果分析4.1 其他数据集验证实验为了进一步验证所提出方法的有效性,利用帕德博恩大学提供的轴承数据集开展验证实验[15].振动信号在4种不同负载下被收集,分别包含健康、内圈故障和外圈故障3种健康状态.每种健康状态信号收集40个样本,其中每种负载下采集10个样本,一共120个样本.振动信号采样频率为64 kHz,数据样本长度设置为4 355,旋转机械旋转一圈收集到最大样本数量为4 266.因此奇异值向量尺寸为2 178.对于模型参数,切比雪夫多项式系数K设置为5,第一、二、三层卷积输出特征维度分别为500,100,3.一共进行10次实验,其中分类准确率最大为99.54%,最小为91.20%,平均分类准确率为96.11%.该方法能够在KAT数据集上实现96.11%的分类准确率,验证了本文方法的有效性和泛化能力.4.2 不同训练样本对比实验为了验证所提方法在小训练样本条件下的诊断性能,采用3.1节所述数据集进行了诊断性能对比实验.根据3.2节参数设置讨论结果,切比雪夫多项式系数K设置为5,第一、二、三层卷积输出特征维度分别为105,50,11.每种训练样本下的10次实验平均结果显示,当训练样本数量从44增加到176时,测试集准确率由86.11%增加到最大值99.31%,而当训练样本继续增加时,测试集准确率小幅度下降至98.37%.当训练样本为44时(占总样本数量10%),测试集准确率也能达到86.11%;当训练样本增加到88时(占总样本数量20%),测试集准确率将不低于90%.验证了本文方法在小训练样本情况下仍能取得良好的诊断性能.4.3 不同模型故障识别能力对比实验为进一步验证本文方法的故障识别能力,利用3.1节构建的数据集进行模型对比实验,包括生成对抗网络(GAN)、卷积神经网络(CNN)、支持向量机(SVM)、奇异值+K近邻算法(SVD+KNN).每种模型设置如下:GAN模型输入为连续小波变换之后转换的时频图,最后利用CNN进行故障分类;CNN采取三层卷积+三层全连接结构;图卷积模型参数设置与3.2.1节相同;SVD+KNN中Kn设置为3.对比实验在CWRU集上进行,取10次实验的平均结果分析,其中CNN为98.44%,GAN为98.15%,SVD+GCN为99.28%,SVM为98.44%,SVD+KNN为39.03%.本文方法取得最高的分类准确率,达到99.28%;GAN,SVM,CNN等传统小样本学习方法均能取得98%以上的分类准确率.通过对比实验表明,本文方法同样能实现不错的诊断效果.5 结语针对旋转机械故障诊断过程面临的小样本问题,提出了一种基于图数据深度挖掘的旋转机械故障诊断方法,通过轴承故障诊断实验验证了该方法的有效性,主要结论如下:a.通过奇异值分解,提取并构建基于原始信号奇异值的特征向量,相比传统时频域统计值,所构建的图数据蕴含更多故障信息;b.所运用的边连接方式使得故障信息只会在相同类型故障节点之间进行传递更新,提升了图数据中节点故障信息的可学习性;c.利用图卷积神经网络挖掘高层次故障特征,通过轴承诊断实验表明,本文方法平均正确率为99.28%,具有良好的故障识别能力.
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览