网刊加载中。。。

伴随着制造业发展，产品品质越来越受到关注．如何在快速生产环境下确保出厂产品的品质，成为了国内外学者研究的热点[1]．在众多产品质量问题中，表面缺陷最为常见也最容易被发现，严重影响了产品的使用和销售[2]．传统的缺陷识别依靠人工实现，识别速度缓慢，且存在主观性较强、工人容易疲劳等问题，极易造成漏检或错检，无法满足高速生产的需要．随着人工智能技术的兴起，以人工神经网络(ANN)[3]、支持向量机(SVM)[4]等为代表的识别方法，以及以局部二元模式(LBP)[5]、灰度共生矩阵(GLCM)[6]为代表的特征提取算子开始逐渐受到关注．然而，这些方法存在特征提取算子与识别方法之间的匹配问题，针对不同的问题要用不同的识别方法，须领域专家手工设计特征提取算子[7]，其适用性受到了一定的局限．近年来，通过先进的深度学习[8-11]方式实现准确的缺陷识别，逐渐成为了研究热点．作为深度学习的代表性模型，卷积神经网络具有良好的图像识别效果，可以实现缺陷图像特征的自动化提取，有效避免传统识别方法对人工设计特征的依赖，具有更好的适用性，在缺陷识别领域也受到了广泛的关注．文献[7]提出了一种基于卷积神经网络的低质量缺陷识别方法，通过生成对抗网络有效消除了噪声和遮挡对缺陷识别的影响，实现了较高的识别效果．文献[12]提出了一种基于卷积网络的钢铁表面缺陷识别方法，并通过在卷积神经网络中引入最大池化层，从而提高识别效果．文献[13]将卷积神经网络应用到了LCD屏幕的缺陷识别中，通过卷积自编码器，实现了缺陷区域与非缺陷区域的分割．文献[14]提出了一种基于多层级金字塔的特征融合方法，通过高斯金字塔实现缺陷特征的逐层提取，并通过卷积神经网络进行特征融合，从而在小样本下实现了较高的识别精度．文献[15]提出了一种基于预训练的卷积神经网络模型，利用预训练权值实现模型的快速训练，并成功地将该方法应用到了缺陷分类和缺陷分割等任务中．卷积神经网络在缺陷识别中取得了良好效果，然而卷积神经网络的训练大多为有监督过程，须从大量标记样本中提取有效信息，一旦标记样本数量不足，所提取的信息就会存在偏差，从而严重影响识别效果，甚至造成模型瘫痪．在实际生产中，获取大量标记数据代价极高：一方面，数据标记依赖专家知识，标记大量的数据，人工成本较高；另一方面，数据标记十分耗时，延缓了缺陷识别模型的部署时间，严重影响整个质量检测的顺利进行．此外，大量的未标记数据并未得到使用，造成了不必要的资源浪费．上述问题严重限制了卷积神经网络在实际生产中的应用．针对该问题，本研究提出了一种基于半监督学习卷积收缩自编码器的缺陷识别方法，通过未标记数据获取有效信息，并结合少量标记样本，实现较高的识别效果．1 卷积收缩自编码器为了有效改善卷积神经网络对标记样本的依赖，采用自编码器的网络形式对卷积神经网络进行训练．卷积自编码器由编码器、解码器和分类器组成，网络结构如图1所示，虚线箭头代表图像重构．10.13245/j.hust.210716.F001图1卷积自编码器网络结构编码器通过特征映射f(∙)将缺陷图像x映射为特征h，解码器则利用映射函数g(∙)，通过特征h重构输入图像x．分类器的主要作用则是根据输入特征给出相对应的缺陷类型．整个模型的训练过程可以分为预训练和微调两部分．预训练采用无监督的方式训练编码器和解码器，并采用均方差来衡量重构误差，表达式如下Er=||x-g(f(x))||2．在预训练阶段，标记和未标记数据均可以参加训练，因此模型所获取的有效信息也会远多于只使用少量标记数据训练的模型．预训练结束后，解码器被丢弃，编码器作为特征提取器与分类器进行连接．通过少量有标记数据进行监督学习，微调整个网络，实现缺陷的准确识别．假设y为缺陷图像所对应的真实标记，y'为本文方法的识别结果，采用交叉熵损失函数(Ec)来衡量识别结果与真实结果之间的差距，定义如下Ec=-ylogy'-(1-y)log(1-y')．采用对称的6层卷积神经网络结构分别作为编码器和解码器．如图1所示，每个网络包括了3个卷积层和3个池化层．编码器和解码器采用相同的卷积层结构，不同的地方在于编码器采用最大池化层，而解码器则采用上采样作为池化层．最大池化层采用2×2的滑动窗提取当前窗口的最大值，而上采样则可以看作是最大池化的逆操作．最大池化和上采样示意图如图2所示．10.13245/j.hust.210716.F002图2最大池化层和上采样示意图在编码器和解码器的映射函数中，采用ReLU(Φ(x)=max(0，x))作为激活函数，增加特征空间的非线性程度．网络的其他结构如表1所示，表中λ为平衡系数，[ ]中数字为当前网络的参数，以第一层卷积层为例，[32 3×3]中32代表卷积核数量，3×3表示单个卷积核的大小为3×3．当网络为最大池化层时，则表示采样窗口大小为2×2．10.13245/j.hust.210716.T001表1网络其他结构层数编码器解码器分类器第一层卷积层上采样全连接层[32 3×3][2×2][512]第二层最大池化层卷积层全连接层[2×2][64 3×3][512]第三层卷积层上采样Softmax层[64 3×3][2×2]第四层最大池化层卷积层激活函数[2×2][32 3×3]ReLU第五层卷积层上采样[128 3×3][2×2]λ=0.001第六层最大池化层卷积层[2×2][3 3×3]为了提高特征的表征性，在卷积自编码器的特征空间中加入了收缩惩罚项Lc=||h||F2．收缩惩罚项通过对特征空间施加Frobenius范数约束，使得特征空间具有更强的表征性，有效避免了某些特征点过大所导致的特征偏移，确保特征所包含信息的有效性．与此同时，收缩惩罚项可以有效去除冗余的特征表达，使得缺陷特征更加的稀疏[14]．本方法在预训练和微调阶段均加入了收缩惩罚项，具体损失函数可以分别表示为：Er=||x-g(fx)||2+λLc;Ec=-ylog y'-(1-y)log(1-y')+λLc.本文方法在预训练和微调过程中，均采用基于批次的Adam优化方法进行优化，其中预训练过程迭代50次，微调过程迭代150次．λ设为0.001，批次大小为32．2 实验结果2.1　实验设计为了验证本文方法的有效性，在东北大学热轧钢铁缺陷数据集上进行了测试．东北大学热轧钢铁数据集包含了6类共计1 800张缺陷图像，分别为龟裂、夹杂、点蚀、斑点、轧痕及划痕．图像大小为64×64，具体示例如图3所示．10.13245/j.hust.210716.F003图3东北大学热轧钢铁数据集示例首先将数据集随机划分训练集和测试集．训练集和测试集各6类，每类150个样本．为了模拟标记样本数量不足的情况，针对每个缺陷类别随机隐去一定数量的样本标记，将这些样本视作未标记样本．为了验证本文方法的有效性，设计了如下实验：通过与未采取预训练的卷积神经网络及未采用收缩惩罚项的卷积自编码器进行对比，验证本文方法的有效性；对比其他的半监督学习算法和缺陷识别方法，验证本文方法具有更好的缺陷识别效果；讨论在不同噪声下所提算法的表现，验证算法的鲁棒性．在实验过程中，所有样本未采用任何数据增强方式，直接输入网络．与此同时，网络采用Adam进行优化，预训练迭代50次，微调迭代150次，批次大小为32，各类别标记样本数量分别50，100，150．其中150时为全监督学习过程．2.2　实验结果表2为模型有效率实验结果对比．结果表明：本文方法在不同的标记样本数量下取得了更好的识别效果．10.13245/j.hust.210716.T002表2模型有效率实验结果对比样本数量无预训练有预训练无预训练+惩罚项本文方法5073.4794.8094.5795.4210079.1996.4796.7297.3615096.7297.0496.8697.50%引入预训练可有效地提取特征信息，提升算法的识别精度，尤其是在标记样本较少的情况下，提升效果较为明显．收缩惩罚项对提高识别精度具有良好的作用．本文方法在全监督学习下依然有着良好的识别效果，同样适用于全监督问题．S3VM，PLCNN，Autoencoder，CNN和本文方法的准确率分别为32.67%，90.70%，54.52%，73.17%和93.63%．可见：本文方法相较于其他方法，准确率提升4.93%~62.96%，有更好的识别效果．为了验证本方法的适用性，分析本文方法在不同标记样本数量和噪声扰动下的鲁棒性．采用二元噪声，即根据不同概率随机将图像像素置零，不同噪声概率(p)下的识别率如表3所示．10.13245/j.hust.210716.T003表3不同噪声概率下的识别率样本数量p/%15102030405094.8393.8792.7890.7689.3485.0510096.9796.0194.8193.3891.8990.5515097.2896.3995.6294.6493.2391.72%实验结果表明：本文方法针对轻微的噪声具有良好的鲁棒性，识别效果并未受到较大影响．这得益于卷积自编码器自身具有良好的去噪效果．在卷积自编码器的预训练过程中，特征重构可以有效地消除轻微噪声对特征提取的影响，避免了噪声带来的特征波动，确保识别效果．然而随着噪声信号不断增强，本文方法的识别效果明显下降．当遇到较强噪声时，已经无法正常工作，须通过额外的数据增强或者预处理手段提升图像质量，才能获得较为满意的结果．3 结语提出了一种基于卷积收缩自编码器的半监督缺陷识别方法．通过在卷积自编码器中引入收缩惩罚项，提高提取特征的表征性，使得模型可以从未标记数据中获取有效信息，结合少量标记样本，实现较高的识别效果．本文方法可有效降低样本标记成本，缩短部署时间，确保整个生产过程的顺利进行；对噪声具备良好的鲁棒性，具有更加广泛的场景，可以适应复杂的生产环境．该方法存在以下不足：只能识别已知缺陷类型，对未知类别的缺陷无法准确分类；识别精度仍待进一步提升．