注塑成型过程是典型的小批量、多产品的间歇操作过程,具有明显的多变量、多工序、周期性非稳态等特点[1]。同时,间歇过程生产制品的质量难以在线测量,只能通过生产完成后采用各种方法测量,且测量的结果通常滞后于生产过程。因而,注塑过程的产品质量测量值具有严重的时间滞后性,无法在当前间歇操作周期内将质量信息及时反馈给过程控制系统[2-3]。由过程数据在线预测产品质量,即建立注塑过程的质量软测量模型,可以为产品质量控制和改进奠定基础。集成学习利用多个基学习器作为集成成员进行训练,并将它们的预测组合成最后输出[4-6]。实际注塑过程中,注塑不同阶段的方差和均值等统计值具有很大的差别,采用单独的模型建模会削弱不同阶段的差异性,从而影响模型的预测精度[7]。因此,多工况建模策略成为注塑等间歇过程建模的主流方法。目前已有研究将注塑多个阶段进行集成建模以提高预测精度[8-10]。本实验针对注塑间歇过程产品质量控制难题,研究多工况注塑间歇过程的工况聚类和在线识别方法。针对注塑间歇过程多工况特点,利用集成学习方法,建立间歇过程基于多工况的产品质量软测量集成模型,为注塑过程闭环质量控制提供可靠的质量反馈,为实现注塑过程乃至其他工业间歇制造过程质量自动化预测控制提供参考。1注塑过程特性分析1.1注塑工艺简介注塑过程包括加料、合模、熔融、注射、保压、冷却和开模等过程。注塑间歇过程具有多时段、多工况的特点,用传统的质量预测方法难以准确预测间歇多阶段生产制品的质量。本实验利用间歇生产过程多阶段特性,进行工况识别,将不同的阶段进行区分并识别,深入分析每一个操作子阶段,对多阶段间歇过程进行准确预测与控制。1.2数据介绍本实验数据集由富士康工业互联网股份有限公司提供,是一卧式曲肘注射机生产过程记录数据。数据分为两部分:传感器采集数据和成型机操作状态数据。传感器采集数据和成型机操作数据分别含有2 060个模次,传感器每个模次含有24个传感器采集的数据,成型机操作数据每个模次有42种参数。表1为传感器部分变量数据。表2为操作过程部分变量数据。10.15925/j.cnki.issn1005-3360.2022.11.006.T001表1传感器部分变量数据Tab.1Sensor partial variable data序号采样时间/s模内压力/MPa模内温度/℃螺杆位置/cm喷嘴头射出压力/MPa公模温度/℃母模温度/℃冷却水温度/℃…单循环冷水总量/L单循环热水总量/L冷却水温度/℃105.30593.062104.51498.286869330.5…5530.520.055.34992.885104.51266.261869330.5…5530.530.105.30292.259104.51246.670869330.5…5530.540.155.33292.108104.51132.077869330.5…5530.550.205.30592.796104.51717.326869330.5…5530.5………………………………155937.147.35392.847104.63911.607869331.0…5531.0156037.197.67892.699104.63531.078869331.0…5531.0156137.247.28892.519104.63957.290869331.0…5531.0156237.297.32792.459104.63370.890869331.0…5531.0156337.347.44692.309104.64394.983869331.0…5531.010.15925/j.cnki.issn1005-3360.2022.11.006.T002表2操作过程部分变量数据Tab.2Partial variable data of operation process序号充填时间/s锁模压力/MPa螺杆料温度/℃熔胶时间/s注射最大压力/MPa模具温度/℃冷却时间/s保压时间/s…合模时间/s模具运水流量/L模具运水时间/s1113123967565513…3520002112923967565513…3520003112924067564513…3520004112924067365513…3520005112924067164513…352000………………………………2056212824077265413…3520002057212924077564413…3520002058212924067564513…3520002059212824067565513…3520002060212924077264413…352000注塑间歇过程传感器数据通常表达为一个三维矩阵X(I×J×K),x(j×I)为成型机操作数据,具有明显的高维、数量庞大且复杂的数据特性。图1为注塑间歇过程三维数据。其中,I为生产采样批次数,J为传感器采样变量,j为成型机操作变量,K为一批次中采样的总次数,y为质量指标。10.15925/j.cnki.issn1005-3360.2022.11.006.F001图1注塑间歇过程三维数据Fig.13D data of injection molding batch process质量与其他的质量指标,如收缩、翘曲、飞边、厚度等有密切的关系,并且产品的质量可以较好地表征生产过程的稳定性,质量相对容易测量[7]。因此,选择制品质量作为质量的衡量指标,单位为g。2时段划分与集成模型建立2.1基于Mini Batch K-Means算法的注塑时段划分Mini Batch K-Means算法是一种基于K-Means技术的聚类方法。K-means算法聚类中心计算公式为:μj=∑i=1mxim (1)式(1)中:xi为某一样本;m为类的样本数;μj为聚类中心。与K-Means不同,每次进行聚类迭代过程,Mini Batch K-Means不使用数据集中的所有数据,而是从数据集中随机选择一个记录子集进行距离计算,同时对聚类的结果进行优化。该方法明显减少了聚类时间,总体上减少了收敛时间,该算法适用于大型数据集。时段划分属于聚类问题,采用Mini Batch K-Means算法,结合注塑工艺过程分析不同注塑时段的数据特点,对注塑过程进行时段有效聚类。利用传感器采集数据,横向整合800批次,得到聚类数据,进行聚类处理。2.2基于随机森林的注塑工况识别随机森林是一种比较新的机器学习模型,是基于决策树集合的预测算法,集合中每棵决策树都基于输入特征的不同随机子集构建,集合的最终预测是树中的多数投票。经过阶段划分确定了注塑的阶段数,即确定了数据集的阶段标签。利用有阶段标签数据进行训练和预测,利用训练好的模型,在线识别出每一个操作子阶段,即进行工况识别。工况识别为分类问题,采用随机森林算法,分析数据内在的多工况分布特性,完成在线注塑数据样本的工况识别。应用1 000个模次传感器高频数据,随机选取800模次传感器数据作为训练集,200模次传感器数据作为测试集。采用随机森林加网格搜索算法建模。森林中树的数量(n_estimators)和树的深度(max_depth)都为1~10的整数。2.3多阶段集成模型建立集成学习的基本概念是将多个基学习器作为集成成员训练,并将它们的预测组合成一个输出,该输出在目标数据集上的平均性能应该优于其他不相关误差的集成成员[4]。利用一种Stacking集成策略,图2为分阶段Stacking集成建模策略流程图。10.15925/j.cnki.issn1005-3360.2022.11.006.F002图2分阶段Stacking集成策略流程图Fig.2Phased Stacking integration strategy flow diagram该方法将间歇生产过程多阶段特点和集成学习知识有机结合,利用集成学习知识,分别建立每个阶段的基模型,对每个阶段的基模型进行交叉验证,再将每个阶段的基模型进行集成建模,避免了单一模型的质量预测结果精度较差的问题。采用分阶段Stacking的集成方法,使用第一阶段的预测作为下一层预测的特征,可以降低机器学习模型的方差和偏差,与相互独立的预测模型相比能够呈现更强的非线性表述能力和更小的泛化误差[4]。许多算法处理对象都是二维数据,因此需要对间歇过程三维数据X(I×J×K)进行降维再集成建模。图3为注塑三维数据展开图。I为生产采样批次,J为过程变量,j为操作变量,y为质量指标,P为阶段数,m、n为阶段分界采样时刻。本实验应用分阶段Stacking集成建模策略,针对工况识别的阶段,采用不同的算法应用分阶段集成建模方法,采用梯度提升树(GBDT)、轻量梯度提升机(LightGBM)、自适应增强算法(AdaBoost)和随机森林(RF)四个效果优异的算法作为初级学习器,线性回归(LR)模型作为次级学习器,进行Stacking集成建模并预测。10.15925/j.cnki.issn1005-3360.2022.11.006.F003图3注塑三维数据展开图Fig.3Injection 3D data expansion diagram3时段划分与集成模型预测结果3.1时段划分结果利用传感器采集数据,横向整合800批次,得到聚类数据。选取Mini Batch K-Means算法的关键参数:K值。图4为聚类距离平方和曲线。从图4可以看出,inertias参数是K-Means模型对象的属性,表示样本到最近的聚类中心的距离总和,数值越小表示样本在聚类间的分布越集中。通常,inertias参数越小模型越好,但随K值的增大,inertias参数下降的速度变慢。因此,最优K值为4。10.15925/j.cnki.issn1005-3360.2022.11.006.F004图4聚类距离平方和曲线Fig.4Clustering distance square sum curve应用最佳K值,建立Mini Batch K-Means聚类模型。应用整合数据,进行标准化处理,采用Mini Batch K-Means聚类算法,划分种类数。K值取4,距离度量采用欧氏距离。图5为模具腔室压力散点图、K-Means 聚类和Mini Batch K-Means聚类效果图。从图5可以看出,注塑数据被分为四个阶段:阶段一,腔室内压力不变,为注塑过程的合模阶段;阶段二,压力不断增加,加压注射,为注塑过程的注射阶段;阶段三,压力阶段性起伏,总体保持不变的趋势,为注塑过程的保压阶段;阶段四,压力不断减小,为注塑过程的冷却阶段;最后还出现与阶段一相同的部分,因为注塑过程为不断循环、首尾相连的过程。聚类结果的四个阶段分别对应注塑过程的合模-加压注射-保压-冷却四个阶段。聚类结果的总体情况与实际情况相符合。同时,采用Mini Batch K-Means算法效果几乎与K-Means算法一致。并且采用K-Means聚类算法用时1.681 9 s,而采用Mini Batch K-Means聚类算法的用时低于K-Means算法用时的一半,为0.820 6 s,尽量不损失模型分类性能的同时,明显减少了模型分类的时间。图5模具腔室压力散点图、K-Means和Mini Batch K-Means聚类效果图Fig.5Mold cavity pressure scatter plot, K-means clustering and Mini Batch K-Means clustering effect diagram10.15925/j.cnki.issn1005-3360.2022.11.006.F5a1(a)散点图10.15925/j.cnki.issn1005-3360.2022.11.006.F5a2(b)K-Means(耗时1.681 9 s)聚类效果10.15925/j.cnki.issn1005-3360.2022.11.006.F5a3(c)Mini Batch K-Means(耗时0.820 6 s)聚类效果3.2工况识别结果经过阶段划分确定了注塑的阶段数,即确定了数据集的阶段标签。应用有阶段标签的数据进行训练和预测,利用训练好的模型,在线识别每一个操作子阶段,即进行工况识别。工况识别为分类问题,采用随机森林算法,分析数据内在的多工况分布特性,完成在线注塑数据样本的工况识别。应用1 000个模次传感器高频数据,随机选取800个模次传感器数据作为训练集,200个模次传感器数据作为测试集。采用随机森林加网格搜索算法建模。网格搜索技术优化随机森林分类模型,图6为网格搜索热力图。从图6可以看出,最大深度和树的数量越大,预测精度越好。得到的最佳参数为max_depth=9,n_estimators=6,最佳参数所得预测准确率为0.999 98,意味着50 000个注塑模次进行工况识别,才可能有1个出错,模型工况识别结果精度较高,为质量在线反馈分阶段模型做好分阶段准备工作。10.15925/j.cnki.issn1005-3360.2022.11.006.F006图6网格搜索热力图Fig.6Grid search heat map3.3模型建立模型预测的评价指标选取平均绝对误差(MAE),计算公式为:MAE=∑i=1nYi-Y^in (2)式(2)中:Y^i为预测结果;Yi为实际结果;n为样本数。3.3.1线性模型建立应用注塑过程产生的过程数据和传感器数据,进行降维、清洗等预处理,进行传统线性回归(LR)建模,利用LR模型对60批次测试集进行预测。图7为基于LR的质量预测结果。从图7可以看出,采用LR方法建模得到预测精度为0.167 5,最大绝对误差(max(f(x)-F(x)))为0.538 7。建立的LR模型的预测结果精度较差,并且误差波动大。10.15925/j.cnki.issn1005-3360.2022.11.006.F007图7基于LR的质量预测结果(MAE=0.167 5)Fig.7Mass prediction results based on LR (MAE=0.167 5)3.3.2非线性模型建立应用注塑过程产生的数据进行预处理后,采用GBDT、LightGBM、AdaBoost和RF四个非线性算法分别进行非线性建模并预测,图8为预测结果。表3为四个阶段模型预测结果的平均绝对误差和最大绝对误差。图8非线性建模质量预测结果Fig.8Nonlinear modeling mass prediction results10.15925/j.cnki.issn1005-3360.2022.11.006.F8a1(a)基于LightGBM的质量预测结果(MAE=0.049 7)10.15925/j.cnki.issn1005-3360.2022.11.006.F8a2(b)基于RF的质量预测结果(MAE=0.060 3)10.15925/j.cnki.issn1005-3360.2022.11.006.F8a3(c)基于AdaBoost的质量预测结果(MAE=0.056 4)10.15925/j.cnki.issn1005-3360.2022.11.006.F8a4(d)基于GBDT的质量预测结果(MAE=0.047 8)10.15925/j.cnki.issn1005-3360.2022.11.006.T003表3非线性模型预测结果误差Tab.3Nonlinear model prediction results error模型平均绝对误差最大绝对误差LightGBM0.04970.0418RF0.06030.0475AdaBoost0.05640.0789GBDT0.04780.0382从图8和表3可以看出,非线性模型预测拟合效果较好,精度相比线性模型预测精度高,且最大绝对误差较小,误差波动较小。3.3.3多阶段集成模型建立应用分阶段降维建模方法,针对工况识别的四个阶段采用2.3节中不同算法应用分阶段集成建模方法,进行分阶段的Stacking集成建模并预测。图9为基于时刻整合的集成建模质量预测结果。从图9可以看出,分阶段Stacking集成建模的预测结果精度达到了0.019 0,最大误差为0.037 1,质量预测结果的拟合情况较好,得到的模型预测精度较高,误差波动较小。10.15925/j.cnki.issn1005-3360.2022.11.006.F009图9基于时刻整合的集成建模质量预测结果(MAE=0.019 0)Fig.9Ensemble modeling mass prediction results based on time integration(MAE=0.019 0)表4为不同模型预测结果误差。从表4可以看出,采用线性模型预测的波动大、精度较差。采用非线性模型预测的效果相比线性得到的结果精度有所提高,误差波动减小。采用多阶段集成建模方法得到的模型精度在非线性模型基础上有所提高,最大绝对误差也有所降低。采用线性、非线性和多阶段集成方法的模型预测精度逐步提高,最大绝对误差逐步减小。采用多阶段集成方法建立的模型精度最高,效果最好。10.15925/j.cnki.issn1005-3360.2022.11.006.T004表4不同模型预测结果误差Tab.4Predicted results of different models error方法模型平均绝对误差最大绝对误差线性LR0.16750.5387非线性LightGBM0.04970.0418RF0.06030.0475AdaBoost0.05640.0789GBDT0.04780.0382多阶段集成Stacking0.01900.0371注塑过程为间歇过程,间歇生产过程无稳态工作点,从一个稳定状态转到另一个稳定状态,存在多种状态的组合,同时间歇过程固有的多变量、多工序、变量时变性、反应复杂、工序运行时间不确定性等特性,使其操作复杂度远大于连续过程,使间歇过程生产产生数据呈现复杂的非线性。而采用分阶段的集成建模方法,显著削弱了数据的非线性,提高了模型预测的精度,同时采用集成的学习方法,一定程度上也提高了模型的精度。该方法能够实现制品质量较为精确地软测量,提供较为准确的质量反馈。4结论注塑过程作为一个典型的间歇过程,具有运行状态和操作目标复杂的多阶段特性。针对注塑间歇过程多阶段的工艺特性和数据量庞大且复杂的数据特性,应用Mini Batch K-Means算法将注塑过程进行聚类,再利用随机森林进行分类预测,实现精确快速地在线识别工况。将注塑三维数据进行降维、分阶段处理,再将操作数据与过程数据相结合,采用分阶段-集成的软测量建模方法,建立在线多阶段集成软测量模型。多阶段集成软测量模型采用分阶段建模的方法明显削弱数据的非线性,预测精度相比传统线性回归模型得到提升。采用集成学习的方法,一定限度上提高模型的精度,相比非线性模型,该模型预测精度也得到提高,泛化性能均有明显提升。该方法对间歇生产过程具有一定的通用性,能够为实际注塑等间歇过程生产企业提供准确有效的在线产品质量反馈。

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读