饲料中农药的来源主要是植物饲料原料,农药残留会通过食物链传递和蓄积,最终危及人类健康[1-2],因此需要深入开展饲料原料中农药残留检测方法的研究。目前,国内对水果蔬菜中农药残留的检测方法研究较多,关于饲料中农药残留的检测方法相对较少[3]。农药残留检测方法有传统检测法、生物测定技术和光谱分析技术等。但传统检测法因其价格昂贵、操作难度高等缺点,无法大面积推广[4-6]。表面增强拉曼光谱(surface-enhanced Raman Scattering,SERS)因其灵敏度高、分子识别专一、检测实时快速等特点,在农副产品安全检测等领域广泛应用[7-8]。蒋柯[9]将表面增强拉曼技术、微流控芯片技术和化学计量学方法结合,实现了对茶叶中的毒死蜱、多菌灵和溴氰菊酯农药残留的分类。胡潇等[10]利用SERS技术检测茶叶中的农药残留,建立了支持向量机(SVM)模型,预测结果的相对误差不超过6.15%。上述研究中,模型虽均有较好的预测效果,但建模时多为人为选择特征峰[11-12],特征峰的数量及位置易受主观因素的影响,没有统一标准。SERS技术在饲料中农药残留快速检测中具有较大的潜力,但目前尚无有关利用SERS检测青贮玉米原料中农药残留的研究。因此,本试验利用拉曼光谱技术结合线性判别式分析(LDA)-支持向量机(SVM)、卷积神经网络(CNN)两种分类算法,对青贮玉米原料中常用3种农药(苯醚甲环唑、多菌灵、啶酰菌胺)残留进行识别,为饲料安全检测提供一定参考。1材料与方法1.1材料与仪器青贮玉米原料为糯玉米,购自市场;苯醚甲环唑悬浮剂有效成分总含量为40%,多菌灵悬浮剂有效成分总含量为50%,购自农满利商贸公司;啶酰菌胺水分散粒剂有效成分总含量为50%,购自中保绿农科技集团有限公司;丙酮、异丙醇、氯化钠、纯水,分析纯,购自北京化工厂;SERS芯片购自台湾五铃光学股份有限公司。RAPID-785便携式激光拉曼光谱仪购自台湾五铃光学股份有限公司,波长范围800~940 nm,波数范围200~2 000 cm-1,分辨率为10 cm-1带50 μm狭缝或4.5 cm-1带25 μm狭缝,激发波长为785 nm,样品斑点小于50 μm。试验前用硅片基板对拉曼光谱仪进行峰位校准。1.2测定指标及方法1.2.1样品的制备将苯醚甲环唑、多菌灵、啶酰菌胺制剂使用超纯水进行稀释,分别配制为0.1、10、100 mg/kg的溶液作为标准溶液。将苯醚甲环唑、多菌灵、啶酰菌胺制剂使用超纯水进行稀释,分别配制为0.1、0.5、0.9、1.4、10.0、15.0、20.0、80.0、90.0、100.0 mg/kg的溶液作为对比样本。将长度为2~3 cm的青贮玉米原料使用超纯水进行清洗处理,分别将各组样本在不同浓度的3种农药中浸泡3 min后捞出[13],沥干水分。1.2.2光谱数据的采集将萃取液(异丙醇)由上至下对含有农药的青贮玉米原料淋洗2次,取出萃取液于小试管中,与350 μL丙酮混合反应后取出400 μL去水液,反应30~60 s,取300 μL上清液;以风扇浓缩法浓缩8 min至40~60 μL,随即加入丙酮,排吸混合5次,静置1 min,取上清液至芯片,待1 min反应后滴加增强液(10 mg/kg氯化钠);将芯片样本置于暗箱中检测180 s[14]。3种农药每种浓度设置3个平行样本,每个样本检测3次取平均值作为最终的拉曼光谱数据,共计得到拉曼光谱数据90条。试验仪器的各项参数设置为激光波长780 nm、激光能量30 MW、分辨率10 cm-1、采集曝光时间500 ms。样本前处理流程见图1。10.13557/j.cnki.issn1002-2813.2023.11.026.F001图1样本前处理流程1.3分类识别模型的建立1.3.1基于LDA-SVM的分类模型本研究采用LDA降维算法对前文拉曼光谱检测试验得到的农药残留SERS光谱数据进行降维,采用SVM分类器对降维后的数据建模。支持向量机的中心思想是找到距分类样本点间隔最大的分类超平面,判别函数为:f(x)=sgn(∑i=1mαiyik(xi,x)+b) (1)式中:αi为Lagrange乘子;yi为类别标签;k(xi,x)为核函数;b为阈值[15]。本文以60个光谱数据作为训练集进行训练建模,30个光谱数据作为测试集进行模型测试,按照2∶1从三类数据中分别随机抽取光谱样本。在利用SVM进行分类时,选择高斯径向基(RBF)作为SVM的核函数。1.3.2基于卷积神经网络的分类模型本文采用含有3种农药残留的90个拉曼光谱样本通过小波包分解生成相应的时频特性图,按照比例从三类数据中分别随机抽取光谱样本作为卷积神经网络的输入,通过特征自提取进一步对农残类型进行判断。结合SERS光谱数据的特点[15-16],本文自行搭建了基于VGG16框架的自定义CNN模型,VGG16的典型特点是卷积层全部采用3×3的卷积核,本文根据具体问题进行了优化,如加入了批量归一化(BN)处理层,并省略了一些3×3的卷积层。模型内部包含卷积层、池化层、BN层、Relu层、全连接层和SoftMax层等。本试验重新设计的卷积神经网络结构见图2。10.13557/j.cnki.issn1002-2813.2023.11.026.F002图2卷积神经网络结构其中ReLU函数又被称为修正线性单元,解析式如公式(2)所示[17-19]。该函数可使神经网络的神经元具有稀疏激活性,更好地挖掘相关特征,拟合训练数据,提升计算速度[20-21]。f(x)=x, x≥00, x0 (2)多分类中交叉熵损失函数的表达式为:L=1N∑i-∑k=1Myiklog(pik) (3)式中:N为数据总量;M是类别数;yik为指示变量,若该类别和样本i的类别相同该值为1,否则为0;pik为观测样本i属于类别k的预测概率。交叉熵的值越小表明预测值与真实值越接近,模型的分类效果越好。进行训练时,需把一维光谱数据转换为二维矩阵,转换方法采用的是连续小波变换,即把信号转换为了80×80的矩阵,再将二维矩阵输入CNN中进行训练和分类。本文的卷积神经网络使用交叉熵作为损失函数,通过引入的BN层、SGDM优化器和dropout层算法优化网络。训练集和预测集中数据数量分别为60和30。引入SGDM优化器训练CNN,能够加快模型的收敛速度,学习率默认设置为10-5,迭代次数(epoch)设置为120次后开始训练模型。训练过程中训练集和预测集的损失函数及准确率的变化趋势见图3。由图3可知,在迭代100次后模型达到收敛。图3CNN模型预测集准确率、损失函数变化趋势10.13557/j.cnki.issn1002-2813.2023.11.026.F3a1(a)准确率 (b) 损失函数2结果与分析2.1青贮玉米原料与3种农药的谱带归属在拉曼光谱中,不同位置的拉曼峰代表不同化学键,从而通过拉曼光谱确定分子的结构[4,22]。苯醚甲环唑、多菌灵和啶酰菌胺原药采集的拉曼光谱见图4。10.13557/j.cnki.issn1002-2813.2023.11.026.F004图4纯药样本的拉曼光谱由图4(a)可知,苯醚甲环唑主要在701、1 006、1 092、1 127 cm-1处出现拉曼峰谱,分别归属于4-氯苯基醚本身的呼吸振动、C—O—C的非对称伸缩振动、4-氯苯基醚上C—Cl基团的伸缩振动及本身的呼吸振动和C—N的伸缩振动[23-26]。由图4(b)可知,多菌灵主要在1 032、1 229 cm-1处出现拉曼峰谱,分别归属于C—C原子的伸缩振动,同时伴有C—H的面内弯曲振动、C—N伸缩振动和苯并咪唑环上C—H面内弯曲振动[27-29]。由图4(c)可知,啶酰菌胺主要在1 237、1 292 cm-1处出现拉曼峰谱,分别归属于面内C—H变形振动和酰胺Ⅲ谱带振动[25]。从图4(d)可知,青贮玉米原料中没有明显的拉曼峰,520 cm-1处为SERS基板下层的硅基板本身的拉曼信号[14]。检测发现,异丙醇主要特征峰在819、953、1 454 cm-1处,丙酮主要特征峰在797、1 071、1 231、1 422 cm-1处,与文献[30]中结果一致。因此,有机溶剂不会引入干扰。从苯醚甲环唑、多菌灵和啶酰菌胺的SERS光谱可知,不同农药的光谱特征峰存在明显差异。2.2光谱数据的预处理结果表面增强拉曼光谱数据分别采用SG平滑法、二阶导数法、airPLS自适应迭代重加权惩罚最小二乘法以及两种算法相结合的方式进行光谱数据的预处理,旨在提高分辨率和提取特征峰,尽可能减小光谱变换带来的噪声影响[31-32]。SG平滑法是多种平滑处理中最常用的一种方法,过度平滑容易导致信号失真,丢失重要的光谱数据信息,平滑多项式次数较小去除噪声的效果较差。因此,选择适当的平滑点数对建模效果非常重要。本文最终采用5点平滑进行光谱预处理。二阶导数法可用于消除光谱中基线的漂移问题,强化谱带的特征,克服谱带的重叠,得到更清晰的光谱轮廓[26]。airPLS是惩罚最小二乘法结合自适应迭代加权得到的一种背景扣除的算法[33],试验中设置参数λ=107。预处理方法处理后的青贮玉米原料中农药残留的拉曼光谱见图5。10.13557/j.cnki.issn1002-2813.2023.11.026.F005图5预处理方法处理后的青贮玉米原料中农药残留的拉曼光谱由图5可知,SG平滑方法除去了大部分系统噪声,使曲线较为平滑,SG法去噪后再使用airPLS法基线校正后的拉曼光谱图,很好地剔除了荧光背景,有效提高了特征峰的对比度[34]。经过预处理,可以有效去噪和去除荧光背景,因此在之后的分析中均采用预处理后的拉曼光谱。2.3青贮玉米原料中农药残留的SERS光谱数据分析青贮玉米原料中不同水平农药溶液的表面增强拉曼光谱见图6。将原始光谱经过SG-airPLS预处理,以扣除荧光背景。10.13557/j.cnki.issn1002-2813.2023.11.026.F006图6青贮玉米原料中不同水平农药的拉曼光谱由图6(a)可知,随着苯醚甲环唑溶液的浓度降低,在1 127 cm-1处的特征峰强度呈逐渐减弱的趋势,且浓度为0.1 mg/kg时,1 127 cm-1处的谱峰信号仍然明显,因此使用SERS方法对青贮玉米原料中苯醚甲环唑农药的最低检测限为0.1 mg/kg[35]。由图6(b)可知,随着多菌灵溶液浓度降低,在1 032、1 229 cm-1处的特征峰强度呈逐渐减弱的趋势,当多菌灵浓度在0.1 mg/kg时,1 229 cm-1处的谱峰信号依然清晰,因此使用SERS方法对青贮玉米原料中的多菌灵农药的最低检测限为0.1 mg/kg[35]。由图6(c)可知,随着啶酰菌胺溶液的浓度降低,在1 237 cm-1处的啶酰菌胺SERS特征峰强度呈逐渐减弱的趋势,当啶酰菌胺浓度在0.1 mg/kg时,谱峰信号依然清晰,因此使用SERS方法对青贮玉米中啶酰菌胺农药的最低检测限为0.1 mg/kg[35]。2.4青贮玉米原料中农残分类模型结果对比2.4.1光谱预处理对不同分类方法的影响不同分类模型检测性能对比结果见表1。由表1可知,拉曼光谱数据经过基线校正或平滑滤波处理后,两种分析方法的分类正确率均得到不同程度提升,分类正确率提升最明显的是SG平滑滤波处理、airPLS基线校正后的LDA+SVM模型,由33.33%提高至 86.67%。通过以上实验分析,拉曼光谱的基线校正和平滑滤波预处理步骤均可显著提高传统光谱分类方法的分类正确率,其中SG-AirPLS预处理方法对两种光谱分类模型效果的提升最明显。二阶导数法虽然可用于消除光谱中基线的漂移问题,强化谱带的特征,克服谱带的重叠,得到更清晰的光谱轮廓,但求导的同时会引入噪声,降低信噪比,利用二阶导数进行预处理后的分类模型效果最差。10.13557/j.cnki.issn1002-2813.2023.11.026.T001表1不同分类模型预测性能对比预处理分类算法训练集预测集二阶导数LDA+SVM33.3333.33CNN60.0033.33S-GLDA+SVM90.0083.33CNN81.6780.00airPLSLDA+SVM93.3376.67CNN98.3370.00二阶导数+S-GLDA+SVM33.3333.33CNN58.3333.33S-G-airPLSLDA+SVM93.3386.67CNN91.6783.33%2.4.2模型性能对比结果基于SG-airPL- CNN的预测分类结果见图7。基于SG-airPLS-LDA-SVM的预测集分类结果见图8。10.13557/j.cnki.issn1002-2813.2023.11.026.F007图7基于SG-airPL-CNN的预测分类结果10.13557/j.cnki.issn1002-2813.2023.11.026.F008图8基于SG-airPLS-LDA-SVM的预测集分类结果由图7~图8可知,SG-airPLS-LDA-SVM方法对训练集和预测集中3种农药的识别准确率分别为93.33%和86.67%。对于苯醚甲环唑的预测准确率为70%,对于多菌灵的预测集准确率为100%,对于啶酰菌胺的预测集准确率为90%。将LDA与SVM融合方法应用于农药残留的多分类中,最大限度地利用已有的先验知识,在保证数据特征的条件下,采用LDA有效降低了拉曼光谱的高维数据,在预测集上的分类准确率达到86.67%,效果良好,未产生明显的欠拟合或过拟合效应。SVM模型采用高斯径向基(RBF)核函数,惩罚系数c和核参数gamma分别设置为5.0和2.1。该算法可有效克服收敛难、模型不稳定以及推广性差的缺点,在涉及小样本数,非线性和高维数据空间的模式识别问题上表现出许多模式识别算法所不具备的优势[36]。SG-airPLS-CNN方法训练集和预测集的准确率分别为91.67%和83.33%。对于苯醚甲环唑的预测集的准确率为60%,对于多菌灵的预测集的准确率为100%,对啶酰菌胺的预测集的准确率为90%,综合准确率较低。文中搭建VGG16模型的网络架构较深,虽然提高了模型的学习能力,但是增加了模型复杂度,训练耗费的时间较长,较多的池化层也增加了信息丢失的风险,虽然采用小尺寸卷积核(3×3)可降低信息丢失的风险[37],但网络结构庞大,训练权值多,因此需要海量的训练数据进行训练,由于本文在应用中受存储空间、获取样本时间等限制,训练样本不足,可能是直接影响相应模型识别准确率的主要因素 。3结论本试验发现,拉曼峰1 127、1 229、1 237 cm-1分别作为识别苯醚甲环唑、多菌灵和啶酰菌胺的拉曼特征峰,当青贮玉米原料中3种农药残留的含量分别为0.1 mg/kg时,各农药相应的特征峰仍清晰可见。低于所参考的食品安全国家标准规定的大白菜中苯醚甲环唑农药残留最高限量标准1 mg/kg、绿叶类蔬菜中多菌灵农药残留最高限量标准5 mg/kg、蔬菜茄果类中啶酰菌胺农药残留最高限量标准3 mg/kg。采用SG平滑法、二阶导数法、airPLS以及SG-airPLS进行光谱数据的预处理。采用LDA-SVM、CNN两种分类模型对光谱进行分类。结果表明,SG-airPLS方法预处理后的LDA-SVM分类模型可以识别所有样本且准确度为86.67%。因此,SERS和SG-airPLS-LDA-SVM方法结合可用于青贮玉米原料中农药种类的准确快速识别。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览