边坡是天然或者人工开挖形成的斜坡,是人类工程活动中最基本的地质环境之一.边坡变形过程复杂,且受到各种复杂因素影响,使得边坡失稳预测一直没有达到较好的效果,因此对边坡稳定性进行精准预测并对失稳做出预警具有非常重大的意义.对于边坡稳定性的评价,目前常用的工程类比法、极限平衡法和数值分析法等都存在一定的局限性[1].随着人工智能、机器学习等新兴学科的发展,智能数据处理方法开始在边坡变形分析与处理中得到应用和发展,为边坡稳定性分析开辟了新的方向[2].常用的机器学习模型有神经网络[3]、决策树[4]、随机森林[5]和支持向量机[6-10]等.相比于其他机器学习算法,支持向量机算法(SVM)基于核函数理论,将样本映射到高维空间,在处理小样本、高维度、非线性的问题上具有独特的优势,文献[6]比较了6种人工智能方法在边坡稳定性预测的分类问题,SVM的预测性能最好,结果满足实际工程需要.但在实际应用中,SVM模型的预测性能很大程度上依赖于参数选择,很多群体智能优化算法被应用于SVM参数寻优,如粒子群算法[7]、遗传算法[8]、灰狼优化算法[9]和布谷鸟搜索算法[10]等,但这些优化算法均存在一定缺陷,如易陷入局部最优、运行时间较长、不能充分反馈信息等,无法取得最优预测性能.文献[11]提出一种群体智能优化算法麻雀搜索算法(SSA),该算法主要是受麻雀的觅食行为和反捕食行为启发,相比传统优化算法,具有搜索精度高、收敛速度快、全局寻优能力和局部开发能力强等优点.本研究在搜集整理国内外边坡案例数据的基础上,建立边坡预测数据库.采用SSA对SVM的惩罚参数C和核函数参数g进行全局寻优,构建SSA-SVM边坡失稳智能预测模型;同时与采用其他算法优化SVM模型进行对比,以检验SSA算法在参数寻优上的精度高、易全局优化和SSA-SVM模型在边坡失稳预测上的准确性高、模型稳定等优点.在SSA-SVM边坡失稳智能预测模型的基础上,对稳定边坡的失稳概率进行预测,并依据预测的边坡失稳概率对边坡失稳做出相应预警等级,为边坡失稳智能预测预警提供新的研究方法.1 边坡数据库建立与特性分析1.1 边坡数据库建立当利用机器学习方法进行边坡失稳预测研究时,数据库是一个非常关键的因素.为了使模型预测性能更好且预测结果更有说服力,本研究使用不同文献中公开且具有代表性的数据构成数据库,这些数据包含大量的不同类型边坡,并已广泛应用于边坡预测.选用文献[4,12-13]中304个边坡历史案例建立数据库,其中稳定和失稳边坡的数量分别为163个和141个,如表1所示,但因篇幅有限,只能放下若干.研究表明:高度(H)、坡角(α)、容重(γ)、黏聚力(c)、内摩擦角(φ)和孔隙压力比(ru)是影响边坡稳定的重要参数[4].边坡的高度、坡角和容重是边坡的物理几何参数,边坡的物理几何属性是影响边坡稳定性的重要因素之一;根据摩尔-库仑强度理论,黏聚力和内摩擦角是与边坡稳定性相关的两个重要力学参数;孔隙压力比是考虑外部作用的因素,其定义为孔隙水压与覆盖层压力之比,所选择的参数与每个边坡的几何形状和岩土特性有关,对边坡稳定性都有很大的影响.10.13245/j.hust.221118.T001表1SSA-SVM边坡失稳预测模型数据库编号边坡参数边坡状态H/(m)α/(°)γ/(kn∙m-3)c/(kPa)φ/(°)ru11030.022.0010.0035.00.29稳定21545.023.00100.0045.00.25失稳38840.222.3020.1031.00.19稳定410035.028.4429.4235.00.31稳定511540.016.0070.0020.00.31失稳615035.027.0027.3029.10.26失稳718437.027.0027.3029.10.22失稳820030.026.00150.0045.00.31稳定921347.031.3068.0037.00.31失稳1036646.031.3068.0037.00.31失稳⋮30447040.027.3010.0039.00.31稳定1.2 边坡数据统计特性和相关性分析1.2.1 影响因素的统计特性图1展示了304个边坡历史案例每个影响因素的小提琴图,小提琴图是箱线图和密度图的结合,既表现了箱线图所展现出的一组数据分散情况统计,又提供了各个影响因素的数据分布密度,较宽的小提琴曲线对应于较高的密度,可以明显看出各个因素的集中分布区域.10.13245/j.hust.221118.F001图1边坡6个属性数据的小提琴图根据图1(a)~(c)可以看出:黏聚力、高度和孔隙压力比这三个特征的数据集中分布在一个特定区间,且存在个别极值数据.图1(d)中内摩擦角的数据分布呈现为正态分布趋势,图1(e)和(f)中容重和边坡角度的数据分布特点是在各自区间内呈现较均匀的分布.从边坡高度的分布来看,低边坡、中等边坡、高边坡及超高边坡都有相应的边坡案例;从边坡坡角的分布来看,数据库包含缓坡、中等坡及陡坡;综合边坡内摩擦角、黏聚力和容重来看,数据库包含岩质类型和土质类型的边坡,以及含有不同岩性的边坡.通过综合边坡各个影响因素的分析可知,数据库是由完全不同类型的边坡构成.1.2.2 相关性分析采用皮尔森系数进行数据相关性分析,从图1可以看出,除内摩擦角以外的5个边坡特征数据呈非正态分布,因此首先通过Box-Cox方法将所有边坡特征的数据进行转换[4],使数据分布逼近正态分布,然后对这些特征进行相关性分析.这些边坡特征之间的分布及各个特征之间的关系如图2的相关性矩阵图所示,图中:对角线为单个边坡特征的分布直方图;右上角展示的为两个边坡特征之间的相关性系数及分布;左下角展示的为两个边坡特征的分布密度图.10.13245/j.hust.221118.F002图2边坡特征的相关性矩阵从图2中可以明显看出:孔隙压力比与高度、坡角、容重、黏聚力、内摩擦角这5个参数之间的相关性系数均小于0.2,可以认为相关性非常小,而其他5个参数之间的相关性系数都大于0.2,孔隙压力比是一个定义的边坡参数,其他5个参数属于边坡的固有属性,所以可能导致孔隙压力比与其他参数之间展现出比较小的相关性,而其他5个参数之间具有一定的关联性.这5个参数之间相关性系数较大的为高度和容重、坡角和内摩擦角,分别为0.540和0.523,总体来看,所有相关性系数均小于0.600.综上,所有参数间的相关性程度非强相关,可以采用上述6个参数对边坡状态做出预测.综合边坡6个影响因素的统计特性分析和相关性分析,图1的统计特性分析结果显示每个特征都呈现不同分布,分布的跨度区间比较大,说明数据库中包含不同高度、不同坡角、不同岩性和不同类型的边坡,图2的相关性分析结果说明6个影响因素可以同时被采用对边坡状态进行预测.通过采用完全不同类型的边坡,利用其共有的边坡特性进行边坡失稳预测,一方面体现了所有边坡案例数据之间没有一定的关联性,另一方面更能体现机器学习算法处理非线性数据的强大能力.2 SSA-SVM预测模型2.1 SSA算法原理SSA算法原理为:不同类型的麻雀对应一个优化问题的解,在觅食过程中,通过不断更新发现者、跟随者和警戒者的位置,完成资源的获取,寻找到问题的全局最优解[11].发现者的位置更新描述为Xi,je+1=Xi,jeexp[-i/(αD)] (R2∈(0,S));Xi,je+QL (R2∈[S,1)),式中:e为当前迭代数;j=1,2,…,d,其中d为待优化问题变量的维数;D为常数,表示最大迭代次数;Xij为第i个麻雀在第j维中的位置信息;α∈(0,1]为一个随机数;R2(R2∈[0,1])和S(S∈[0.5,1])分别为预警值和安全值;Q为服从正态分布的随机数;L为1×d的矩阵,该矩阵内每个元素均为1.加入者的位置更新描述为Xi,je+1=Qexp[(Xworst-Xi,je)/i2] (i∈(m/2,+∞));Xpe+1+Xi,je-Xpe+1⋅A+⋅L (i∈(0,m/2]),式中:Xp为目前发现者所占据的最优位置;Xworst为当前全局最差的位置;A为一个1×d的矩阵,其中每个元素随机赋值为1或-1,且有A+=AT(AAT)-1;m为麻雀数量,当im/2时,表明适应度值较低的第i个加入者没有获得食物,处于十分饥饿的状态,此时须要飞往其他地方觅食,以获得更多的能量.警戒者的位置更新描述为Xi,je+1=Xbeste+βXi,je-Xbeste(fi∈(fg,+∞));Xi,je+KXi,je-Xworste(fi-fw)+ε(fi=fg),式中:Xbest为当前的全局最优位置;β为步长控制参数,服从均值为0,方差为1的正态分布的随机数;K∈[-1,1]为一个随机数;fi为当前麻雀个体的适应度值;fg和fw分别为当前全局最佳和最差的适应度值;ε为最小的常数,目的是避免分母出现零.2.2 SVM分类原理SVM基本思想是通过一个非线性变换将输入空间对应于一个特征空间,使得在输入空间中的决策超曲面模型对应于特征空间中的决策超平面模型[14].假定边坡的训练数据集L为L={(t1,z1),(t2,z2),…,(tn,zn)},(1)式中:tn(n=1,2,…,N)为第n个特征向量,即边坡的特征;zn为tn的类标签,且zn∈{-1,+1},边坡稳定的标签视为+1,失稳的标签视为-1.SVM的目标是寻找最优超平面wt+b=0,其中,w为法向量,b为截距,使每一类数据支持向量之间的分类间隔达到最大.寻找最优超平面的过程就是求解如下的凸二次规划问题,即G(w,b,ξ)=min12w2+C∑n=1Nξn;(2)s.t. zn(w⋅tn+b)≥-ξn,ξn≥0(n=1,2,⋯,N),(3)式中:G(w,b,ζ)为分类间隔;C为惩罚参数,且C0;ζn为松弛变量.可以通过拉格朗日乘子法对式(2)求解,得到分类超平面和分类模型的函数表达式为∑n=1Nan*zn(t⋅tn)+b*=0;(4)f(t)=sgn∑n=1Nan*zn(t⋅tn)+b*,(5)式中:an(n=1,2,…,N)为拉格朗日向量;f(t)为分类模型函数表达式.SVM通过引入核函数的方法来求解式(5)的内积问题,即H(tn,tq)=exp-gtn-tq2,(6)式中:H(tn,tq)为径向基核函数;g为带宽,且g0.此情况下分类模型的函数表达式为f(t)=sgn∑n=1Nan*znexp(-gt-tn2)+b*.(7)惩罚参数C和核函数参数g是影响SVM分类效果的主要因素,本研究采用智能优化算法SSA对这两个参数的进行全局寻优,构建SSA-SVM边坡失稳智能预测模型.2.3 SSA-SVM边坡失稳智能预测模型如图3所示,将边坡数据库中的数据按8︰2的比例随机分为两部分,其中,80%的数据作为训练集,20%作为测试集.以边坡高度等6个参数定义为SVM模型的输入变量,边坡状态为输出变量,采用智能优化算法SSA对SVM的两个关键参数C和g进行全局寻优,建立SSA-SVM边坡失稳智能预测模型,同时与灰狼优化算法(GWO)、粒子群算法(PSO)、遗传算法(GA)、哈里斯鹰优化算法(HHO)、鲸鱼优化算法(WOA)和布谷鸟搜索算法(CS)分别优化的SVM模型在评价指标下进行对比.10.13245/j.hust.221118.F003图3基于SSA-SVM的边坡失稳智能预测模型SSA优化SVM实现过程为:初始化SSA-SVM模型参数,以SVM模型预测准确率作为SSA算法的适应度函数,依据SSA算法原理,更新发现者、跟随者和警戒者的位置,寻找最优的函数值,即确定最佳麻雀个体位置,根据最佳麻雀个体位置得到参数C和g的最优值,从而建立SSA-SVM边坡失稳智能预测模型.2.4 模型性能评估本研究采用多个指标对优化模型的性能进行评估.受试者工作特征曲线(ROC)是一种基于量化指标来评估模型整体性能的指标,ROC曲线下的面积用AUC值表示,主要用于衡量模型的泛化性能,即分类效果的好坏,可以定量比较模型的好坏.采用准确率(accuracy)来衡量各个模型对数据集中的样本预测正确比例,采用精确率(precision)来表示预测为正样本中真正样本所占比例.另外,采用F1分数(F1-score)和平均精度分数(AP-score)评估分类器的输出质量,F1-score是精确率和召回率的一种调和平均,AP-score是对不同召回率点上的正确率进行平均.3 对比分析及SSA-SVM模型检验为了检验SSA算法的性能及SSA-SVM模型在边坡失稳预测的适用性,采用6个经典优化算法对SVM模型进行参数寻优,与SSA-SVM模型在准确率、精确率、F1分数、平均精度分数及AUC值等多个评估指标下进行对比.准确率反映了对边坡稳定性状态的识别情况,模型准确率通常指的是模型测试集的准确率.表2展示了不同算法优化SVM模型所得到的训练集准确率和测试集准确率及差值.由于训练集和测试集的数据比例为8︰2,因此模型在训练集的大量数据中会有更好的学习,训练集的准确率一般大于测试集.SSA-SVM模型的训练集准确率为91.36%,其他优化模型的训练集准确率均在97.00%以上.SSA-SVM模型的训练集准确率与测试集准确率相差1.20%,其他优化模型中最小的优化算法其测试集与训练集准确率差为8.60%,其他6个优化模型在训练集上表现出非常好的分类能力,但在测试集上的分类能力急剧下降,说明这6个优化模型在训练集上出现了过拟合问题,SSA-SVM边坡失稳智能预测模型性能更稳定.10.13245/j.hust.221118.T002表2各优化模型的准确率及差值模型训练集测试集差值SSA-SVM91.3690.161.20GWO-SVM97.9488.529.42GA-SVM97.1288.528.60CS-SVM97.9488.529.42PSO-SVM97.5388.529.01HHO-SVM97.9488.529.42WOA-SVM97.9488.529.42%SSA-SVM模型的测试集准确率达到了90.16%,而其他优化模型的测试集准确率为88.52%,SSA-SVM模型比其他6个优化模型具有更好的预测分类性能,SSA算法在SVM模型全局参数寻优方面相比其他优化算法更强.模型的其他评估指标结果如表3所示,可以看出SSA-SVM模型的各个评估指标都高于其他优化模型.精确率指的是当边坡预测结果为稳定时,实际的稳定边坡所占比例,该评价指标更直接反映了稳定边坡的预测情况,F1分数、平均精度分数及AUC值这三个评价指标则反映了模型的性能.10.13245/j.hust.221118.T003表3各个优化模型的性能评估指标结果模型精确率/%F1分数/%平均精度分数/%AUC值SSA-SVM94.2891.4396.790.954GWO-SVM87.1890.6795.840.941GA-SVM87.1890.6795.590.934CS-SVM87.1890.6795.840.941PSO-SVM89.1990.4196.050.941HHO-SVM87.1890.6795.990.942WOA-SVM89.1990.4196.130.943SSA-SVM边坡失稳智能预测模型的精确率为94.28%,其他优化模型的分别为89.19%和87.18%,SSA-SVM比其他优化模型在边坡失稳预测上具有更高的可靠性.精确率越大,模型把失稳状态的边坡预测为稳定的概率越小,如果对失稳边坡误识别,所影响的不仅是模型的准确率和精确率,对实际边坡情况的错误判断还会带来不可预计的破坏后果.F1分数和平均精度分数也说明SSA-SVM边坡失稳智能预测模型的性能明显好于其他优化模型.各个优化模型的ROC曲线如图4所示,图中:T为真正率;F为假正率.图形越接近左上角表明模型越好.10.13245/j.hust.221118.F004图4各个优化模型的ROC曲线图对于SSA-SVM,GWO-SVM,GA-SVM,CS-SVM,PSO-SVM,HHO-SVM和WOA-SVM这7个模型,ROC曲线下面积分别计算为0.954,0.941,0.934,0.941,0.941,0.942和0.943,AUC值在很大程度上表征了模型性能的好坏,其中1代表模型的理想性能,AUC值大于0.9则表示模型是一个较好的模型,越接近于1,模型的性能越好.这7个模型的AUC均大于0.9,最小值都达到了0.934,说明SVM模型非常适合边坡失稳预测.SSA-SVM边坡失稳智能预测模型的AUC最高,达到了0.954,相比于其他优化算法,SSA算法在对SVM参数全局寻优中表现更出色.4 边坡失稳智能预警模型基于SSA-SVM边坡失稳智能预测模型,对于预测正确的稳定边坡,进一步预测其边坡失稳概率,依据边坡失稳概率对不同稳定性的边坡做出相应预警,构建边坡失稳智能预警模型.数据库测试集中含有61个边坡样本案例,SSA-SVM边坡失稳智能预测模型中共有55个边坡样本预测正确,其中包含32个稳定边坡和23个失稳边坡.模型对每个边坡样本的稳定与否均有一个预测概率,若预测的稳定概率大于0.5,则边坡预测结果为稳定,否则边坡预测结果为失稳.图5为SSA-SVM模型对边坡的预测概率分布图,图中:P为预测的概率;DF为分布的频率.10.13245/j.hust.221118.F005图5SSA-SVM模型对边坡的预测概率分布图5中的红色柱状图展示了预测正确的全部55个边坡的预测概率分布,其中,75%的边坡预测概率在[0.7,0.9]之间,25%的边坡预测概率在[0.5,0.7)之间.图5中的蓝色柱状图表示预测正确的32个稳定边坡的预测概率分布,其预测概率分布与预测正确的全部55个边坡的预测概率分布基本一致,其中,76%的边坡其预测概率在[0.7,0.9]之间,24%的边坡其预测概率在[0.5,0.7)之间.预测正确的32个稳定边坡其预测概率分布区间为[0.5,0.6),[0.6,0.7),[0.7,0.8)和[0.8,0.9],各个区间的频率分别为0.11,0.13,0.22和0.54.根据预测的边坡失稳概率,对不同稳定性的边坡做出不同预警[15],具体划分如表4所示.当预测的边坡失稳概率在[0.4,0.5)之间时,属于一级预警,预警等级为红色;当预测的边坡失稳概率在[0.3,0.4)之间时,属于二级预警,预警等级为橙色;当预测的边坡失稳概率在[0.2,0.3)之间时,属于三级预警,预警等级为黄色;当预测的边坡失稳概率小于0.2时,属于四级预警,预警等级为蓝色.10.13245/j.hust.221118.T004表4边坡失稳预警等级预警等级险情预报预测的失稳概率红一级预警[0.4,0.5)橙二级预警[0.3,0.4)黄三级预警[0.2,0.3)蓝四级预警[0.0,0.2)综合上述分析可知:SSA-SVM模型对边坡失稳具有较好的预测精度,且其对边坡的预测概率呈现一致的分布趋势,基于以上构建边坡失稳智能预警模型.构建流程为:基于SSA对SVM智能优化,建立准确率高、模型稳定的SSA-SVM边坡失稳智能预测模型.对预测正确的稳定边坡,进一步得到预测的失稳概率,根据失稳预警等级做出相应预警.须要注意的是:虽然SSA-SVM模型在众多算法优化SVM模型中达到最高的准确率90%,但是依然可能将稳定边坡预测错误,边坡失稳智能预警模型适用于预测正确的稳定边坡.5 结论a.基于边坡案例数据建立边坡预测数据库,采用智能优化算法SSA优化SVM,构建SSA-SVM边坡失稳智能预测模型.模型预测精度高,其准确率和精确率分别为90.16%和94.28%,可以有效对边坡失稳进行预测.SSA-SVM模型的AUC值、平均精度分数和F1分数分别达到了0.954,96.79%和91.43%,具有非常好的稳定性和泛化能力.b.通过对各个优化算法模型的准确率、精确率、F1分数、平均精度分数及AUC值等指标进行比较,SSA优化的SVM模型比其他6个算法优化的模型都有更高的分数,在对SVM模型的参数寻优方面,SSA算法比其他优化算法表现更出色.c.基于SSA-SVM边坡失稳智能预测模型,对预测正确的稳定边坡,得到其预测的失稳概率,依据失稳概率对不同稳定性的边坡分别做出4级不同预警,构建边坡失稳智能预警模型,为边坡失稳预警提供一定参考.
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览