地下水污染不但影响着我国主要饮用水来源,而且成为我国地表水体污染的另一主要来源[1].2019年,中国生态环境部联合自然资源部、水利部等四个部门颁布《地下水污染防治实施方案》.地下水污染源识别可根据已有调查数据,对污染物泄露位置及泄露情况进行识别,这也解决了传统方法中出现的观测耗时耗力、观测误差导致结果偏差较大等一系列问题[2-3].地下水污染源识别方法是现今讨论的热门,本研究将综述地下水污染源识别贝叶斯推理方法的研究进展及贝叶斯推理方法与其他方法的比较,总结贝叶斯推理方法的优势,并分析这些方法在实际案例中存在的问题.1 地下水污染源识别问题碍于技术原因,早期地下水调查工作很少考虑到溶质迁移相关方面,这类问题只在研究海水入侵时遇到[4].1960年以前,研究人员通常使用的分析方法是对流计算,即假设溶质以地下水平均速度运动,不受吸附作用、动力反应及其他作用的影响.一般的迁移问题,以及某些孔隙介质中的迁移问题,都被看作是化学工程领域的研究内容.自20世纪60年代对流-弥散迁移理论持续发展开始,研究者认识到,不能以平均速度描述单个溶质粒子的运动,因此对流计算不能充分描述溶质的运动.随即,包含水动力弥散统计理论、弥散试验及其理论、吸附过程表达式在内的迁移理论开始发展.随着计算机技术不断突破,地下水溶质迁移模型飞速发展的时期于20世纪70年代正式到来.由以Reddell和Sunada为首[5]的数位学者于同期提出了三维地下水溶质迁移方程,其数学表达式为      ∂(θCk)∂t=∂∂xiθDij∂Ck∂xj-∂∂xi(θCkVi)+qsCsk+∑Rn, (1)式中:Ck为物质k的溶质浓度;θ为地下介质孔隙度;t为时间;xi,xj为沿笛卡尔坐标系的距离;Dij为水动力弥散系数张量;Vi为渗流或线性孔隙水流速度,它与单位流量或达西流量(qi)有关;qs为单位体积含水层源(正值)和汇(负值)的体积流量;Csk为源汇流中物质k的浓度;∑Rn为化学反应项.在初始条件及边界情况给定的情况下,可通过解析法或数值求解等对式(1)进行求解以得到污染物的时空分布情况.地下水污染源识别是利用观测到的污染物信息,对污染物来源及扩散情况进行溯源重现的问题,与一般的已知源头寻找路径的问题不同,污染物识别问题被称为反问题.反问题的求解理论最早由Neuman[6]引入水文领域,Eileen[7]随后提出反演模型是地下水建模的必要步骤.当求解反问题时,正演问题的算子为微分算子,其对应反问题中需要求解的算子即为积分算子,在求解积分方程时,微分方程最后一位常数项参数无法得到确定,这就引出了地下水污染源识别问题的一个难点——不适定性.Hadamard在20世纪提出了适定与不适定概念以描述数学问题与定解条件的搭配情况,问题只须不满足三个条件其中任意一个,就可被定义为不适定性问题.该三个条件为:问题解的存在性;问题解的唯一性;问题的解连续依赖于定解条件(解连续依赖性或稳定性).毛德强[8]提出:在限定模型起始、边界,模型观测情况及数据类型、数值模型中表达式及预估时参数的情况下,能够得到拥有唯一解的反演模型.相较理想情况,实际情况中地下水污染源识别想要得到唯一解难度极大,这也一直是研究地下水污染源识别时须要解决的难题.污染物在地下水系统迁移的过程中,多会发生对流、分散、吸附等物理作用过程及氧化还原、降解等化学过程,这些过程同时受到水文地质条件的影响[9],一般认为地下水污染物迁移模型为高度非线性模.而反问题的方程组多为病态方程组,方程组的系数和常数发生微小变化会对方程组的解具有很大影响,早期使用的解析法存在诸多弊病,难以继续沿用[10].迁移过程中发生的微小变化或参数的微小误差对反问题的求解有着极大影响,这正是地下水污染源识别问题的另一个难点,不确定性.不确定性主要包括:模型结构的不确定性、模型参数的不确定性、计算误差的不确定性和监测数据的不确定性[11].研究人员掌握知识不完善、不准确,就会使得模型结构在构造时具有不确定性.模型参数种类繁多,同时,模型参数与模型模拟结果息息相关,参数的获取成了模型模拟结果至关重要的一环,但地下水系统中不同参数间可能存在一定的联系,这种联系同样可以影响参数的优化,部分参数在建立模型时可能被忽略,而被忽略的参数,很可能对模拟结果带来较大的影响,地下水系统与地表水有着不可分割的联系,地表水的变化时刻影响着地下水系统中各项指标参数的变化,这也是参数存在不确定性的原因之一.宋昕等[12]认为中国工业企业的污染没有规范管理,这使得对应区域污染物描述分析较为困难.在进行数值求解过程中,难免会碰到求解方式不同导致结果有着天壤之别的情况,同时,为减少计算量,使用的代理模型会存在误差;监测数据可能因为人为操作产生误差,也可能存在测量不足、不准确的情况.针对污染物浓度估计和释放历史存在的不确定性,Snodgrass和Kitanidis[13]首次将贝叶斯理论与地质统计技术相结合,运用于源识别问题中.贝叶斯分析提供了预估误差的量化,并有助于评估不确定性的来源.因此,Snodgrass等人认为将这些因素视为可通过其统计特性来描述的随机函数是具有意义的.贝叶斯分析就此被引入到地下水污染源识别问题中.2 贝叶斯原理及应用优势地下水污染源识别问题的解决方法源自热传导问题的解法.热传导问题的控制方程类似于非反应性污染源输运方程,而当地下水污染源识别问题刚刚起步时,热传导问题已经研究近30 a之久,因此很多热传导问题的求解方法被沿用到地下水污染源识别的问题中[14].地下水污染源识别问题的求解方法的类型诸多,学者们将这些方法依据不同规则划分为不同的类别[10,15-16].地下水污染源识别问题求解方法的类型诸多,包括地球化学指纹技术和数学模拟方法,数学模拟方法较地球化学指纹技术有着实施成本较低、容易上手的优点而得到广泛应用.以Tikhonov正则化为首的确定性方法与以贝叶斯推理所在的随机统计方法组成了地下水污染源识别问题求解的数值方法的集合.确定性方法通过专门消除问题的不适定性来产生单值估计,基于贝叶斯推理的方法不仅产生单值估计,还在概率分布空间中将反问题重述为一个适定的延拓,以此来消除不适定性,同时将隐藏在正则化格式中的先验信息展示出来.除此之外,确定性方法还存在较多问题:确定性方法求解地下水污染源识别问题时须要知道整个试验区流场的水头信息,同时确定性方法求解结果会因微小误差产生较大误差波动[17];Tikhonov正则化方法求解过程过于复杂[13];地质统计学方法在未知变量过多的情况下进行转移矩阵计算的计算负荷较大[18];模拟-优化方法须要模拟模型与优化模型完美耦合,否则会对解造成较大困难[19].伴随状态方法可以有效识别出污染源位置、个数及单个污染源恒定浓度持续排放污染质的源强信息,但随着问题复杂程度增加,伴随状态方法不再适用于反演识别多个污染源分时段排放污染物的释放历史问题;基于贝叶斯推理的方法则通过增加源强的先验信息,缩小了解的空间范围,同时通过构建平稳分布及目标分布相同的卡尔可夫链来得到反问题可能界的样本,并根据样本进行推断,得到反问题解的估计[20].2.1 贝叶斯推理公式贝叶斯推理是建立在概率论基础上,以概率分布形式表达各种不确定性的推理理论,它建立了条件概率与其逆的联系.地下水污染源识别问题,从概率统计的角度可以看作是一种贝叶斯推理问题[21-23],即通过水支观测数据不断更新污染源先验信息,从而得到反演问题的解.以贝叶斯推理方法与传统地质统计技术结合为例,贝叶斯公式可写作P(s|z)=P''(s)=P(z|s)P'(s)∫P(z|s)P'(s)ds, (2)式中:s为待求的污染源特征(如污染源强度);z为水质观测数据;P''(s)为s的后验概率密度函数;P'(s)为s的先验概率密度函数;P(z|s)为似然函数,用来表征s和观测数据的匹配程度;∫P(z|s)P'(s)ds为归一化的积分常数.2.2 基于贝叶斯推理的反演流程与传统优化方法不同,基于贝叶斯推理与地质统计技术结合的反演方法整体流程[24]如下.a. 收集有关污染场地的附加信息,采用先验概率分布函数来对待求的污染源特征(源强)进行表征.b. 以收集的数据作为约束条件,初步建立模拟模型,取Si(0)为待求污染源特征(源强)si(i=1,2,⋯,N)的初值,si的最大值和最小值由先验信息控制.c. 计算Si(0)对应的目标函数,记作W(s(0)),然后再先验分布中随机抽取下一个污染源源强值代入模拟模型计算对应的目标函数.d. 当第l次抽样时,由模型进行正演模拟计算得到f(s(l))并计算相应的目标函数.e. 计算ΔW=W(s(l+1))-W(s(l)),若结果小于等于0,则表明污染源源强的修改方向使目标函数减小,修改可被接收;若结果大于0,则说明修改不被接受,不做修改.f. 此时接受的s(l+1)被认为是反演问题解样本空间中的一个样本而储存起来,不接受的s(l+1)认为不是样本空间中的样本而舍弃.g. 重复步骤c~f进行大量抽样.h. 判断终止条件,若满足则输出所有抽样结果,然后根据后验概率的统计值得到反演问题的解估计.2.3 应用优势与确定性方法相比较,贝叶斯推理有着显著的优势.随机统计方法,尤其是贝叶斯推理,解决反演问题的原理是将反问题重述为统计上对信息的探求这一形式.贝叶斯推理将模型中所有的变量模拟为随机变量;同时,通过随机性来描述对随机变量实现值的知晓程度并将这些实现值的知晓程度体现在概率密度函数中,将后验概率密度函数作为反问题的解.与确定性方法不同,确定性方法只产生未知量的单值估计,基于贝叶斯推理的方法产生一个可以得到不同概率估计的密度函数,进而将问题从“变量的值是多少”转变成了“关于这个变量的信息是什么”.地下水污染源识别问题的观测数据可能是在非稳态环境中获取的,这些观测数据可能取决于在不同时刻的变量,这些观测数据中,可能出现观测信号弱而噪声水平高的情况.这时,普通的基于贝叶斯推理的方法可能无法准确地描述问题属性,卡尔曼滤波方法便逐步运用到地下水污染源识别问题中.3 基于贝叶斯推理的应用基于贝叶斯推理的求解地下水污染源识别问题的方法层出不穷,最早的方式是将贝叶斯推理与传统地质统计方法结合,在试验区中构建框架,求解试验区内污染源识别问题,随着技术的发展,后续衍生出贝叶斯推理与替代模型结合等方法.3.1 均质含水层3.1.1 结合地质统计技术水文量在空间的变化方式过于复杂,无法通过简单的确定性函数表示.在许多情况下,代表其空间变化的最适当方式是统计学术语.在这种情况下,待求解的水文变量被表示为一个随机函数的实现(一个空间随机过程).这种表示方法非常普遍,不会损害水文模型的物理基础,并允许通过对先验信息或测量结果进行调节来利用任何可用信息.自20世纪80年代起,以Hoeksema,Kitanidis和Dagan等[25-29]为首的诸多水文地质学家多使用贝叶斯理论和地质统计技术来估计水力水头和电导率场,但也仅仅局限于水力水头和电导率场相关参数的求解.直到1997年,Snodgrass等[13]将贝叶斯推理与地质统计技术结合,进行污染源识别问题解决方法的开发.鉴于未知函数的不确定性,Snodgrass等[13]将释放历史这一未知函数表示为一个随机过程,在贝叶斯推理框架中,赋予所有符合数据且与额外信息一致的可能存在的函数一个概率,这些概率表示这一函数是解决方案的概率.组函数的期望用来寻求最佳估计值,对应的协方差用作估计不确定性的衡量标准.Snodgrass等将自己提出的基于贝叶斯推理的方法应用在一维均质含水层的污染物识别问题中,并将此方法与其他估计方法进行比较,基于贝叶斯推理的方法更具有普遍性,在求解过程中不须要对未知源函数及结果做盲目的假设.不约束源浓度非负的情况下,Tikhonov正则化方法有着更好的结果表现,但是在约束源浓度非负的情况下,基于贝叶斯推理的方法表现更好;同时,此方法具有自动提供估计不确定性度量和优化结构参数的优点,并能确定平均值和协方差的最佳形式.具体结果比较如图1所示,图中:t为时间;C为污染物质量浓度.10.13245/j.hust.221014.F001图1有高斯协方差的约束下污染物质量浓度与时间关系为研究更适用于实际场景下的贝叶斯推理方法,而不是局限于一维理论情况下,Butera和Tanda[30]将Snodgrass的方法沿用至存在多个污染源的二维模型中.Butera等将Snodgrass用于一维场景下测试的污染物扩散的释放历史函数沿用到二维场景中,并将求解方法进行扩展以克服单点污染源的限制.在试验中,Butera等[30]将污染源情况分为单点污染源和污染区域两种情况,污染区域中包含两个污染源点,并将改进的方法运用到两种情况中,得到的试验结果如图2所示.10.13245/j.hust.221014.F002图2单污染源情况下污染物释放历史图3为污染区域不同污染源真实释放历史图.Butera等[30]将改进算法运用到不同污染源情况下,图4为污染区域不同污染源真实释放历史及对应算法求解结果图.10.13245/j.hust.221014.F003图3污染区域污染源真实释放历史10.13245/j.hust.221014.F004图4污染区域污染源和污染物真实释放及计算释放历史Butera等[30]通过试验结果证明了此方法能够较好描述污染源扩散历史,但该方法同样存在局限性,该方法无法识别错误的水力参数:使用错误的速度和分散值与假设错误的传递函数相同,即对输送过程的错误描述.低估弥散系数或高估地下水流速会降低弥散机制的影响,从而降低估计误差方差;同时,该方法在非均质含水层中的可用性较低.Michalak和Kitanidis[31]则将这种方法运用到三维实际场景——用于检查加拿大安大略省Gloucester填垃圾埋场的污染物释放历史,这项工作是首次应用于非点源设置,以及首次应用于时间和空间分布数据.在推广贝叶斯推理相关方法的同时,Michalak等在此方法中加强了浓度的非负性.试验结果表明方法描述污染物扩散历史效果良好.Sun[32]提出了一种新的基于贝叶斯的鲁棒估计方法,并将这种方法推广到数学模型是线性模型的源识别问题中,认为当模型存在不确定性时,此方法效果优于传统地质统计方法.张双圣等[33-35]提出了基于贝叶斯公式与信息熵的监测井优化设计方法,此方法融合了多目标优化检测、基于拉丁超立方抽样的DRAM算法,并利用地下水污染理想模型验证了设计的可行性.3.1.2 结合替代模型通常情况下,基于贝叶斯推理方法进行地下水污染源识别须要重复调用模拟模型进行求解,这将导致巨大的计算成本,严重制约识别效率,而利用替代模型建立反演过程与现实模拟模型的连接,可以很好地解决计算成本的问题,基于这点,不少学者将贝叶斯推理方法与替代模型结合起来[36].顾文龙等[37]将污染源反演过程转化为贝叶斯推断过程,并与Kriging替代模型相结合,针对求解过程中采用的Metropolis抽样算法提出改进方案.顾文龙等采用基于克里格估算方法的黑箱模型作为模拟模型的替代模型;同时,将针对污染源反演问题的求解过程转化为贝叶斯推断过程,充分利用各种先验信息,最大概率地得到反演结果,并进行反演效果的定量分析.在假想的二维均质各向同性的矩形潜水含水层模拟区中进行算法验证,得到了较好的试验结果,具体迭代次数与算法求解污染物浓度关系如图5所示.对比污染源释放历史的真实值与最终反演结果,如表1所示,表中C1和C2分别为不同污染源对应污染物质量浓度.10.13245/j.hust.221014.F005图5Metropolis抽样算法迭代结果10.13245/j.hust.221014.T001表1不同污染源的反演结果时间C1真实值C1反演值C2真实值C2反演值t13335.892119.48t29489.746170.86t33327.307578.45g∙s-1从抽样算法得到的迭代结果,及不同污染源的反演结果可以看出,算法准确性较高.董海彪[38]在利用贝叶斯推理方法进行地下水污染源反演识别过程中,运用拉丁超立方抽样方法在输入变量的可行区域内进行抽样,并调用Kriging替代模型辅助求解,最后采用MCMC(马尔科夫链蒙特卡罗)方法对后验分布空间进行有效抽样.此算法在简易二维矩形均质各向同性稳定含水层中进行检验.具体反演结果如表2所示,试验结果表明:基于贝叶斯推理的方法求得的待求量均值误差与中值误差均小于5%,此方法求得结果精度较高,稳定性较好.10.13245/j.hust.221014.T002表2反演结果待求量真值/(g∙s-1)均值/(g∙s-1)均值误差/%中值/(g∙s-1)中值误差/%u114040.902.2540.491.25u127072.113.0072.323.30u136062.594.3062.904.80u213029.082.9028.724.30u226061.282.2061.322.20u238079.011.2079.300.90张江江等[17]在利用基于贝叶斯推理的方法设计污染源识别检测方案及求解污染源参数反演过程中,利用一种两阶段MCMC算法对污染源参数进行反演,这样提高了MCMC算法模拟时的效率,同时保证了算法的精度.为了给地下水污染源参数反演提供信息量最大的观测值,他们采用了一种基于全贝叶斯原理的试验设计.这种方法采用了先验到后验相对熵的期望作为目标函数,并采用蒙特卡罗模拟对目标函数进行数值求解.张江江等利用包括单个采样位置、高维非高斯情况在内的多个案例进行方法验证,结果表明:该方法可以有效且准确地获得对污染物参数及渗透系数参数的估计,且效果明显优于随机采样方法.图6为评价指标与相对熵期望的关系,图中:ERP为最大后验概率估计与真实参数之间的相对均方根误差;ERM为后验均值估计和真实参数之间的相对均方根误差;ERC为整个后验链条与真实参数之间的相对均方根误差;EFC为浓度预测均质与实际参数之差绝对值的期望;EKL为污染源参数先验到后验相对熵的期望.通过对ERP,ERM,ERC,与相对熵期望EKL(目标函数)进行线性拟合,可以得到负相关关系,其决定系数R2分别为0.876,0.932和0.948,都非常接近1.EFC越小,表明质量浓度的预测越准确,通过对EFC与EKL进行线性拟合,发现两者呈明显负相关性,决定系数R2为0.883,可见:EKL越大的检测设计,越有利于获得准确的质量浓度预测.10.13245/j.hust.221014.F006图6评价指标与相对熵期望的关系Jiang等[39]提出一种新的两阶段替代模型辅助的基于马尔科夫链蒙特卡罗的贝叶斯框架来识别稠密非水相液污染地下水的污染源参数.在该框架中,提出了一个自适应更新反馈过程,在后验分布上构建一个局部精确的代用模型,以取代耗时的多相流模型.为了提高MCMC模拟的效率,采用了一种多目标可行性增强的粒子群优化算法(MOFEPSO)来生成污染源参数的初始猜测.Jiang等提出的贝叶斯框架流程图如图7所示,其主要步骤如下.10.13245/j.hust.221014.F007图7基于两阶段代理辅助MCMC的贝叶斯框架流程图a. 使用拉丁超立方采样方法在位置参数的先验分布上生成N个基础点,使用原始仿真模型计算相应输出.b. 选取监测井中浓度变化趋势与观测值相似的基点子集,建立克里金替代模型.在优化模型和 MCMC 仿真过程中,使用构建的代理模型替代原始模型.c. 利用两个目标函数(最小化解和观测的绝对误差之和,最小化解和观测的绝对误差的最大值)来构建多目标优化模型.d. 为了提高MCMC模拟的效率,将MOFEPSO算法得到的目标函数(最小化解和观测的绝对误差的最大值)最小的解设置为MCMC模拟过程中未知参数的初始猜测,自后验分布取得参数样本后,通过执行基于代理的 MCMC 模拟获取源参数.e. 设计了一个自适应更新反馈过程来更新基点并重建代理,意在后验分布中建立一个局部准确的代理模型.f. 重复步骤c~e ,直到达到停止标准.Jiang等[39]通过一个三维多项流数值算例,验证了该方法的准确性和有效性,选取该方法求得的各参数的最大后验密度值(MAP)作为识别结果时,与单阶段代理框架相比,该方法的MAP与参数真值之间的RMSE降低了71.3%,因此可以认为自适应更新反馈过程产生的代理精度的提高可以提高识别结果与参数真实值的接近程度.朱嵩等[40]对基于Metropolis-Hastings算法的多链搜索的方法进行了改进,并在地下水污染源识别问题的求解中表现出对非唯一性反问题的优良性能.梁忠民等[41]根据贝叶斯公式构建水文模拟参数的后验分布,并采用MCMC抽样技术获得样本,运行水文模型可以得到对应的模型预报的抽样分布,根据模型参数的后验分布及预报值的抽样分布即可对参数的不确定性及其对预报的影响进行定量分析.诸多学者利用替代模型解决了仿真模型高昂的计算成本问题;同时,为地下水污染源识别问题带来了新的突破点,但替代模型都或多或少存在着一定的缺陷,启发式优化算法在复杂情况下难以求得最优解、网络结果又存在着训练时间及训练过拟合的问题.3.2 非均质含水层与均质含水层不同,非均质含水层的水文参数随空间坐标发生变化,普通的贝叶斯推理方法无法在非均质含水层中得到较好试验结果,而贝叶斯滤波方法,却是解决非均质含水层污染源识别问题的较好方法,最著名且应用最为广泛的当属卡尔曼滤波.贾顺卿等[42]于U-D分解的卡尔曼滤波与非线性规划优化模型相结合,溯源辨识出地下水污染源个数、位置及释放强度.在运用U-D分解卡尔曼滤波识别污染源的个数与位置的基础上建立优化模型,采用克里格插值法建立替代模型并嵌入优化模型,运用遗传算法求解优化模型得到污染源源强.他们利用二维非均质含水层验证了方法的可行性,最终算法求得源强为1 972 mg/d,与实际值2 000 mg/d接近,相对误差为1.4%.Chen等[43]使用基于Cupola和Tanda试验中使用的集成卡尔曼滤波方法的改进方法rEnKF进行试验,此前,Xu等[44-45]已经证明了其识别污染源的能力.江思珉等[46-47]提出了一种基于卡尔曼滤波和模糊集的地下水污染羽识别方法.并将此方法与alpha-cut技术结合,放入典型地下水模型中进行测试,得到了较好的估算结果.图8和9为污染物扩散示意图,图中x和y分别表示将污染物扩散示意图放入直角坐标系中后对应的横纵坐标.图9中等高线上灰色数据为浓度等高线对应数值,从内到位分别是0.8,0.6,0.4和0.2.10.13245/j.hust.221014.F008图8真实污染物扩散示意图10.13245/j.hust.221014.F009图9求得污染物扩散示意图3.3 其他环境问题近年来贝叶斯推理方法在实际应用中不断得到改进,越来越多的环境问题都开始使用贝叶斯推理方法进行求解,如贝叶斯优化与可移动机器人结合对环境进行检测、高斯过程代理的贝叶斯优化与传感器结合找到温度最高最低点、结合贝叶斯优化和部分观测的马尔可夫决策过程对无人机采集策略进行优化、利用贝叶斯优化调整基于个体的个性化监测模型以达到个性化监控病人生命特征等[48-50].随着将贝叶斯与深度学习结合的技术不断深入,愈发精确高效的近似推理程序逐渐推出,不确定性的量化和样本效率也得到了改善[51-59],其中就包括将贝叶斯与GAN(生成式对抗网络)神经网络进行结合、提出新的梯度算法优化高斯均匀场、利用新的高斯分布进行求解、引入带有变异函数的贝叶斯神经网络等一系列方法,但贝叶斯与深度学习融合后的技术没有在工业实际中得到应用.无论是哪种环境问题,基于贝叶斯推理的方法都存在着局限性.4 总结与展望贝叶斯推理存在的第一个具有较大争议的问题便是先验概率分布的确定方式,大多先验概率的确定来自专家知识、主观经验等,且这些概率分布的显式模型获得都是极其麻烦的.其次是贝叶斯推理方法的稳健性问题和似然函数的选择问题.最后是后验概率密度函数的随机抽样算法的问题,Metropolis-Hastings(M-H)算法是较常见的MCMC采样方法,但后验概率往往较为复杂,且可能存在局部极值,常规的M-H方法前期波动较大,较为耗时,计算过程中也可能出现局部最优或难以收敛的问题.除去贝叶斯推理方法存在的问题,地下水污染源识别问题还在水质模型建立、替代模型选择、参数收集及处理等方面存在着诸多问题.现实生活中存在很多类似于地下水污染源识别的反问题,学者们就此类问题进行了大量的试验及深入的研究,但当面对污染源情况更为复杂或非含水层污染侵入的情况时,现有方法很难在可接受时间内找到满意解甚至无法得到满意解.近年来基于贝叶斯的地下水污染源识别方法在多个试验模型及简单现实场景中展示出了良好性能,具有较强的泛化能力和较高的求解效率,为地下水污染源识别问题的求解提出了清晰的思路.现有研究已经显示出贝叶斯推理在解决地下水污染源识别问题方面的优势,但研究尚处于起步阶段,仍然存在一系列问题.要构建基于贝叶斯解决地下水污染源识别问题的理论方法体系,还可从如下几个方面开展研究.a. 优化贝叶斯推理方法.贝叶斯推理方法在地下水污染源识别问题中确实有着不错的效果,但贝叶斯推理先验模型的使用一直被频率论学者诟病抨击,后续对先验函数模型的显式表示可通过贝叶斯神经网络进行;同时,贝叶斯推理方法中的后验概率密度函数的随机抽样算法的选择及优化也是较好的研究方向,已有部分学者对这方面进行研究并获得成果:朱嵩等[40]对基于Metropolis-Hastings算法的多链搜索的方法进行了改进,并在地下水污染源识别问题的求解中表现出对非唯一性反问题的优良性能.贺新月[60]针对确定性水文模型和随机水文模型提出两种MCMC方法的改进方法对水文模拟不确定性进行分析,并论证改进方法的有效性.b. 完善问题模型.在问题方面,地下水系统与地表水系统相互连通,一部分地下水污染便是从地表土壤污染中扩散而来的[16],一定程度上属于一类问题,地下水主要存贮于含水层中,含水层与非饱和带直接相连,两者间物质传输频繁,污染物扩散也能通过物质交换进行;因此,与现在只考虑含水层地下水的模式相比较,将非饱和带与含水层同时考虑建模,有更强的合理性.除将地下水系统与地表水系统联系起来,还须要对地下水中的非水相流体类污染物数学模型列入考虑范围[21-22],此类污染物影响到人们日常饮用水的质量,与人们的健康息息相关,并引入地球化学方法,与数学模型结合,借助试验室数据或实地观测数据进行识别,进而得到准确的试验结果.c. 融合不同方法.鉴于贝叶斯推理的优秀表现及其存在的局限性,可以将贝叶斯推理与代理模型进行结合,加入神经网络的概念,也可以对已有的贝叶斯推理方法进行改进,进一步完善发展更准确更高效的推断算法及可微分的概率编程库[61].具体可将贝叶斯推理与深度神经网络结合,引入正则化方法防止深度神经网络的过拟合情况出现;利用优化算法对仿真模型进行优化后,再利用贝叶斯对模型进行求解;利用约束非线性规划对逆识别情况进行描述,并利用贝叶斯对逆识别情况进行处理等.新兴的贝叶斯深度学习融合了贝叶斯推理方法和深度神经网络的互补优势,为应对复杂问题中的不确定性建模与推断提供了强大的工具,此方法就是较为有发展前景的方式之一,尝试将此方法引入污染源识别问题是个从理论到实践的重大突破,也是后期研究的主要方向.d. 考虑实际场景.目前大多数研究都是基于理想情况进行实施的,在实际情况下,参考数据的提取和计算的时间代价是不可回避的问题.数据提取可以通过设置重要检测节点进行提取,在特殊位置设置传感器,实时获取此节点的各项水质数据,在污染入侵时第一时间获取到污染参数;同时,基于贝叶斯和深度学习都须要大量数据的特点,可以将数据驱动的方法引入地下水污染源识别领域,而获取数据的方式较难,为获取更多重要数据,水支援检测系统须要不断完善[16].大数据的引入需要高性能的数据处理及计算方法,随着并行计算的发展,可将并行计算的理念带入数值模型的求解过程中,这样可以极大程度上减少计算所需的时间消耗.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读