引言我国民用建筑能耗年均增长率约为12%,约占全国总能耗的20%[1],2015年建筑能耗资源占比约为全球能源和资源总量的40%[2]。但由于建筑能耗受到气候环境、建筑结构、物理材料传热性质等多种因素的影响,在建筑运营过程中,造成大约16%的建筑能耗流失[1,3-5]。提高资源使用效率,减少能耗浪费以及对全球气候环境的影响,成为当下的研究热点[6]。1能耗异常检测目前解决建筑运营期间能源浪费问题最有效的策略之一就是能耗数据异常检测[7-9]。异常检测指检测与预期模式不符合的异常数据的过程[10],异常检测可以准确识别数据集中具有较大偏差值的样本或样本集。异常值可分为点异常或集体异常,异常检测的主要目的是发现建筑物运行中的异常情况[11],通过对这些异常值和异常模式的检测,为监测者(管理者)的节能措施提供数据支持,以减少建筑运营过程中不必要的资源损失。能耗监测平台异常数据的产生原因主要包括:数据丢失、瞬时异常值以及平台的固有偏差。由于感知层通道干扰和不成熟的能耗监控技术[12],不能保证从平台导出的统计能耗数据的正确率,并且在长期监测过程中也会产生一些未知误差。为了满足室内环境条件的舒适性和功能性需求,同时还能控制能源的使用和成本,需要从大量数据中挖掘有利信息,并将其转化为有效的改进措施加以实施[13-14]。数据挖掘主要包括分类、回归分析、聚类、关联规则以及预测等多种方法[15]。2研究现状根据数据处理方式不同,现有的能耗异常检测方法可分为动态能耗异常检测方法和静态能耗异常检测方法。根据分析过程中采用的数据挖掘方法类型,又可分为有监督学习和无监督学习[10,16],具体分类如图1所示。10.3969/j.issn.1004-7948.2022.04.004.F001图1数据处理方式2.1有监督学习有监督学习是对具有概念标记(分类)的训练样本进行学习[17],并根据训练结果对实验数据进行标记(分类)。Sun[18]等结合支持向量机和贝叶斯人工神经网络对可变制冷剂流量系统的制冷剂加注量的故障进行诊断,以提高空调系统的工作效率,改善建筑物暖通系统的能耗状况。Lee[19]等提出一种基于通用的回归神经网络的空气处理机组子系统级在线错误检测与诊断方案,监测和诊断空调机组的突发故障和性能退化故障,以提高建筑物能源使用效率。Wang[20]等采用一种基于神经网络模型的室外空气流量传感器错误检测与诊断策略,实现室外空气流量的容错控制,为楼宇自动化系统的智能化、优化控制,以最低能耗维持室内空气质量提供了理论支持。目前大部分基于能耗预测模型的错误检测与诊断方法,主要是将模型的预测值和实测值对比,通过两者之间的差值进行异常检测。Du[21]等将暖通空调系统的送风温度和回水温度作为组合神经网络的预测结果,通过对组合神经网络权重因子的分配,发现多种故障源异常原因,进而有效优化空调系统的能耗状况。Frédéric[22]等提出一种基于递归确定性感知器神经网络的有效模型,实现对建筑能耗的故障检测与诊断。但该方法需要大量数据的训练以及选择合理的影响因子完善模型,同时需要及时对预测模型进行更新,从而提高异常检测的准确性。除此以外还可以建立分类模型,通过已知标签的数据对分类模型进行训练,明确异常数据的特征标签,将具有类似特征的能耗数据判别为异常,利用标签定义能耗数据是否异常。Han[23]等提出一种将支持向量机与遗传算法结合的故障诊断应用模型,利用支持向量机作为错误检测与诊断工具和特征选择的评估方法,获得优良的特征子集。Zhao[24]等提出一种基于分类模型的故障检测方法,将故障检测问题转化为数据描述问题。利用高维空间中的一个紧边界的超球体描述无故障数据分布,若监测数据不属于无故障类别,则判定为故障,该方法可以改善建筑物运营过程中的能耗状况。有监督学习中,标签的准确性通常难以保证,且需要大量已知标签的数据对分类模型进行验证,同时分类标签过多容易降低异常检测的效率,导致此类异常检测方法的实用价值存在一定的局限性。2.2无监督学习无监督学习指对没有概念标记(分类)的训练样本进行学习,发现训练样本集中的结构性知识。由于无监督学习不需要异常标记,因此更适合建筑运营管理者的实际需求[10],典型的无监督学习算法有聚类算法和关联规则等。Li[25]等采用聚类分析和关联规则两种算法识别变制冷剂流量系统的能耗模式,该方法能够有效识别变制冷剂流量系统的能耗模式,提取能耗规律。Ma[26]等提出一种以变分为中心的聚类分析方法,对19所高校建筑的典型日采暖能耗分布进行识别,结果证明该方法在识别典型日事件中的有效性。David[27]等采用数据关联挖掘技术,提取3个典型的教室里一学年数据中的关联规则,并对照明浪费模式进行挖掘。结果表明,该模式下可以节约70%的能源使用,提高能源效率。由于聚类结果缺乏足够的先验知识,导致聚类结果不如有监督学习的分类结果可靠,同时无监督学习也缺少训练集,在面对大数据处理时,无监督学习算法的检测效率大幅降低[10]。为了提高大数据背景下聚类算法的聚类效率,可以采用一些优化算法进行改进。目前一些遗传算法已在部分工业领域得到应用,Xu[28]等利用粒子群优化算法对支持向量机参数进行优化,得到最优训练参数。建立风机叶片是否结冰的预测模型,实现对叶片结冰故障机理的评价。Mahmoud[29]等提出一种新的混合遗传粒子群优化方法对分布式发电机组的配置进行优化,以改善电网的总有功、无功损耗和电压调节率。Hanumant[30]等采用粒子群优化方法对印度某火电厂的发电机组子系统性能进行评价,并对系统可用度进行优化,得到最优可用度参数。2.3动态异常检测方法当前有关建筑能耗异常检测领域的研究都围绕建筑物运营过程中某一系统的异常能耗模式展开[14,17,26-27],或者是针对建筑物运营过程中能耗数据的静态检测[16,18,28-29]。此类研究基本是将能耗数据导出后,再对数据做静态异常检测,关于建筑能监测平台数据有效性的动态研究相对较少。Ma[31]等提出一种建筑物异常能耗数据的实时检测方法,即POD-LSE(Proper Orthogonal Decomposition-Linear Stochastic Estimation)和FCD(Fractal Correlation Dimension)取代传统检测方式。但该方法没有考虑不同能耗特征的模式对检测结果的影响。Li[32]等提出一种分析方法,能够实时对异常值进行识别,并实现对日耗电量的预测。但此方法同样没有考虑不同特征的能耗模式对检测结果的影响。Jiang[33]等提出一种优化的建筑能耗异常检测方法。该方法能很好地考虑动态能耗模式改变对异常数据的检测,但算法构造复杂,当数据维数高时复杂性同样也增加。虽然动态异常检测方法的研究相对较少,但该方法更贴近实际情况,且该方法是基于建筑能耗数据平台实施,能有效整合现有能耗数据,对建筑能耗异常检测具有更现实的意义,同时该方法还可依托数据挖掘技术的发展,促进数据驱动型建筑能耗监测平台的进步。3结语对建筑能耗数据的异常检测是实现建筑节能的重要途径之一,强化能耗管理、加强对能耗数据的监测,是提高建筑节能效率的重要手段,为建筑运营人员提供重要的理论依据和数据支持。基于现有研究,提出几条未来可以深入的研究方向,希望今后对能耗异常检测研究提供一定帮助:(1)已有方法均是对建筑物运营的能耗数据进行点异常检测,但忽略了能耗数据可能出现集体异常的情况。如何实现将两种数据异常结合进行检测更具有现实意义。(2)采用多种优化算法对数据挖掘技术进行改进,如信息熵理论、遗传算法等方法,提高能耗异常检测的准确性和计算效率。(3)目前的能耗异常检测方法中,有监督学习和无监督学习并不是完全互斥的,两者各存在一定的不足,除了采用优化算法的改进以外,还可以将有监督和无监督算法结合为半监督算法,对能耗异常检测方法进行完善,以此提高异常检测方法的检测效率和准确性。(4)当前大量的异常检测研究都是围绕建筑运营过程的某一系统开展,或者是对能耗数据的静态检测,这样的检测方法存在一定的局限性。加强对建筑能耗监测平台数据有效性的动态研究,实现对建筑能耗数据的实时检测,可以及时反馈建筑运营过程中的异常状态,对建筑运营管理具有更实际的意义。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览