随着社会的不断发展,建筑成为世界上最大的能源消费之一[1],其能源消耗越来越得到重视,文献[2]提出的非侵入式负荷监测(NILM)通过对总能量分解出单个设备的能耗并进行分类,以便用户合理利用用电资源.随着人工智能算法的崛起,众多学者都在寻找负荷信息与NILM技术间的媒介,文献[3]提出通过以电压作为纵轴、电流作为横轴,绘制一周期的电压-电流轨迹(V-I轨迹)来表征不同负荷,同时表明了V-I轨迹具备多种特征:不对称性和循环方向等特征,并采用层次聚类的方法对负荷进行辨识.此后,大量研究将V-I轨迹图像作为NILM与计算机视觉的媒介,文献[4]通过将V-I轨迹形成二值化图像与随机森林算法相结合来区分不同的负荷.文献[5]利用V-I轨迹的加权像素化图像与卷积神经网络(CNN)进行辨识设备种类.针对主要由电阻元件组成的家用负荷,由于它们的功率因数较高,有功电流占据负荷电流的比例较大,因此传统的V-I轨迹难以区分此类负荷.文献[6]从负荷原始电流中分解出有功电流(Ia)和无功电流(If),验证了不同的阻性负荷间归一化V-I轨迹和电压-有功电流轨迹(V-Ia轨迹)存在着较大的相似性,但是它们的电压-无功电流轨迹(V-If轨迹)存在着差异,适合作为负荷签名进行负荷辨识,且不会降低其他负荷类型的辨识率.文献[7]利用轨迹连续点之间的相位角度、功率因数、多周期重复性分别对应HSV(色调,饱和度,亮度)颜色模型的分量,在V-If轨迹上进行彩色编码,最终转换为RGB(红绿蓝)图像,并使用AlexNet网络进行负荷辨识.但是,由于上述文献中所利用的轨迹图像冗余度较大,图像中存在大量的空白无效信息,因此作为计算机视觉的输入难以利用轨迹形成方向上的时间维度.原始电流信息反映了负荷功率因数和负荷类型,原始电流和电压的差值反映了负荷的相位变化,本研究首先对设备进行高频采样,将原始电流和电压数据进行滤波后,提取无功电流,以电压为纵坐标,无功电流为横坐标绘制其V-If轨迹;然后基于时间分割和颜色可视化的方法,将标准化后的电压、电流和V-If轨迹信息分别与图像中的R/G/B通道相对应形成真彩色图像;接下来利用真彩色图像作为设备的特征训练CNN,以提高负荷辨识的准确性和可靠性;最后在公共数据集PLAID和WHITED上验证了算法处理方式的可行性和有效性.1 基于时间分割的数据可视化流程1.1 数据可视化流程为了将时间信息映射到空间位置,并将电压、电流和V-If轨迹信息融合到一张真彩色图像中,本算法的数据可视化流程如图1所示,具体分为以下两个步骤.10.13245/j.hust.211014.F001图1数据可视化流程a. 数据的采集和预处理.高频采集用电设备在稳态下的电压和电流数据,并对该电压和电流数据进行中位值平均滤波处理,寻找电压上升过零点为起始点,保留一周期采样点数的电压和电流数据.并考虑到主要由电阻元件组成的家用负荷归一化V-I轨迹的相似性,本研究引入Fryze理论提取无功电流[6],以电压作为纵轴,无功电流作为横轴得到V-If轨迹黑白图像,从而获得完整的一周期采样点数的电压、电流和V-If轨迹.b. 基于时间分割的颜色可视化.对步骤a得到的一周期采样点数的电压和电流数据分别进行min-max(最小值-最大值)标准化处理,将标准化后的数据分别根据时域的顺序进一步分割,排列成大小为M行N列的二维矩阵,即X(i,j)=Xraw[N(i-1)+j]-min(Xraw)max(Xraw)-min(Xraw)×255,(1)式中:i为M×N矩阵的行序号,其取值范围为[1,M];j为M×N矩阵的列序号,其取值范围为[1,N];X(i,j)为M×N矩阵的元素,M×N在数值上等于一周期采样点数;Xraw为标准化前的电流和电压数据.从而得到数值范围在0~255内的两个二维矩阵,分别作为R通道和G通道的输入,V-If轨迹对应的黑白图像作为B通道的输入合成一张真彩色图像,称为真彩可视化图像.1.2 基于时间分割的颜色可视化图像特征a. 不对称性特征在各个通道的灰度图像特征上,其上下不对称性代表着负荷特性在正负周期上的不对称,电流灰度图是否对称代表电流在正负周期上是否以相同的方式传导.如图2所显示的是微波炉的电流灰度图像和电流时域波形图像,图中:F为电流幅值;t为时间.图2(a)中所显示被虚线框所包围的两个区域的不对称,对应着图2(b)中的电流波形的不对称性.10.13245/j.hust.211014.F002图2微波炉电流灰度图及其时域波形图b. 局部条纹特征局部条纹特征中显示的黑白条纹,分别代表着数据中在正方向和负方向上的突变值.如图3(a)和(b)分别显示着笔记本电脑的电流灰度图和电流时域波形图,当电流在正方向上出现突变值时,显示出白色条纹,负方向上发生突变值时出现黑色条纹.而当数据在匀速增大或者减小时,图像颜色渐变是均匀的.如图3(c)和(d)所示的吹风机图像.10.13245/j.hust.211014.F003图3设备电流灰度图及其时域波形图c. 灰度值特征各通道中灰度值的数量分布代表着其相应的数据分布,若负荷的电流在正负周期上以相同的方式传导,在其电流灰度图中灰度值为123~133之间的数据越多,则电流或电压数据的近零值越多.2 基于时间分割的颜色可视化网络训练2.1 负荷辨识数据集为了验证所提出的方法的可行性和有效性,本研究使用了高采样率的数据集PLAID[8]和WHITED[9],它们适合本研究的可视化方法,并且在最近的研究中已用于NILM的评估[7,10].PLAID数据集包含11种设备类别和1 074条记录,采样率为30 kHz.WHITED数据集包含54种设备类别和1 339条记录,采样率为44.1 kHz.图4中显示了PLAID数据集生成的部分负荷类型的真彩色可视化图像.每类负荷将时间信息转换到空间位置上,R通道上平铺了电流信息,G通道上平铺了电压信息,同时B通道包含了V-If轨迹信息,不同负荷电流的变化不同导致呈现出来的颜色不同,其中每个像素点既包含电流信息,又包含电压信息,且其位置代表着时间信息.10.13245/j.hust.211014.F004图4PLAID数据集生成的真彩可视化图像负荷阻抗可以分为阻性、感性和容性,对比不同阻抗的负荷,其真彩可视化图像的颜色变化和轨迹曲线上均存在一定的差异.在同一类型下的负荷间,颜色大体相似,但由于功率因数差异和波形突变性等原因,因此在细节的表现上存在着差异.如同为阻性负荷的吹风机图4(e)和加热器图4(f),在图像下半部分,即后半周期的位置,吹风机所呈现的颜色偏向于紫色,加热器所呈现的颜色偏向于粉色.电流和电压一个周期前后存在数值相等的点,但其在图像中所呈现的位置并不相同.2.2 基于颜色可视化图像的网络训练结构一旦将负荷特性转换为彩色图像后,就可以将其用来完成分类任务.CNN是一种神经网络,通常用于计算机视觉,因为它们对细微的颜色偏差具有较高的灵敏度,所以非常适合对图像进行分类[11].基于时间分割的颜色可视化的分类网络结构如图5所示.10.13245/j.hust.211014.F005图5网络结构图在指定签名和网络结构后,接下来进行训练过程,以便于CNN学会对不同的类别进行分类.根据数据按照7:3的比例划分成训练集和测试集.在网络训练过程中权重参数的初始值设置为标准差为0.1的截断式正态分布输出的随机值,偏置参数的初始值设为0,Sigmoid函数作为激活函数,并在交叉熵损失函数中加入L2正则化,通过参数λ控制过拟合作用的强度[12].经过不断训练调优后,L2正则化函数的λ值设置为0.007,学习率设置为0.001.对于最终模型的评估可以从准确率、召回率和F1得分(统计学中用来衡量二分类模型精确度的一种指标)来评估其分类性能[13-14].对所有F1分数取平均值,得出宏平均分数.3 实验结果及分析3.1 不同可视化方法的影响在实验中,基于第2节中的参数设置及网络结构,针对V-I轨迹的二值化图像[4]、加权像素图像[5]、具有颜色编码的图像[7]和三种不同融合信息的真彩可视化图像进行辨识实验,结果如表1所示.10.13245/j.hust.211014.T001表1不同可视化方法的实验结果参考文献负荷签名图像大小/像素测试集准确率/%损失值文献[4]二值化V-I图像25×2592.350.736 4文献[5]加权像素V-I图像25×2591.740.741 7文献[7]具有颜色编码的V-I图像25×2593.970.532 1仅融合电压和电流信息20×2594.410.516 4本文方法融合电压、电流和V-I轨迹信息20×2595.260.356 5融合电压、电流和V-If轨迹信息20×2596.630.121 7从表1可知:在同一网络下,本文方法使用的图像所包含的信息密度高、像素点少,但在测试集的准确率上更高,损失值更小.本文方法相比文献[4],当图像尺寸较小时,训练过程中能充分利用电压和电流的细节信息;相比文献[5],在标准化的过程中,规避了灰度值无法真实反应某个网格单元内的数据点个数的局限性;相比文献[7],克服了所包含的信息无法被较小的网络充分利用的局限性.本研究将电压和电流数据按时间切分后映射在整个图像上,将时间信息映射成位置信息,信息密度高,神经网络能充分地利用电压、电流和轨迹间的细节变化,所以在准确率上得到了一定的提升.本文方法中仅融合电压和电流信息的对比实验验证了该方法的有效性,并进一步融合V-If轨迹信息克服了V-I轨迹信息在阻性负荷标准化后无法分辨的局限性.3.2 设备类型适应性分析在本实验中,同样基于第2节中的参数设置及网络结构对PLAID数据集和WHITED数据集进行训练,对于每次迭代得到的模型,使用本实验数据中的测试集来验证此时模型的准确性和损失大小.训练集和测试集在模型迭代的过程中,准确率曲线上升后并趋于稳定,PLAID数据集测试集准确率浮动在96.06%,最高可达到96.63%,损失值最终降至0.121 1,并且波动很小.WHITED数据集测试集准确率曲线趋于平坦后,最终准确率浮动在98.6%,最高可达到为99.05%,损失值趋于稳定,损失值为0.012 7,保存训练后的模型.在PLAID数据集上的F1宏平均分数达到了97.87%,其中加热器的识别率达到94.12%,吸尘器达到95%,洗衣机达到96.15%,其他类别识别率均超过F1宏平均分数,且在荧光灯、吹风机和冰箱3类电器上识别率达到100%.在WHITED数据集上每个类别的F1得分都达到了80%,并且在总共54类电器中的46类上分类精度达到了100%,平均精度可达99.11%.为了对于各个类别中的准确率进行更详细的分析,可以使用混淆矩阵[5,7,9]进行可视化的观察.PLAID数据集上混淆矩阵如图6所示.10.13245/j.hust.211014.F006图6PLAID数据混淆矩阵从图6的混淆矩阵和实际识别情况可以看出:洗衣机、冰箱和空调的预测结果经常与其他设备负荷混淆.这3类电器都是属于有限状态机[15],其中洗衣机在各数据集中都低于宏平均分数.空调有加热和换气等工作状态,其中加热状态与加热器的工作状态相似,换气状态与风扇的工作状态相似,以至于在分类中三者容易造成混淆.冰箱有照明和换气等工作状态,除了和空调一样容易与加热器、风扇造成混淆外,冰箱还会和灯泡混淆,洗衣机容易与吸尘器和灯泡混淆[16-17],但由于本文方法对其他设备的识别率更高,因此总体准确率上有了一定提升.3.3 构建的负荷辨识系统的性能分析公共数据集PLAID和WHITED的良好实验结果证明:负荷特性可视化成彩色图像,在负荷辨识领域有良好的性能表现,本文方法与NILM技术中近年来的辨识算法比较如表2所示.10.13245/j.hust.211014.T002表2本文方法与现有方法的比较项目文献[4]文献[5]文献[7]本文PLAIDPLAIDWHITEDPLAIDWHITEDPLAIDWHITED负荷签名二值化V-I图像加权像素V-I图像具有颜色编码的V-I图像真彩可视化图像识别方法Random Forest2DCNNAlexNet2DCNN参数量/10621.18600.0670.111计算量/10663.497200.9051.581数据集识别率/%81.7577.6075.4695.4098.6696.6399.05当用传统方法绘制较小的轨迹图像时,数据信息会存在丢失现象,而本文方法绘制的真彩可视化图像其每个像素点都包含了原始的数据信息,减小了图像的冗余度,充分利用电压和电流信息的细节特征.同时真彩可视化图像将电流形成方向上的时间信息映射到空间位置,便于CNN获取更多的数据特征进行负荷辨识.相比文献[5]和[7],本文方法在提升了一定识别率的同时,预处理和CNN网络结构更加简单.4 结语针对传统人工智能负荷辨识算法网络参数规模庞大、计算复杂度高、辨识准确率不足的问题,提出一种多维数据融合可视化方法,将时间信息映射到空间位置上,融合负荷的电压、电流和V-If轨迹信息,生成尺寸更小、区分度更高的真彩可视化图像,并利用CNN高效地完成负荷辨识任务.对NILM常见的数据集进行了实验,将该方法应用于PLAID和WHITED数据集,得出的宏平均分数值分别为96.63%和99.05%,验证了本文方法的可行性和有效性.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读