在如今信息技术高速发展的时代,各种图片修改软件应运而生,如Photoshop等,出于各种目的生成的篡改图片也遍布互联网的各个角落.而恶意篡改图片的泛滥对工程领域、社会舆论和国家安全都有着重大的影响,图片篡改检测已是网络空间安全领域的重要分支,因此开展图片篡改检测的研究是有着重大前景并且迫在眉睫的重要工作.图像真伪识别技术目前分为主动检测技术和被动检测技术.主动检测技术要对图片进行预先的水印嵌入或数字签名等处理,而生活中大部分的照片是没有经过这些处理的,为了使得鉴别技术的应用范围更广,能够解决主动式鉴别技术解决不了的难题,学者们开始研究被动式鉴别技术,即数字图像的盲取证技术.盲取证类方法是指不须要对图像进行任何预先的处理,直接根据待检测图像本身具有的特性进行分析取证的鉴别过程[1],是一种适应性更好、应用范围更广、研究价值更高的图片真伪识别方式.对此,国内外学者进行了一些研究.文献[2]提出一种结合了尺度不变特征变换(SIFT)和快速鲁棒性特征(SURF)的方法.文献[3]提出基于块和关键点的方法来表征特征提取和匹配过程的通用copy-move检测流程,并对复制区域的类型进行了分类.文献[4]提出使用SIFT提取局部图像特征,然后根据其欧几里得距离搜索相似的关键点,该方法对一些常见的后处理具有鲁棒性.文献[5]提出可以利用颜色滤波阵列(CFA)插值特征的不同来分辨图片是原图还是篡改图.文献[6]提出一种使用卷积级联神经网络的方法,采用级联网络和自适应筛选后处理的方式判断是否篡改和检测篡改区域.文献[7]利用非抽样轮廓变换来对边缘点进行分类,从而找出模糊边缘点,跟据模糊边缘点来定位拼接篡改区域.文献[8]提出利用图片噪声的均值、方差和信噪比等特征来判断图片是否被恶意篡改.文献[9]对图像拼接篡改后边缘处常见的模糊处理进行分析,建立了模糊边缘的数学模型,并对模糊边缘进行检测来定位篡改区域.文献[10]证明了这些伪影表现为频谱在频域的复制,提出了一种基于频谱输入而非像素输入的分类器模型.文献[11]发现不同的GAN在其生成的图像中会留下特定指纹.文献[12]提出使用双流Faster-rcnn网络融合噪声特征和RGB特征来判断图片篡改区域.在图片拼接篡改方面,大多通过识别模糊边缘来确定篡改区域,但是所采取的筛选方法没有考虑照片本身质量对图像边缘的影响,并且存在大量误判边缘点的问题.本研究针对图像拼接篡改方法存在的缺陷,通过结合图像局部灰度标准差和局部灰度偏导期望值来过滤相机失焦模糊边缘,并基于线性回归设定阈值过滤掉伪人工模糊边缘,从而做出改进.1 相关概念1.1 USM增强USM(非锐化掩膜)增强是一种常见的图像锐化方式,其作用是使图像的边缘更清晰.USM增强的公式为g(x,y)=f(x,y)+λ[4f(x,y)-f(x-1,y)-f(x+1,y)-f(x,y-1)-f(x,y+1)],式中:(x,y)为像素点位置;f(x,y)为原图(x,y)位置的像素灰度值;g(x,y)为原图(x,y)位置经过USM增强后的像素灰度值.1.2 Canny边缘检测方法Canny边缘检测算子是一种比较完善的边缘检测算子,其方法过程可以大致分为5个步骤.a. 对原图像进行滤波,这里采用的是高斯滤波器.使用高斯滤波核对图像进行卷积运算,其作用是滤除噪声,排除噪声的干扰.b. 对图像各个点位置的梯度和方向进行计算,梯度由方向和幅值来进行描述.图像梯度幅值计算公式为g(x,y)=∂2f∂x2+∂2f∂y2,图像梯度方向计算公式为θ(x,y)=arctan∂f∂y/∂f∂x.c. 对图像进行非极大值抑制.基于上一步计算出的梯度幅值和方向,在某位置将其梯度值与该位置正负方向上两个像素的梯度值进行比较,如果该位置上的梯度值最大,那么不抑制;如果该位置上的梯度值不是最大,那么要进行非极大值抑制,将其梯度值抑制为0.以上操作可以达到瘦边的效果,使得边缘定位更加精确.d. 用双阈值检测的方法来消除杂散效应.设置两个梯度值阈值,以此将当前点分为三个集合:强边缘点集合,弱边缘点集合和非边缘点集合.对于非边缘点集合的点须要进行抑制.e. 抑制弱边缘点集合中孤立的弱边缘.孤立的弱边缘其实是伪边缘点,须要进行剔除.在Canny边缘检测方法中,如果某个弱边缘点周围的8个像素点全部都不是强边缘像素集合里的点,那么就可以判定其为孤立的弱边缘,并对其进行抑制.1.3 图像灰度化图像灰度化是一种图像预处理的操作.一般情况下,相机拍摄的照片都是彩色图片,由R,G,B三个颜色通道构成,其灰度化操作其实就是对R,G,B三个颜色分量的值进行一定的运算.灰度化的方法主要有最大值法、平均值法和加权平均值法,如Matlab2016b中计算灰度值的方法就是一种加权平均值法求灰度值.2 方法设计针对一种最常见的图像篡改方式——图片拼接篡改,本研究采用基于人工模糊边缘的定位方法实现对疑似篡改区域的定位.a. 图像预处理采用USM增强方法可以对图像进行锐化,提高图片的锐化程度,并且USM增强方法对图像模糊边缘的增强程度和对未经模糊处理的边缘的增强程度存在差异[13],可以进一步帮助区分边缘是否经过模糊处理.未经模糊边缘在USM增强中,随着缩放因子λ的增大,边缘增强幅度较大;而模糊边缘在USM增强中,随着缩放因子λ的增大,边缘增强幅度较小.选定合适的缩放因子λ值可以在模糊边缘增强不多的情况下大幅增强清晰的边缘,一定程度上减少被方法误判为模糊边缘点的个数[13],可以在实验中逐步改变λ的值,选取效果最优的λ.b. 基于像素类似度判定模糊边缘由于人工模糊处理边缘是对模糊邻域内的像素值进行运算,压缩像素值的范围区间,产生平滑的过渡效果,因此在模糊边缘点一定范围的邻域内各个像素点具有一定程度的相似性,而较清晰的边缘则不具有这种相似性.如果选择合适的特征,可以衡量某边缘点和周围点的相似性指标,那么就可以设定一定的阈值对清晰边缘和模糊边缘进行区分.由此文献[14]提出类似度判定方法,本研究第一步采用该方法对清晰边缘和模糊边缘进行区分.c. 区分人工模糊与失焦模糊在对边缘点集合进行筛选后,得到疑似模糊的边缘点集合,由此可以定位模糊边缘的位置.但是在实际应用中这还不够,因为拍摄照片有时会用摄像头聚焦某一个特定的区域,而非聚焦区域可能会产生失焦现象,景物的边缘可能会因此也变得模糊.所以在实际应用中区别人工模糊和失焦模糊是必要的环节.文献[15]提出使用同态滤波的方法来区别人工模糊和失焦模糊,本研究提出用结合图像局部灰度标准差和图像局部灰度偏导从模糊边缘中筛选人工模糊处理的边缘点.人工模糊和失焦模糊可以抽象简化为图1,图中:左图为人工模糊;右图为失焦模糊.可以发现:使用Photoshop等修图软件进行模糊处理时有着清晰的模糊半径,模糊处理只在一个特定的区域内进行;而失焦模糊则没有清晰的模糊边界,呈扩散状模糊.根据这个特点,可以在模糊边缘点的一个较大邻域内计算像素之间的灰度差异,若相互之间差异较大,则为人工模糊;若差异较小,则为失焦模糊.文献[7]提出采用图像局部灰度偏导来进行区分,本研究中结合图像局部灰度标准差和图像局部灰度偏导的计算公式为10.13245/j.hust.210221.F001图1两种模糊抽象      G(m,n)=1/n2∙∑m=-r/2r/2∑n=-r/2r/2∂f(m,n)∂x2+∂f(m,n)∂y2;      σ(m,n)=∑m=-r/2r/2∑n=-r/2r/2f(m,n)-1n2∑m2=-r/2r/2∑n2=-r/2r/2f(m2,n2)2,式中:(m,n)为模糊边缘点的位置,即范围中心;r为区域半径;G(m,n)为区域内各个像素点偏导数的平均值;σ(m,n)为该范围灰度值标准差.实验中发现σ(m,n)和G(m,n)在人工模糊边缘和失焦模糊边缘的表现有明显区别:在人工模糊边缘点,σ(m,n)和G(m,n)的值普遍较大;在失焦模糊边缘点,σ(m,n)和G(m,n)的值普遍较小.d. 基于线性回归过滤伪人工模糊边缘点在筛选出候选人工模糊边缘点集合后,会残留少部分伪人工模糊边缘点.例如文献[16]中介绍的方法在执行完毕后会残留一部分没有篡改过的边缘(误判点),这会产生误导[13].为了避免这种情况发生,文献[15]提出用传统数学形态学中的膨胀腐蚀法来消除伪人工模糊边缘,但是由于对边缘进行腐蚀操作会导致真正的人工模糊边缘受到损失,并且损失较大,最后导致篡改区域定位不清晰,因此须要在去除伪人工模糊边缘的同时,尽可能多的保留真正的人工模糊边缘.观察原图像边缘和筛选出的候选人工模糊边缘,如图2所示,图中:左图为筛选前;右图为筛选后.图中的大雁部分为拼接篡改的区域,其余部分为原图区域.可以发现:人工模糊边缘部分损失比例较小,而非人工模糊边缘损失比例较大,因此可以根据一定区域Ω内边缘的保留比例来判断该区域的边缘为何种边缘.10.13245/j.hust.210221.F002图2方法筛选前后的边缘图像令图像高为M,宽为N,可以将图片划分成d×d的小块,每个区域Ω对应的筛选前的边缘点个数为s1,筛选后的边缘点个数为s2,若s2/s1大于某个特定的阈值λth,则该区域Ω内的点被认为是真人工模糊边缘点,否则为伪人工模糊边缘点.对于不同的图片,选定的最佳阈值λth是不同的(最佳阈值是指能去掉所有伪模糊边缘点的最小阈值,即保留最多的真人工模糊边缘点).经过分析发现最佳阈值的确定与筛选前后的边缘点数目存在一定关系.令筛选前的边缘点集合为Ψ1,筛选后的边缘点集合为Ψ2,选取若干幅图片实验可以发现|Ψ2|/|Ψ1|的值与最佳阈值λth大致成线性关系,因此可以采用线性回归的方法来训练出一个拟合度最高的线性方程,即λth=η|ψ2/ψ1|+ε.选取篡改图片的数据进行线性回归训练,最后训练得出η和ε的值,即η̂=(XTX)-1XTy;ε̂=y¯-η̂X¯,式中:X为图片|Ψ2|/|Ψ1|的值组成的向量;y为图片λth的值组成的向量.这样就可以根据输入图片的实际情况自适应地约定阈值来筛选伪人工模糊边缘点.e. 算法描述输入 待检测图片步骤1 图像预处理;步骤2 基于像素类似度判定模糊边缘;步骤3 区分人工模糊与失焦模糊;步骤4 基于线性回归对伪人工模糊边缘点进行过滤.输出 检测后的图片算法的总时间复杂度为O(s2),其中s为图片边长尺寸大小.3 仿真实验在Windows10和Matlab R2016a的实验环境下,对本研究提出的基于人工模糊边缘方法进行模拟仿真实验.实验选取极具代表性的图片,使用本研究提出的基于人工模糊边缘方法进行检测,这些图片分为真实图片、背景简单的拼接篡改图片、背景简单且失焦模糊的拼接篡改图片、背景复杂的拼接篡改图片和背景复杂且失焦模糊的拼接篡改图片,并和文献[14]中的方法进行对比,可以看出二者在篡改区域定位方面的差异.图3为模拟一幅真实图片的检测效果,图中:第一列为原图,第二列为边缘检测的结果,第三列为人工模糊边缘(即篡改区域)的定位结果;第一行为文献[14]方法执行的效果,第二行为改进后的本研究方法执行的效果.可以看出:文献[14]方法执行后虽然去除了大部分的清晰边缘,但是仍有部分误判的边缘点造成干扰,而本研究方法可以较好地避免误判边缘的干扰.10.13245/j.hust.210221.F003图3真实图片的检测效果图4为模拟一幅背景简单的拼接篡改图片的检测效果,图中:第一列为原图(月亮边缘被人工模糊处理),第二列为边缘检测的结果,第三列为人工模糊边缘(即篡改区域)的定位结果;第一行为文献[14]方法执行的效果,第二行为改进后的本研究方法执行的效果.可以看出:文献[14]方法虽然检测出了大部分模糊边缘,但是月亮内部仍有部分非人工模糊边缘点造成干扰,而本研究方法可以较好地提取人工模糊边缘点.10.13245/j.hust.210221.F004图4背景简单的拼接篡改图片的检测效果图5为模拟一幅背景简单且失焦模糊的拼接篡改图片的检测效果,图中:第一列为原图(花朵边缘被人工模糊处理),第二列为边缘检测的结果,第三列为人工模糊边缘(即篡改区域)的定位结果;第一行为文献[14]方法执行的效果,第二行为改进后的本研究方法执行的效果.可以看出:文献[14]方法将许多失焦模糊的边缘误当成了人工模糊边缘,而本研究方法可以较好地提取人工模糊边缘点,避免失焦模糊的干扰.10.13245/j.hust.210221.F005图5背景简单且失焦模糊的拼接篡改图片的检测效果图6为模拟一幅背景复杂的拼接篡改图片的检测效果,图中:第一列为原图(大雁边缘被人工模糊处理),第二列为边缘检测的结果,第三列为人工模糊边缘(即篡改区域)的定位结果;第一行为文献[14]方法执行的效果,第二行为改进后的本研究方法执行的效果.可以看出:文献[14]方法可以较好地检测出模糊边缘,但是仍有许多未经人工模糊处理的边缘被检测出来,而本研究方法可以较好地提取人工模糊边缘点,避免误判点的干扰.10.13245/j.hust.210221.F006图6背景复杂的拼接篡改图片的检测效果图7为模拟一幅背景复杂且失焦模糊的拼接篡改图片的检测效果,图中:第一列为原图(小猫边缘被人工模糊处理),第二列为边缘检测的结果,第三列为人工模糊边缘(即篡改区域)的定位结果;第一行为文献[14]方法执行的效果,第二行为改进后的本研究方法执行的效果.可以看出:文献[14]方法不仅将许多清晰边缘误判成了模糊边缘,并且还将失焦模糊边缘误判成了人工模糊边缘,而本研究方法可以较好地提取人工模糊边缘点,尽量避免了两种误判的干扰.10.13245/j.hust.210221.F007图7背景复杂且失焦模糊的拼接篡改图片的检测效果综上可以看出:本研究方法在各种背景下都可以对人工模糊边缘进行筛选,从而对拼接篡改中的人工模糊区域进行定位,该方法的定位在一定程度上较文献[14]方法更清晰明确,较好地避免了失焦模糊和误判点的干扰.4 结语本研究针对图像拼接篡改问题,就已有方法存在的阈值设置带来的误判点的干扰和不能较好地区分人工模糊与失焦模糊边缘的不足,提出了基于人工模糊边缘的篡改区域定位方法.实验结果表明:基于人工模糊边缘的篡改区域定位方法可以在一定程度上减少阈值设置带来的误判点的干扰,并且可以较好地区分人工模糊与失焦模糊边缘.未来可以着眼于提高算法的鲁棒性和普适性.

使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,

确定继续浏览么?

复制成功,请在其他浏览器进行阅读