交通标志识别技术在辅助驾驶、自动驾驶、交通安全、智能城市及智慧交通等领域具有重要的作用。深度学习技术在目标检测和识别方面具有突出表现,但这些算法在部署到实际应用场景时面临着若干挑战,例如涉及复杂的网络结构,对硬件的算力要求较高[1]。DANG等[2]提出了用C3_new模块替换掉YOLOv5算法中的C3模块,降低算法计算量和参数量,并在私有数据集验证,平均识别精度达到了79.2%,模型大小为50 M。熊恩杰等[3]在YOLOv8n的基础上引入GhostConv、GAM注意力机制和GIoU损失函数来轻量化算法,并在TT100K[4]数据集的平均识别精度为71.9%,模型大小和参数量为6.07 M和2.80 M。本文提出YOLOv8-MixGhost交通标志识别轻量化算法,降低了对硬件的性能要求,有利于交通标志识别技术普及,应用前景广泛。1YOLOv8算法YOLOv8算法是较新版本的YOLO算法,兼顾了识别精度和识别效率,主要可以分为主干特征提取网络、颈部的特征融合网络和识别头3个部分。主干网络和颈部网络的结构与之前的YOLO系列变化较小,不同点在于特征提取和特征融合使用的模块不同。YOLOv8的头部较之前变化较大,采用了解耦头将回归任务和分类任务分开处理,避免了两者的相互影响,提高了训练效率。对于YOLOv8的损失函数,回归分支采用了DFL+CIou的方法,分类分支采用了BCE Loss。此外,采用了Anchor-Free的方法和TaskAligendAssigner的动态标签分配策略。2YOLOv8-MixGhost算法2.1MixGhost轻量级特征提取模块MixGhost模块分为主干网络使用的MixGhost-B和颈部网络使用的MixGhost-N两个版本,设计思想来自MixConv[5]、FasterNet[6]和GhostNet[7]。MixGhost模块在抑制冗余信息方面具有显著特点,相较于其他特征提取模块主要有两方面的改进。一是体现在MixGhost模块的整体架构上,借鉴了FasterNet提出的部分卷积思想,使参与计算的输入通道数占总通道数的1/4,其余3/4直接通过恒等变换与参与计算的部分拼接在一起;二是在参与计算的1/4通道中使用了Ghost卷积来参与计算,并通过恒等变换操作生成特征图,在抑制冗余信息的同时,降低了计算量。为了进一步降低计算量,将参与计算的1/4通道未使用批量归一化和激活函数,与没有参与计算的3/4通道进行拼接统一计算,进而达到提升计算效率目的。为了应对计算量降低、识别能力下降,将参与计算的1/4分为两部分,各占输入总通道数的1/8,分别使用3×3和5×5两种大小的卷积核进行计算,将这两部分与没有参与计算的部分进行拼接,获得不同大小的感受野,增强了特征表达能力。将参与计算的通道和没有参与计算的通道拼接后,通过1个1×1的卷积来整合不同通道间特征信息并进行通道数目的扩充,增强模块的特征提取能力。再使用1×1的卷积实现通道数的缩小,与输入的特征图进行残差操作,使过减少拟合的风险,降低了训练的难度,提升了泛化能力。在理论上分析了MixGhost-B模块和主干中C2f模块的计算量,批量归一化层和激活函数相对于卷积其计算量较小,在分析计算量时忽略了其带来的影响,卷积的计算量表达式:FLOPs(Conv)=O×G×K×I×S2 (1)式中:S——卷积核尺寸;I——输入的通道数;O——输出的通道数;G、K——输出特征图尺寸。主干网络中的C2f模块其主要的计算量主要来自4个卷积,C2f在主干网络使用时并不改变通道数的大小,因此O=I,FLOPs的计算公式:FLOPs(C2f)≈7×I2×G×K (2)MixGhost-B模块的主要计算量包括4个普通卷积和2个分组卷积,其输入通道数等于输出通道数,即O=I,FLOPs的计算式:FLOPs(MixGhost)≈(273/64)×I2×G×K+(25/8)×I×G×K (3)当输入通道数I较大时,可以忽略其带来的影响,因此MixGhost-B模块的FLOPs仅有主干中C2f的60.9%。MixGhost-N与MixGhost-B的结构基本相同,仅在通道输入时,使用了1个1×1的卷积进行通道数的缩放和不同通道间的信息整合。由MixGhost-B和主干中C2f计算量的比值可知,MixGhost-N和颈部C2f计算量的比值为75.2%。MixGhost模块在计算量上相比C2f显著降低,输入输出通道数较大时,MixGhost-B计算量为主干网络C2f的60.9%,MixGhost-N计算量为颈部网络C2f的75.2%。MixGhost模块抑制了冗余信息,在算法中使用MixGhost模块会降低模型的计算量,使算法更关注有效的信息,因此,MixGhost模块在精度上较C2f模块有一定提升。2.2SEG_HeadYOLOv8采用解耦头,相对于非解耦头有很多优点,但解耦头较非解耦头增加了计算量,对于轻量化算法不友好,为了降低解耦头对计算量带来的影响,本文提出了SEG_Head。在回归分支引入Ghost卷积来降低冗余信息,降低计算量,提高计算效率。通常引入Ghost卷积后会带来计算量的下降,模型的识别精度也会随着计算量的下降而降低。本文为减少对识别精度的影响,分别在回归分支和分类分支上引入了SE注意力机制[8],SE注意力机制通过压缩和激励操作,自适应地调整网络中不同通道的特征重要性,提高了特征提取的效率,其计算过程相对简单,计算量和参数量较小,对于设计轻量化的识别网络比较难得。SEG_Head在回归分支和分类分支上引入了SE注意力机制,但由于SE注意力机制主要由挤压和激励构成,其引起的计算量相对较小,所以在计算SEG_Head的计算量时可以将回归分支和分类分支上的SE注意力机制影响忽略不计。因此,SEG_Head的计算量可以看成是由5个卷积和1个Ghost卷积组成,相较于YOLOv8解耦头的FLOPs,其主要计算量差距在于Ghost卷积带来的计算量下降。SEG_Head与YOLOv8检测头的计算量差值表达式:D1≈(9/2)×O×I×G×K-(25/2)×O×G×K (4)随着通道数的增加,SEG_Head所带来的计算量显著下降,同时通过Ghost卷积实现了冗余信息的抑制,引入的SE注意力机制使算法更关注重点区域,因此较YOLOv8解耦头更高效。YOLOv8-MixGhost结构如图1所示。10.19301/j.cnki.zncs.2024.03.003.F001图1YOLOv8-MixGhost结构3实验分析数据集采用清华大学和腾讯联合实验室使用街景图像构建和整理公开的Tsinghua-Tencent 100K(TT100K)在2021年更新过的交通标志数据集。本实验选择了TT100K中常见的45类数据集。实验数据集共包含图像9 743张,按照7∶2∶1的比例随机划分为训练集、评估集和测试集。同时,为提升算法的训练速度,将所有的图像统一裁剪为640×640的尺寸。为了合理评估算法的性能,选择了平均识别精度(mAP)、模型参数量、模型大小和计算量,为提高实验准确性,本次实验共训练300轮次。3.1与主流交通标志识别算法对比本文选择了几种轻量化算法进行对比实验,计算量单位为GFLOPs,此处用G表示。主流算法对比实验结果如表1所示。10.19301/j.cnki.zncs.2024.03.003.T001表1主流算法对比实验结果算法mAP50test/%计算量/G参数/M模型大小/MYOLOv8n74.38.13.016.3YOLOv5s63.716.17.1314.7YOLOv7tiny61.113.46.1212.5Our75.16.72.475.2本文算法在客观评价指标上均优于其他算法,在识别精度上优于其他算法是因为MixGhost模块有效地抑制了冗余信息,使算法更关注有效区域,使用不同的卷积核提升了特征表达能力。SEG_Head利用轻量化的注意力机制增强了模型的特征提取能力,有利于识别精度的提升。由于识别速度上的提升,MixGhost模块和SEG_Head抑制了冗余信息,加快了识别效率。3.2消融实验消融实验结果如表2所示。10.19301/j.cnki.zncs.2024.03.003.T002表2消融实验结果实验mAP50test/%计算量/G参数/M模型大小/M①74.38.13.016.3②75.27.12.595.4③75.16.72.475.2消融实验①表示YOLOv8n原算法实验数据;②表示在YOLOv8n的基础上使用MixGhost模块实验数据,使用MixGhost模块后,模型在测试集上的平均识别精度提高0.9%,计算量降低了1.0 G,参数量下降0.42 M,模型大小减少0.9 M。数据对比说明,采用MixGhost模块不仅降低了模型的计算量,还提升了模型的特征表达能力,体现了MixGhost高效特性和轻量化。③在②的基础上使用了SEG_Head模块,计算量较②下降了0.4 G,平均识别精度降低了0.1%,参数量降低了0.12 M,表明SEG_Head不仅成功抑制冗余信息,还更加关注重点区域,使计算量下降,而识别能力几乎不受影响。改进后的算法较基线算法YOLOv8n在平均识别精度上提高了0.8%,计算量降低了1.4 G,参数量降低了0.54 M,模型大小降低了1.1 M,YOLOv8-MixGhost算法优于原算法。3.3可视化分析可视化分析如图2所示。10.19301/j.cnki.zncs.2024.03.003.F002图2可视化分析YOLOv8-MixGhost算法以YOLOv8n算法82.7%的计算量获得了比YOLOv8n更高的置信度,且误检率更低,说明了YOLOv8-MixGhost算法的优越性。4结语本文提出了YOLOv8-MixGhost交通标志识别轻量化算法,计算量仅有YOLOv8n的82.7%,但平均识别精度较YOLOv8n提高了0.8%。YOLOv8-MixGhost算法降低了模型部署应用时对于硬件性能的要求,有利于交通识别技术的普及以及智能城市、智慧交通的建设。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览