《电子技术应用》
您所在的位置:首页 > 其他 > 设计应用 > 基于改进Mask R-CNN的非结构环境小目标语义分割算法
基于改进Mask R-CNN的非结构环境小目标语义分割算法
电子技术应用
何兆蓉,郭健,徐琦,韩锐
南京理工大学 自动化学院
摘要: 计算机视觉对于小目标物体语义识别在非结构环境下有着较好的工程应用前景,但由于小目标零部件结构多变、样本少、环境复杂,传统方法对小目标分割识别的准确率较低。针对此问题,设计了一种基于注意力机制的Mask R-CNN改进模型。在原网络结构的基础上将FNP与融合注意力模块相结合,提出了一种A-FNP模块。以空间卫星作为非结构环境实验场景,对卫星帆板以及爆炸螺栓进行实验。实验结果表明,该方法对卫星帆板及其零部件的识别准确率提高了5.36%,相较于原模型优势显著。
中图分类号:TP391.41 文献标志码:A DOI: 10.16157/j.issn.0258-7998.245136
中文引用格式: 何兆蓉,郭健,徐琦,等. 基于改进Mask R-CNN的非结构环境小目标语义分割算法[J]. 电子技术应用,2024,50(10):76-81.
英文引用格式: He Zhaorong,Guo Jian,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,2024,50(10):76-81.
Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN
He Zhaorong,Guo Jian,Xu Qi,Han Rui
School of Automation, Nanjing University of Science and Technology
Abstract: Computer vision has a good engineering application prospect for semantic recognition of small target objects in non-structural environments, but due to the changeable structure, small samples and complex environment of small target parts, the accuracy of traditional methods for small target segmentation recognition is low. To solve this problem, an improved Mask R-CNN model based on attention mechanism is designed in this paper. Based on the original network structure, an A-FNP module is proposed by combining FNP and fusion attention module. Taking the space satellite as the unstructured environment test scene, the satellite sails and explosive bolts are tested. The experimental results show that the accuracy of the proposed method is improved by 5.36%, which is significantly superior to the original model.
Key words : semantic segmentation;attention mechanism;Mask R-CNN;unstructured environment

引言

随着计算机技术的持续进步,传统的语义分割算法对于大规模的对象检测网络模型具有很高的识别精度,但是,这些算法在识别小目标对象时面临着不少的挑战,如存在错误识别或者由于候选框之间相互重叠而无法识别的相关问题。在非结构环境中,处理零部件的数据存在许多挑战,如缺陷样本的数量较少、状态特征存在显著差异、特征粒度差异性较小等。传统的语义分割方法检测的性能比较容易受到环境因素的影响,如照明强度、场景遮挡等,从而导致检测的准确性较低、适应能力较弱。深度学习卷积神经网络具有许多优势,包括强大的泛化能力、高检测准确性以及对环境照明变化的抵抗力强等,因此,深度学习卷积神经网络已经被引入整合到小目标零件的检测中。

在复杂环境下针对小目标的语义分割研究中,魏永超等[1]提出了一种基于Mask R-CNN 算法的改进算法,以解决对缺陷类型的有限和对非结构化环境中对小目标缺陷的语义分割效果差强人意的问题。通过添加SENet模块并改善NMS算法,使新模型的准确性得到了显著提高。文韬[2]解决了传统Mask R-CNN中小目标对象的低识别率的问题,并使用GFPN作为Mask R-CNN模型的功能采集。该模型通过融合从GFPN获得的特征来设置各种特征的权重。苟军年等[3]解决了复杂背景、小像素目标以及Mask R-CNN模型对于传输电路中绝缘子缺陷检测不充分的问题。将卷积注意力模块(Convolutional Block Attention Module, CBAM)引入特征提取网络中,以达到从空间和通道角度提高小目标的特征保留。

本文以空间卫星作为非结构环境的实验场景,以卫星帆板展开机构的爆炸螺栓作为待检测的小目标物体。卫星帆板展开异常是空间卫星故障中最常见的形式之一,造成这种故障的原因主要是爆炸螺栓未完全。此时解决故障的方式一般是通过识别未完全爆炸或未爆炸的螺栓进行补充剪切操作。针对卫星帆板的维修任务,首先需要检测并识别出空间卫星中的一些目标物体,如卫星帆板的反光板面以及未完全爆炸的螺栓等。

针对小目标零件的语义分割研究,程敦诚等[4]使用U-net8将螺母、螺杆和其他信息标记成为不同颜色,并对其图片进行语义分割,以检测螺栓是否处于正常的状态。罗隆福等[5]提出一种基于深度学习的螺栓裂纹检测方法,该方法使用DeepLab v3 plus 算法在螺栓上执行语义分割。李红卫等[6]利用深度学习框架Mask R-CNN[7]智能分析了通过机械臂视觉传感器获得的视觉信息,并根据RGB图像数据实现了小目标零部件的语义分割。

本文在上述研究的基础上,结合卫星帆板中爆炸螺栓的结构特征,提出了一种基于注意力机制的Mask R-CNN语义分割优化算法,在改进模型中完成对爆炸螺栓的语义分割,并与原Mask R-CNN的网络模型进行性能对比,改进后模型优势显著。


本文详细内容请下载:

//www.chd2016240209.com/resource/share/2000006182


作者信息:

何兆蓉,郭健,徐琦,韩锐

(南京理工大学 自动化学院,江苏 南京 210094)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map