聚焦小目标的航拍图像目标检测算法

被引：11

作者：

张智 ^{[1
]}

易华挥 ^{[1
]}

郑锦 ^{[2
]}

机构：

[1] 中国民航大学计算机科学与技术学院

[2] 北京航空航天大学计算机学院

来源：

电子学报 | 2023年 / 51卷 / 04期

基金：

国家重点研发计划;

关键词：

航拍图像; 目标检测; 小目标特征聚合网络; 任务平衡样本分配; 增强检测头;

D O I：

暂无

中图分类号：

TP391.41 [];

学科分类号：

080203 ;

摘要：

与通用目标检测不同，无人机（Unmanned Aerial Vehicle,UAV）航拍图像目标检测主要面临两个难题：（1）远距离观察下存在大量小尺寸目标，难以与背景区分；（2）大量区域中目标密集且存在严重遮挡.因此，将通用目标检测器直接应用于航拍图像会导致检测精度下降.本文提出一种聚焦小目标的航拍图像目标检测算法（Focusing on Small objects Detector in aerial images,FocSDet）.针对小目标，通过密集高级组合（Dense Higher-Level Composition,DHLC）模式连接双Swin-Transfomer骨干网络，并和特征金字塔（Feature Pyramid Networks,FPN）结合，构建小目标特征聚合网络作为FocSDet的骨干网络，可丰富单层特征表达并提升对图像全局信息的利用，在不损失大目标语义信息的同时得到对小目标更好的特征描述，有效提升了小目标检测能力；针对区域密集遮挡，提出任务平衡样本分配策略，区别于现有样本分配策略只依赖定位位置，本文所提出的策略中样本匹配质量评价分数由定位位置信息和预测分类分数共同构成.基于该新评价分数不断迭代更新样本分配和监督网络优化，取得了更高质量的预测结果 .最后，在检测头的分类和回归分支中引入层注意力构成增强检测头，进一步提升了小目标的检测性能.在Visdrone无人机数据集、CARPK航拍数据集上的实验表明，本文提出的FocSDet相较于现有方法 ATSS和VFNET，在Visdrone上平均精度（Average Precision,AP）分别提升2%和0.6%，小目标APs分别提升2.6%和1.2%；在CARPK上AP分别提升2.2%和1.7%，小目标APs分别提升5.2%和5.0%.

引用

页码：944 / 955

页数：12

共 6 条

[1] 使用GIoU改进非极大值抑制的目标检测算法
侯志强
刘晓义
余旺盛
蒲磊
马素刚
范九伦
[J]. 电子学报, 2021, 49 (04) : 696 - 705
[2] FCOS: A Simple and Strong Anchor-free Object Detector[J].IEEE transactions on pattern analysis and machine intelligence,2020
[3] Zhang S.,Chi C.,Yao Y.,Lei Z.,Li S.Z..Bridging the gap between anchor-based and anchor-free detection via adaptive training sample selection[J].Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2020
[4] Hao Long,Yi-Nung Chung,Zhenbao Liu,Shuhui Bu.Object Detection in Aerial Images Using Feature Fusion Deep Networks[J].IEEE Access,2019
[5] Ren Shaoqing,He Kaiming,Girshick Ross,Sun Jian.Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J].IEEE transactions on pattern analysis and machine intelligence,2017
[6] ImageNet Large Scale Visual Recognition Challenge
Olga Russakovsky
Jia Deng
Hao Su
Jonathan Krause
Sanjeev Satheesh
Sean Ma
Zhiheng Huang
Andrej Karpathy
Aditya Khosla
Michael Bernstein
Alexander C. Berg
Li Fei-Fei
[J]. International Journal of Computer Vision, 2015, 115 : 211 - 252

← 1 →