北京邮电大学学报 ›› 2024, Vol. 47 ›› Issue (4): 57-62.
复杂端到端场景的跨视觉域目标检测算法
陈傲然 黄海 朱玥琰 薛俊笙
- 北京邮电大学 信息与通信工程学院
Cross-Domain Object Detection Algorithm for Complex End-to-End Scene Understanding
CHEN Aoran, HUANG Hai, ZHU Yueyan, XUE Junsheng
- School of Information and Communication Engineering, Beijing University of Posts and Telecommunications
摘要: 深度学习应用往往假设部署场景与训练数据具有相似的视觉域特征分布,但是在复杂端到端场景中该假设并不总是成立,难以满足开放环境中智能检测业务的需求。为此,提出了基于人工智能闭环组合理论与跨视觉域的目标检测算法,在检测框架中引入多尺度卷积层构建检测算法的主干网络与瓶颈层网络,提出带有长距离依赖注意力的视觉域判别器作为二次检测头细化检测结果,设计基于空间重构注意力单元的背景聚焦模块进行伪背景图的聚焦学习,从而提升跨视觉域目标检测的准确率。实验结果表明,所提算法在跨视觉域场景中目标检测平均准确率相比双阶段算法提高 6.9% ,相比单阶段算法提高 9.0% 。
中图分类号: