北京邮电大学学报 ›› 2020, Vol. 43 ›› Issue (2): 129-134.doi: 10.13190/j.jbupt.2019-071
• 研究报告 • 上一篇
一种基于ResNet网络特征的视觉目标跟踪算法
马素刚1,2, 赵祥模1, 侯志强2, 王忠民2,3, 孙韩林2
- 1. 长安大学 信息工程学院, 西安 710064;
2. 西安邮电大学 计算机学院, 西安 710121;
3. 西安邮电大学 陕西省网络数据分析与智能处理重点实验室, 西安 710121
A Visual Object Tracking Algorithm Based on Features Extracted by Deep Residual Network
MA Su-gang1,2, ZHAO Xiang-mo1, HOU Zhi-qiang2, WANG Zhong-min2,3, SUN Han-lin2
- 1. School of Information Engineering, Chang'an University, Xi'an 710064, China;
2. School of Computer Science and Technology, Xi'an University of Posts and Telecommunications, Xi'an 710121, China;
3. Shanxi Key Laboratory of Network Data Analysis and Intelligent Processing, Xi'an University of Posts and Telecommunications, Xi'an 710121, China
摘要: 针对复杂场景下目标容易丢失的问题,提出了一种基于深度残差网络(ResNet)特征的尺度自适应视觉目标跟踪算法.首先,通过ResNet提取图像感兴趣区域的多层深度特征,考虑到修正线性单元(ReLU)激活函数对目标特征的抑制作用,在ReLU函数之前选取用于提取目标特征的卷积层;然后,在提取的多层特征上分别构建基于核相关滤波的位置滤波器,并对得到的多个响应图进行加权融合,选取响应值最大的点即为目标中心位置.目标位置确定后,对目标进行多个尺度采样,分别提取不同尺度图像的方向梯度直方图(fHOG)特征,在此基础上构建尺度相关滤波器,从而实现对目标尺度的准确估计.在视频集OTB100中与其他6种相关算法进行了比较,实验结果表明,所提算法取得了较高的跟踪成功率和精确度,能够较好地适应目标的尺度变化、背景干扰等复杂场景.
中图分类号: