摘要: 在复杂拥挤的场景中,单眼行人检测通常因为着遮挡问题导致严重的误判。不过,通过结合多视角的数据进行多视图行人检测能够有效的解决遮挡问题。但是以往的多视图检测算法都是只采用单级特征图完成检测,这导致对多尺度目标的检测效果不佳。为了解决上述问题,提出一种新颖的多视图检测算法,采用Dilated Encoder方法进行多视图信息的聚合。Dilated Encoder通过采用不同膨胀率膨胀卷积从单层特征层中得到不同尺度感受野,从而覆盖目标的所有尺度范围,提高对多尺度目标的检测能力。最后在Wildtrack据集上的实验结果表明,多目标检测精度指标MODA最高可达90.7%。
中图分类号: