摘要: 为实现对数字文档和扫描文档中排版格式信息的自动结构化分析,提出了一种参数重分配策略的通用文档版面分析方法。通过引入参数重分配思想,优化模型整体参数平衡。首先,在特征金字塔网络结构中融入全维动态卷积 (ODConv) 和FasterNet思想,轻量化neck层以降低过拟合风险。接着,提出了跳跃连接空间金字塔池化结构 (Inception-SPPF) ,提高对不同尺度目标的特征提取能力。最后,设计了C3RepLKBlock通用模块,利用大卷积核实现全局特征提取,通过梯度流思想的特征融合引导结构重参数化,解决过度平滑问题。实验结果显示,改进后的模型在PubLayNet数据集上mAP 0.50~0.95达到95.9%,明显优于YOLOv5s和其他算法。本方法可以满足文档版面分析任务的稳定可靠和高精度的要求。
中图分类号: