摘要: 提出了一种面向工程咨询报告的文本检索模型,通过联合语义匹配和关联匹配实现了标题与段落的准确、高效检索,可有效地辅助工程咨询报告的撰写工作。首先,基于工程咨询报告的文本检索语料集,对对比学习模型进行微调,并对标准的基于变换器的双向编码器(Vanilla BERT)模型进行初始化;接着,利用 Vanilla BERT 模型和线性层对语料文本进行训练,得到语义匹配分数。同时, 构建了文本信息和关键词信息的义原词向量表示,并通过深度文本交互模型获得关联匹配分数。将语义匹配分数和关联匹配分数归一化后进行加权融合,得到最终的匹配分数,完成标题与段落之间的文本检索。在所提模型中结合了上下文向量表示和文本交互匹配方法,相较于最优的对比模型,所提模型的 P@20 评价指标提升了 7.49% ,有效增强了文本检索的效果。
中图分类号: