摘要: 针对当前词义消歧模型的泛化能力不足,提出了基于多通道残差混合空洞卷积的注意力(Multi-Channel Residual Hybrid Dilated Convolution with Attention,MRHA)词义消歧模型。使用语言学知识构建消歧特征,采用三种向量化方式将消歧特征向量化,组成三通道词嵌入矩阵,将位置编码与三通道词嵌入矩阵进行深度融合。设计了一种复杂的卷积编码器以增加模型的表达能力。在SemEval-2007: Task#5和SemEval-2021: Task#2上进行实验,结果表明:相比最新的基于聚类语义标签的词义消歧模型(Word Sense Disambiguation Using Clustered Sense Labels,CSL)和多头注意力机制的多通道卷积神经网络(Multi-Channel Convolutional Neural Networks with Multi-Head Attention,MCNN-MA),所提方法的平均偏差降低了1.345%和2.157%。
中图分类号: