摘要: 小样本原型网络被视为解决小样本文本分类问题的有效方法之一。然而,现有方法通常只依赖于单一原型进行训练和推理,容易受到噪声等因素的影响,从而导致泛化能力不足。针对这一问题,提出了一种用于小样本文本分类的互学习原型网络Mutual Learning-ProtoNet(MLProtoNet)。在保留现有算法通过文本嵌入特征直接计算原型的基础上,引入了BERT网络,将文本嵌入特征输入到BERT中以生成新的原型。接着,利用互学习算法,使这两个原型相互约束并进行知识交换,以过滤掉不准确的语义信息。此过程旨在提升模型的特征提取能力,并通过两个原型的共同决策来提高分类精度。在两个小样本文本分类数据集上的实验结果证实了所提出方法的有效性。具体来说,在FewRel数据集上,该方法在5-way 1-shot实验中相较于当前最优方法,精度提高了2.97%,而在5-way 5-shot实验中精度提高了1.99%。
中图分类号: