少样本文本分类的多任务原型网络

被引:5
作者
于俊杰
程华
房一泉
机构
[1] 华东理工大学信息科学与工程学院
关键词
少样本学习; 原型网络; 文本分类; 多任务学习;
D O I
10.19734/j.issn.1001-3695.2021.11.0463
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
少样本文本分类中,原型网络对语义利用不足、可迁移特征挖掘不够,导致模型泛化能力不强,在新任务空间中分类性能不佳。从模型结构、编码网络、度量网络等角度提高模型泛化性,提出多任务原型网络(multiple-task prototypical network, MTPN)。结构上,基于原型网络度量任务增加辅助分类任务约束训练目标,提高了模型的语义特征抽取能力,利用多任务联合训练,获得与辅助任务更相关的语义表示。针对编码网络,提出LF-Transformer编码器,使用层级注意力融合底层通用编码信息,提升特征的可迁移性。度量网络使用基于BiGRU的类原型生成器,使类原型更具代表性,距离度量更加准确。实验表明,MTPN在少样本文本情感分类任务中取得了91.62%的准确率,比现有最佳模型提升了3.5%以上;在新领域的情感评论中,基于五条参考样本,模型对查询样本可获得超过90%的分类准确率。
引用
收藏
页码:1368 / 1373
页数:6
相关论文
共 3 条
[1]   基于自注意力和自编码器的少样本学习 [J].
冀中 ;
柴星亮 .
天津大学学报(自然科学与工程技术版), 2021, 54 (04) :338-345
[2]   用于文本分类的均值原型网络 [J].
线岩团 ;
相艳 ;
余正涛 ;
文永华 ;
王红斌 ;
张亚飞 .
中文信息学报, 2020, (06) :73-80+88
[3]  
Generalizing from a Few Examples[J] . Yaqing Wang,Quanming Yao,James T. Kwok,Lionel M. Ni. ACM Computing Surveys . 2020 (3)