基于BLSTM-CNN-CRF的中文命名实体识别方法

被引:16
作者
刘宇鹏
栗冬冬
机构
[1] 哈尔滨理工大学软件与微电子学院
关键词
命名实体识别; 长短期记忆网络; 卷积神经网络; 条件随机场;
D O I
10.15938/j.jhust.2020.01.017
中图分类号
TP391.1 [文字信息处理]; TP183 [人工神经网络与计算];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
传统的命名实体识别方法依赖大量的人工选择的特征和专业领域的外部知识,针对这一问题,提出了一种新颖的神经网络结构,该算法结合了双向LSTM,CNN和CRF可以同时自动获取到基于字符级别和词语级别的表示,是一种真正意义上的端到端的结构,不再需要人工选择特征和数据的预处理,可以应用到各个领域的命名实体识别任务中去。最后,通过实验证明该算法在医疗领域和新闻领域的F1值分别达到了90.97%和92.19%。
引用
收藏
页码:115 / 120
页数:6
相关论文
共 9 条
[1]   基于CRF和半监督学习的维吾尔文命名实体识别 [J].
王路路 ;
艾山吾买尔 ;
买合木提买买提 ;
卡哈尔江阿比的热西提 ;
吐尔根依布拉音 .
中文信息学报, 2018, 32 (11) :16-26+33
[2]   融合跨语言特征的柬埔寨语命名实体识别方法 [J].
徐广义 ;
严馨 ;
余正涛 ;
周丽华 .
云南大学学报(自然科学版), 2018, 40 (05) :865-871
[3]   基于主题标签和CRF的中文微博命名实体识别 [J].
朱颢东 ;
杨立志 ;
丁温雪 ;
冯嘉美 .
华中师范大学学报(自然科学版), 2018, 52 (03) :316-321
[4]   命名实体识别研究综述 [J].
刘浏 ;
王东波 .
情报学报, 2018, 37 (03) :329-340
[5]   基于条件随机场的学术期刊中理论的自动识别方法 [J].
陈锋 ;
翟羽佳 ;
王芳 .
图书情报工作, 2016, 60 (02) :122-128
[6]   中文电子病历命名实体标注语料库构建 [J].
曲春燕 ;
关毅 ;
杨锦锋 ;
赵永杰 ;
刘雅欣 .
高技术通讯, 2015, 25 (02) :143-150
[7]  
基于条件随机场的中文命名实体识别特征比较研究.[A].张祝玉;任飞亮;朱靖波;.第四届全国信息检索与内容安全学术会议.2008,
[8]  
Named Entity Recognition in Chinese Clinical Text Using Deep Neural Network.[J].Indra Neil Sarkar;Andrew Georgiou;Paulo Mazzoncini de Azevedo Marques;Yonghui Wu;Min Jiang;Jianbo Lei;Hua Xu.Studies in Health Technology and Informatics.2015,
[9]   A survey of named entity recognition and classification [J].
Nadeau, David ;
Sekine, Satoshi .
LINGUISTICAE INVESTIGATIONES, 2007, 30 (01) :3-26