基于BERT-BiGRU-CRF与多头注意力机制的地理命名实体识别

被引:2
作者
徐道柱 [1 ,2 ]
金澄 [1 ,2 ]
马超 [1 ,2 ]
焦洋洋 [1 ,2 ]
许剑 [1 ,2 ]
机构
[1] 地理信息工程国家重点实验室
[2] 西安测绘研究所
关键词
地理知识图谱; 命名实体识别; BERT预训练模型; 多头注意力机制;
D O I
10.19358/j.issn.2097-1788.2023.S1.029
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
地理知识图谱作为一种科学领域的知识图谱,从概念探讨和初步实验阶段快速发展为地理信息科学领域的跨学科研究热点。地理命名实体识别是地理知识图谱构建的基础,直接影响着地理知识图谱的构建效率与质量。设计了一个地理知识图谱应用管理系统,针对其中地理实体库构建过程依赖人工制定规则以及信息提取不充分等问题,面向地理知识图谱构建过程进行地理命名实体识别研究。首先,通过人工标注方法构建了一个地理知识语料库;其次,通过BERT预训练模型得到结合语境信息的动态字向量,利用双向门控循环单元提取全局语义特征,并基于注意力机制获得增强语义特征;最后,通过CRF解码输出概率最大的全局最优标签序列,实现地理命名实体的自动识别。实验结果表明,相比传统的BiLSTM-CRF、BERT-BiLSTM-CRF等模型,所提出的基于BERT-BiGRU-CRF与多头注意力机制的模型在地理命名实体识别任务中表现更优,能够为地理知识图谱构建提供有效支撑。
引用
收藏
页码:169 / 173
页数:5
相关论文
共 12 条
  • [1] Geoscience Knowledge Graph (GeoKG): Development, construction and challenges
    Zhang, Xueying
    Huang, Yi
    Zhang, Chunju
    Ye, Peng
    [J]. TRANSACTIONS IN GIS, 2022, 26 (06) : 2480 - 2494
  • [2] Bidirectional LSTM-CRF Models for Sequence Tagging..[J].Zhiheng Huang;Wei Xu;Kai Yu 0001.CoRR.2015,
  • [3] 面向Web数据的知识图谱学习与推理关键技术研究.[D].郭琳.西安邮电大学.2018, 12
  • [4] 地理知识图谱下的建筑群空间分布模式推理
    唐曾杨
    艾廷华
    徐海江
    [J]. 地球信息科学学报, 2023, 25 (06) : 1202 - 1214
  • [5] 基于BERT-BiLSTM-CRF模型的地理实体命名实体识别
    汤洁仪
    李大军
    刘波
    [J]. 北京测绘, 2023, 37 (02) : 143 - 147
  • [6] 基于BERT的中文命名实体识别方法
    王子牛
    姜猛
    高建瓴
    陈娅先
    [J]. 计算机科学, 2019, 46(S2) (S2) : 138 - 142
  • [7] 多源异构数据的大规模地理知识图谱构建
    蒋秉川
    万刚
    许剑
    李锋
    温荟琦
    [J]. 测绘学报, 2018, (08) : 1051 - 1061
  • [8] 论地理知识图谱
    陆锋
    余丽
    仇培元
    [J]. 地球信息科学学报, 2017, (06) : 723 - 734
  • [9] 知识图谱研究进展
    漆桂林
    高桓
    吴天星
    [J]. 情报工程, 2017, 3 (01) : 4 - 25
  • [10] 开放式地理实体关系抽取的Bootstrapping方法
    余丽
    陆锋
    刘希亮
    [J]. 测绘学报, 2016, 45 (05) : 616 - 622