面向中文科技文献非结构化摘要的知识元表示与抽取研究——基于知识元本体理论

被引:18
作者
郑梦悦
秦春秀
马续补
机构
[1] 不详
[2] 西安电子科技大学经济与管理学院
[3] 不详
关键词
科技文献; 非结构化摘要; 知识表示; 知识抽取; 知识元; 本体模型;
D O I
10.16353/j.cnki.1000-7490.2020.02.024
中图分类号
G254 [文献标引与编目];
学科分类号
摘要
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。
引用
收藏
页码:157 / 163
页数:7
相关论文
共 50 条
[1]  
Recent trends in academic journal growth. GU X,BLACKMORE K L. Scientometrics . 2016
[2]  
Recent trends in academic journal growth. GU X,BLACKMORE K L. Scientometrics . 2016
[3]  
The identification of clinically important elements within medical journal abstracts: Patient-Population-Problem, Exposure-Intervention, Comparison, Outcome, Duration and Results (PECODR). Martin Dawes,Pierre Pluye,Laura Shea,Roland Grad,Arlene Greenberg,Jian-Yun Nie. Informatics in Primary Care . 2007
[4]  
The identification of clinically important elements within medical journal abstracts: Patient-Population-Problem, Exposure-Intervention, Comparison, Outcome, Duration and Results (PECODR). Martin Dawes,Pierre Pluye,Laura Shea,Roland Grad,Arlene Greenberg,Jian-Yun Nie. Informatics in Primary Care . 2007
[5]  
A proposal for more informative abstracts of clinical articles. Ad Hoc Working Group. Annals of Internal Medicine . 1987
[6]  
A proposal for more informative abstracts of clinical articles. Ad Hoc Working Group. Annals of Internal Medicine . 1987
[7]   对等网环境下基于树模型的对等节点的知识地图构建研究 [J].
秦春秀 ;
赵捧未 ;
李东 ;
孙蕾 .
情报学报, 2013, (07) :686-696
[8]   对等网环境下基于树模型的对等节点的知识地图构建研究 [J].
秦春秀 ;
赵捧未 ;
李东 ;
孙蕾 .
情报学报, 2013, (07) :686-696
[9]  
Current findings from research on structured abstracts:an update. Hartley J. Journal of the Medical Library Association . 2014
[10]  
Current findings from research on structured abstracts:an update. Hartley J. Journal of the Medical Library Association . 2014