Wie man mit der Wikipedia semantische Verfahren verbessern kann

被引:0
作者
Stephan Gillmeier
Urs Hengartner
Sandro Pedrazzini
机构
[1] Canoo Engineering AG,
关键词
D O I
10.1007/BF03340439
中图分类号
学科分类号
摘要
Das automatische Zuweisen von Themengebieten zu beliebigen Dokumenten ist eine der anspruchsvollsten Aufgaben in der Computerlinguistik. Um dies technisch überhaupt bewerkstelligen zu können, setzt es ein gewisses »Verständnis« eines Textes voraus. Üblicherweise werden bei solchen Verfahren groβe — von Hand erstellte — thematisch vorsortierte Datenbanken benutzt. In dieser Arbeit wird zusammen mit statistischen Datenanalysen die »Datenbank« Wikipedia verwendet, um mit ihren semantischen Strukturen automatisch passende Themen von Dokumenten zu identifizieren und anschlieβend zuzuordnen. Darüber hinaus wird mit einem weiteren Verfahren gezeigt, wie das Auffinden ähnlicher Dokumente verbessert werden kann.
引用
收藏
页码:70 / 80
页数:10
相关论文
共 6 条
  • [1] Finkelstein L(2002)Placing search in context: The concept revisited ACM Transactions on Information Systems 20 116-131
  • [2] Gabrilovich Y M(undefined)undefined undefined undefined undefined-undefined
  • [3] Rivlin E(undefined)undefined undefined undefined undefined-undefined
  • [4] Solan Z(undefined)undefined undefined undefined undefined-undefined
  • [5] Wolfman G(undefined)undefined undefined undefined undefined-undefined
  • [6] Ruppin E(undefined)undefined undefined undefined undefined-undefined