Entity Linking mit Dexter

Das Verknüpfen von Eigennamen mit einer Wissensbasis

Eines der wichtigsten Modelle, mit welchen Tomo arbeitet, wird heute näher beleuchtet: Entity Linking.

Als Entity Linking wird das Disambiguieren von Eigennamen durch deren Verknüpfung mit einer Wissensbasis bezeichnet.

Ein modulares (Open Source) Framework für Entity Linking stellt Dexter dar.

Framework Dexter

Entity Linking

Dexter besteht aus den Modulen

  • Framework Dexter
  • Dexter Common
  • Json Wikipedia
  • Dexter Core
  • Dexter Webapp
  • Spotter
  • Disambiguator

 

Diese Modularität erlaubt die Verwendung unterschiedlicher Spotter und Disambiguatoren. Ein Spotter detektiert Oberflächenformen in einem Text. Ein Disambiguator wählt die beste Entität aus mehreren Kandidaten aus, die für die Verlinkung einer Oberflächenform zu einer Knowledge Base in Frage kommen.

Entity Linker

Dexter enthält die Nachimplementierungen zweier Entity Linker:

  1. TagME
  2. WikipediaMiner

TagME ist ein kollektiver Entity Linker und verwendet einen Voting Ansatz für die Disambiguierung. Wikipedia Miner ist ebenfalls ein kollektiver Entity Linker und verwendet einen Ansatz des maschinellen Lernens. Wikipedia Miner lernt aus den Verlinkungen von Wikipedia Artikeln ein Weka Modell, welches dann für die Disambiguierung verwendet wird.

Sowohl TagME als auch Wikipedia Miner berücksichtigen die Relatedness von Entitäten in einer Knowledge Base bei der Disambiguierung und verwenden ein Graphen Modell der Entitäten.

 

Referenzen:

http://dexter.isti.cnr.it/

http://tagme.di.unipi.it/

https://github.com/dnmilne/wikipediaminer/wiki