DFKI-LT - Automatische Extraktion von semantischen Relationen aus linguistisch annotierten Texten

Mihaela Vela, Thierry Declerck
Automatische Extraktion von semantischen Relationen aus linguistisch annotierten Texten
2 Proceedings of the Workshop "Adaptive Ontologien auf syntaktischen Strukturen" at DGFS 2006, Bielefeld, Germany, 2006
 
Es werden Ergebnisse einer Diplomarbeit vorgestellt, die im Rahmen des europäischen Foschungsprojeckts "Esperonto" geschrieben wurde. Diese Arbeit stellt eine Methode und eine Implementierung für die automatische Extraktion von semantischen Relationen aus linguistisch annotierten medizinischen Texten dar. Die linguistische Analyse besteht in Dependenzstrukturen, die sowohl innerhalb von Phrasen als auch zwischen größeren linguistischen Fragmenten von einem Parser erkannt werden. Damit meinen wir, zum Beispiel, die "head-modifier" Abhängigkeit oder Relation, die zwischen einem Adjektiv und dem Kopf einer Nominalphrase existiert, aber auch die grammatischen Relationen, die in einem Satz vorhanden sind, wie zum Beispiel die Subjektrelation zwischen einem Prädikat und einer bestimmten Nominalphrase. Vier verschiedenen Arten von linguistischen Konstruktionen wurden berücksichtigt, um unsere Methode für die automatische Extraktion von semantischen Relationen aus größeren Textmengen zu definieren und zu testen: Pre- und Postmodifikation von nominalen Köpfen, phrasale Koordinationen und grammatische Relationen. Zusätzlich zu den strukturellen Eigenschaften werden auch lexikalische semantische Ressourcen herangezogen, wie zum Beispiel die semantische Klassifikationen von Adjektiven , Adverbien , Präpositionen und Verben, die die extrahierten semantischen Relationen bis zu einem gewissen Grad bestimmen können (z.B. als lokale, temporale, kausale Relationen etc.). Die extrahierten semantischen Relationen wurden, da wo es möglich war, nach UMLS Relationen benannt. Dies erlaubt es, die automatisch extrahierten semantischen Relationen mit einem bestehenden und sehr verbreiteten Thesaurus zu vergleichen, und so unser System zu evaluieren. Wir werden auch die Ergebnisse einer erst! en Evaluierung vorstellen. Als Schluss zu diesem Abstrakt sei noch darauf hingewiesen, dass unser System in Zukunft auch für die Zwecke der "literature-based scientific discovery in the bio-medical domain" eingesetzt wird.
 
Files: BibTeX