Forschungsprojekt

iDocument - Intelligent Document Information Extraction

Ziel von iDocument ist die semantische Beantwortung von Anfragen auf nicht erschlossenen Dokumentkorpora (z.B. aktuelle Nachrichten, gro├če Dokumentkollektionen). Basierend auf existierendem Hintergrundwissen und einem unstrukturierten und aufgrund von Gr├Â├če und Fluktuation nicht erschlossenen Dokumentkorpus, wird ein intelligenter Prozessablauf entwickelt, der anhand einer vom Benutzer gestellten Frage aus dem Dokumentkorpus relevante Dokumente herausfiltert.

Die Inhalte der relevanten Dokumente werden durch Methoden der Informationsextraktion und durch Verkn├╝pfung mit dem Hintergrundwissen in ein Semantisches Netz ├╝berf├╝hrt. Eine semantische Suche untersucht dieses Netz bez├╝glich der urspr├╝nglichen Frage und liefert die resultierenden Zusammenh├Ąnge und Konzepte dem Benutzer zur├╝ck. Mit dieser ad hoc Aufbereitung f├╝r die semantische Suche werden auch bislang nicht aufbereitete Informationsquellen erschlossen. Damit ist ein weiterer Schritt zur Gestaltung des Semantic Web getan.

Kontakt

Ansprechpartner: Benjamin Adrian
Projektleitung: Dr. Heiko Maus
Homepage: http://idocument.opendfki.de

Weitere Dokumente

Beteiligte Forschungsbereiche

Publikationen

  • 2009
  • 2008