Forschungsprojekt

iDocument - Intelligent Document Information Extraction

Ziel von iDocument ist die semantische Beantwortung von Anfragen auf nicht erschlossenen Dokumentkorpora (z.B. aktuelle Nachrichten, große Dokumentkollektionen). Basierend auf existierendem Hintergrundwissen und einem unstrukturierten und aufgrund von Größe und Fluktuation nicht erschlossenen Dokumentkorpus, wird ein intelligenter Prozessablauf entwickelt, der anhand einer vom Benutzer gestellten Frage aus dem Dokumentkorpus relevante Dokumente herausfiltert.

Die Inhalte der relevanten Dokumente werden durch Methoden der Informationsextraktion und durch Verknüpfung mit dem Hintergrundwissen in ein Semantisches Netz überführt. Eine semantische Suche untersucht dieses Netz bezüglich der ursprünglichen Frage und liefert die resultierenden Zusammenhänge und Konzepte dem Benutzer zurück. Mit dieser ad hoc Aufbereitung für die semantische Suche werden auch bislang nicht aufbereitete Informationsquellen erschlossen. Damit ist ein weiterer Schritt zur Gestaltung des Semantic Web getan.

Kontakt

Ansprechpartner: Benjamin Adrian
Projektleitung: Dr. Heiko Maus
Homepage: http://idocument.opendfki.de

Weitere Dokumente

Beteiligte Forschungsbereiche

Publikationen

  • 2009
  • 2008