Forschungsprojekt

iDocument - Intelligent Document Information Extraction

Ziel von iDocument ist die semantische Beantwortung von Anfragen auf nicht erschlossenen Dokumentkorpora (z.B. aktuelle Nachrichten, große Dokumentkollektionen). Basierend auf existierendem Hintergrundwissen und einem unstrukturierten und aufgrund von GrĂ¶ĂŸe und Fluktuation nicht erschlossenen Dokumentkorpus, wird ein intelligenter Prozessablauf entwickelt, der anhand einer vom Benutzer gestellten Frage aus dem Dokumentkorpus relevante Dokumente herausfiltert.

Die Inhalte der relevanten Dokumente werden durch Methoden der Informationsextraktion und durch VerknĂŒpfung mit dem Hintergrundwissen in ein Semantisches Netz ĂŒberfĂŒhrt. Eine semantische Suche untersucht dieses Netz bezĂŒglich der ursprĂŒnglichen Frage und liefert die resultierenden ZusammenhĂ€nge und Konzepte dem Benutzer zurĂŒck. Mit dieser ad hoc Aufbereitung fĂŒr die semantische Suche werden auch bislang nicht aufbereitete Informationsquellen erschlossen. Damit ist ein weiterer Schritt zur Gestaltung des Semantic Web getan.

Kontakt

Ansprechpartner: Benjamin Adrian
Projektleitung: Dr. Heiko Maus
Homepage: http://idocument.opendfki.de

Weitere Dokumente

Beteiligte Forschungsbereiche

Publikationen

  • 2009
  • 2008