Projekt

iDocument

Intelligent Document Information Extraction

Intelligent Document Information Extraction

  • Laufzeit:

Ziel von iDocument ist die semantische Beantwortung von Anfragen auf nicht erschlossenen Dokumentkorpora (z.B. aktuelle Nachrichten, große Dokumentkollektionen). Basierend auf existierendem Hintergrundwissen und einem unstrukturierten und aufgrund von Größe und Fluktuation nicht erschlossenen Dokumentkorpus, wird ein intelligenter Prozessablauf entwickelt, der anhand einer vom Benutzer gestellten Frage aus dem Dokumentkorpus relevante Dokumente herausfiltert.

Die Inhalte der relevanten Dokumente werden durch Methoden der Informationsextraktion und durch Verknüpfung mit dem Hintergrundwissen in ein Semantisches Netz überführt. Eine semantische Suche untersucht dieses Netz bezüglich der ursprünglichen Frage und liefert die resultierenden Zusammenhänge und Konzepte dem Benutzer zurück. Mit dieser ad hoc Aufbereitung für die semantische Suche werden auch bislang nicht aufbereitete Informationsquellen erschlossen. Damit ist ein weiterer Schritt zur Gestaltung des Semantic Web getan.

Publikationen zum Projekt

Ludger van Elst, Jörn Hees, Andreas Dengel

In: Bärbel Mersching , Marcus Hund , Zaheer Aziz (Hrsg.). KI 2009: Advances in Artificial Intelligence. German Conference on Artificial Intelligence (KI-2009) September 15-18 Paderborn Germany Seiten 249-256 Lecture Notes in Artificial Intelligence (LNAI) 5803 ISBN 978-3-642-04616-2 Springer-Verlag Heidelberg 9/2009.

Zur Publikation
Heiko Maus, Andreas Dengel

In: Proceedings of the Third International Workshop on Camera Based Document Analysis and Recognition. International Workshop on Camera-Based Document Analysis and Recognition (CBDAR-09) befindet sich ICDAR 2009 July 25 Barcelona Spain 7/2009.

Zur Publikation
Heiko Maus, Andreas Dengel

In: Knut Hinkelmann , Holger Wache (Hrsg.). WM2009: 5th Conference on Professional Knowledge Management. Conference on Professional Knowledge Management (WM-2009) March 25-27 Solothurn Switzerland Lecture Notes in Informatics (LNI) P-145 ISBN 978-3-88579-239-0 Gesellschaft für Informatik Bonn 3/2009.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence