Forschungsprojekt
iDocument - Intelligent Document Information Extraction
Ziel von iDocument ist die semantische Beantwortung von Anfragen auf nicht erschlossenen Dokumentkorpora (z.B. aktuelle Nachrichten, große Dokumentkollektionen). Basierend auf existierendem Hintergrundwissen und einem unstrukturierten und aufgrund von Größe und Fluktuation nicht erschlossenen Dokumentkorpus, wird ein intelligenter Prozessablauf entwickelt, der anhand einer vom Benutzer gestellten Frage aus dem Dokumentkorpus relevante Dokumente herausfiltert.
Die Inhalte der relevanten Dokumente werden durch Methoden der Informationsextraktion und durch Verknüpfung mit dem Hintergrundwissen in ein Semantisches Netz überführt. Eine semantische Suche untersucht dieses Netz bezüglich der ursprünglichen Frage und liefert die resultierenden Zusammenhänge und Konzepte dem Benutzer zurück. Mit dieser ad hoc Aufbereitung für die semantische Suche werden auch bislang nicht aufbereitete Informationsquellen erschlossen. Damit ist ein weiterer Schritt zur Gestaltung des Semantic Web getan.
Kontakt
Ansprechpartner:
Benjamin Adrian
Projektleitung:
Dr. Heiko Maus
Homepage:
http://idocument.opendfki.de
Weitere Dokumente
Beteiligte Forschungsbereiche
Publikationen
- 2009
- Benjamin Adrian; Heiko Maus; Malte Kiesel; Andreas Dengel
Towards Ontology-based Information Extraction and Annotation of Paper Documents for Personalized Knowledge Acquisition.
In: Knut Hinkelmann; Holger Wache (Hrsg.). WM2009: 5th Conference on Professional Knowledge Management. Conference on Professional Knowledge Management (WM-2009), March 25-27, Solothurn, Switzerland, Lecture Notes in Informatics (LNI), Vol. P-145, ISBN 978-3-88579-239-0, Gesellschaft für Informatik, Bonn, 3/2009. - Benjamin Adrian; Heiko Maus; Andreas Dengel
iDocument: Using Ontologies for Extracting Information from Text.
In: Barbara Thönssen (Hrsg.). WM2009: 5th Conference on Professional Knowledge Management. Conference on Professional Knowledge Management (WM-09), March 25-27, Solothurn, Switzerland, WM2009: 5th Conference on Professional Knowledge Management, Lecture Notes in Informatics (LNI), Vol. P-145, ISBN 978-3-88579-239-0, GI, 3/2009. - Stefan Dellmuth; Heiko Maus; Andreas Dengel
Supporting Knowledge Work by Observing Paper-Based Activities on the Physical Desktop.
In: Proceedings of the Third International Workshop on Camera Based Document Analysis and Recognition. International Workshop on Camera-Based Document Analysis and Recognition (CBDAR-09), located at ICDAR 2009, July 25, Barcelona, Spain, o.A. 7/2009. - Benjamin Adrian; Jörn Hees; Ludger van Elst; Andreas Dengel
iDocument: Using Ontologies for Extracting and Annotating Information from Unstructured text.
In: Bärbel Mersching; Marcus Hund; Zaheer Aziz (Hrsg.). KI 2009: Advances in Artificial Intelligence. German Conference on Artificial Intelligence (KI-2009), September 15-18, Paderborn, Germany, Pages 249-256, Lecture Notes in Artificial Intelligence (LNAI), Vol. 5803, ISBN 978-3-642-04616-2, Springer-Verlag, Heidelberg, 9/2009.
- 2008
- Björn Forcher; Benjamin Adrian; Thomas Roth-Berghofer
Explanations in the information extraction system iDocument.
In: Künstliche Intelligenz (KI), Vol. Schwerpunkt: Erklärungen, No. 2/08, Pages 32-34, Böttcher IT, 5/2008. - Benjamin Adrian; Andreas Dengel
Believing Finite-State cascades in Knowledge-based Information Extraction.
In: Andreas Dengel; Karsten Berns; Thomas Breuel; Frank Bomarius; Thomas Roth-Berghofer (Hrsg.). KI 2008: Advances in Artificial Intelligence. German Conference on Artificial Intelligence (KI), Kaiserslautern, Germany, Pages 152-159, Lecture Notes in Computer Science (LNCS), Vol. 5243, ISBN 978-3-540-85844-7, Springer, 2008. - Alexander Grothkast; Benjamin Adrian; Kinga Schumacher; Andreas Dengel
OCAS: Ontology-Based Corpus and Annotation Scheme. Towards an OBIE Gold Standard that Contains even Implicit Facts.
In: Sebastian Blohm; Ulf Brefeld; Felix Jungermann; Roman Yangarber (Hrsg.). Proceedings of the High-level Information Extraction Workshop 2008. High-level Information Extraction Workshop (HLIE-2008), located at ECML PKDD 2008, September 15-19, Antwerpen, Belgium, Pages 25-35, ECML PKDD 2008, 2008. - Benjamin Adrian; Günter Neumann; Alexander Troussov; Borislav Popov (Hrsg.)
Proceedings 1st International and KI-08 Workshop on Ontology-based Information Extraction Systems.
Ontology-based Information Extraction Systems (OBIES-08), located at KI 2008, September 23-26, Kaiserslautern, Germany, CEUR-WS.org, Vol. 400, CEUR, 2008. - Benjamin Adrian
Der Semantic Desktop - Endlich ein Computer, der versteht was ich meine und mich in dem unterstützt, was ich tue.
In: Günther Linnemann; P. Termöllen (Hrsg.). Resoom Magazine. Das Business-Magazin für IT-Freiberufler, Vol. 06/2008, No. 1864-6190, Pages 42-43, Peter Termöllen Verlag, Wiesbaden, 9/2008. - Björn Forcher; Benjamin Adrian; Thomas Roth-Berghofer
Explanation Styles in iDocument.
In: Thomas Roth-Berghofer; Stefan Schulz; Daniel Bahls; David B. Leake (Hrsg.). Proceedings of the Third International Workshop on Explanation-aware Computing. International Workshop on Explanation-aware Computing, 3rd, located at 18th European Conference on Artificial Intelligence ECAI 2008, July 21-22, Patras, Greece, Pages 144-156, Vol. 39, CEUR-WS.org, Aachen, 2008.
