Projekt | TAKE

Laufzeit: 01.01.2009 - 31.12.2011

Technologies for Advanced Knowledge Extraction

Im Projekt TAKE sollen Sprach- und Wissenstechnologien für die schrittweise automatische Extraktion von Wissen aus dem World Wide Web angepasst, entwickelt und genutzt werden. Regelbasierte und statistische Methoden für die Sprachverarbeitung (NLP; natural language processing) werden kombiniert, um formalisiertes Wissen systematisch zu erweitern.

Als zentrale Technologie für dieses Vorhaben kommt semantisch gesteuerte, erweiterte Informationsextraktion zum Einsatz, insbesondere Relationsextraktion, d.h. semantische Beziehungen werden in großen Textmengen identifiziert. Relevante Relationen können mehreren Klassen wie z.B. Fakten, Definitionen, Ereignisse, Zitate und Meinungen angehören.

Im vorgeschlagenen Vorhaben sollen bestehende Ressourcen formalisierten linguistischen Wissens wie Lexika, Grammatiken und Morphologien ebenso genutzt werden wie Werkzeuge für die statistische Verarbeitung.

Die entwickelten Methoden, Architekturen und Systeme sollen in zwei Wissens-Domänen getestet und demonstriert werden:

wissenschaftliche und technologische Literatur in einem ausgewählten Bereich der Forschung, hier der Sprachtechnologie, und
allgemeine biografische Texte.

TAKE wird unter dem BMBF-Förderkennzeichen 01IW08003 gefördert.

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Prof. Dr. Hans Uszkoreit

Webseite

http://take.dfki.de

Publikationen

Alle Publikationen

The Searchbench - Combining Sentence-semantic, Full-text and Bibliographic Search in Digital Libraries
Ulrich Schäfer; Bernd Kiefer; Christian Spurk; Jörg Steffen; Rui Wang; Benjamin Weitz; Magdalena Wolska
In: LIBER quarterly, Vol. 22, No. 4, Pages 285-309, Association of European Research Libraries, 2/2013.
Domain Adaptive Relation Extraction for Semantic Web
Feiyu Xu; Hans Uszkoreit; Hong Li; Peter Adolphs; Xiwen Cheng
In: Hermann Friedrich; Hans-Joachim Grallert; Wolfgang Wahlster; Stefan Wess; Thomas Widenka (Hrsg.). Theseus-Buch. Chapter X, Springer, 2013.
A Fully Coreference-annotated Corpus of Scholarly Papers from the ACL Anthology
Ulrich Schäfer; Christian Spurk; Jörg Steffen
In: Proceedings of the 24th International Conference on Computational Linguistics. International Conference on Computational Linguistics (COLING-2012), December 10-14, Mumbai, India, Pages 1059-1070, ICCL, 12/2012.

Projekt | TAKE

Technologies for Advanced Knowledge Extraction

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Webseite

Publikationen

The Searchbench - Combining Sentence-semantic, Full-text and Bibliographic Search in Digital Libraries

Domain Adaptive Relation Extraction for Semantic Web

A Fully Coreference-annotated Corpus of Scholarly Papers from the ACL Anthology

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung

Projekt teilen auf:

Keyfacts

Beteiligte Forschungsbereiche

Leitung

Webseite

The Searchbench - Combining Sentence-semantic, Full-text and Bibliographic Search in Digital Libraries

Domain Adaptive Relation Extraction for Semantic Web

A Fully Coreference-annotated Corpus of Scholarly Papers from the ACL Anthology

Fördergeber

BMBF - Bundesministerium für Bildung und Forschung