Forschungsprojekt
HyLAP - Hybrid language processing technologies for a personal associative information access and management application
In dem Projekt HyLaP werden hybride sprach- und informationsverarbeitende Methoden verbessert, adaptiert und in einer neuartigen personalisierten Informationszugriffs- und Managementanwendung eingesetzt. Diese Anwendung erlaubt einen integrierten Zugang zu Informationen im persönlichen digitalen Speicher des Benutzers und zu Informationen aus dem globalen Speicher des WWW. Wir nehmen an, dass die natürliche Sprache auch zukünftig das primäre Medium für die Speicherung und den Transfer von komplexer Information, insbesondere des humanen Wissens, darstellen wird. Daher sind natürlichsprachliche Algorithmen eine Schlüsseltechnologie zur Auswertung der vielfältigen Information in der täglichen Arbeit.
Die resultierenden Technologien kombinieren domänenoffene und -geschlossene Fragebeantwortung, Erkennung von Eigennamen, Extraktion von Relationen, automatisches Hyperlinking und die Konstruktion von Ontologien. Daher werden die geplanten Forschungen die am DFKI LT-lab erfolgreich etablierten Forschungsergebnisse in den Bereichen Fragebeantwortung (QA), Informationsextraktion (IE), natürlichsprachlich unterstütztes Informationsretrieval und die ontologiebasierte Wissensextraktion aus Texten aufnehmen und weiterführen. Dies beinhält auch die aktive Teilnahme an internationalen Wissenschaftswettbewerben, wie z.B. der CLEF, als auch die Weiterführung unserer Forschungsaktivitäten im Bereich der effektiven und effizienten Architekturen für die hybride Sprachverarbeitung.
Zur Realisierung eines strukturierten, assoziativen und personalisierten digitalen Speichers auf Basis einer realistischen großen Dokumentenmenge werden kombinierte flache und tiefe Verfahren der Sprachtechnologie exploriert. Die Dokumentenmenge bestehend aus unstrukturierten und strukturierten Daten spiegelt dabei den digitalen Informationsraum eines individuellen Benutzers wider.
Ziel ist es, den Vorteil solch eines strukturellen Speichers im Zusammenhang mit verbesserten IE und QA Methoden zu zeigen und zwar in einer Anwendung, die einerseits eine intuitive und mächtige assoziative Schnittstelle zwischen den Gedanken eines Benutzers und seiner täglichen Arbeit modelliert und anderseits eine assoziative Schnittstelle bereitstellt, die relevante Informationen aus dem persönlichen Speicher und Informationen aus dem Internet in Beziehung setzt.
Das Projekt hat drei Hauptkomponenten:
- Domänenoffene Fragebeantwortung (ODQA)
- Personalisierter, digitaler, assoziativer Speicher (PDAM)
- Assoziative Informationszugriffs- und Managementanwendung (AIAMA)
welche in zwei Teilprojekten bearbeitet werden:
- HyLaP-QA für die Forschung im Bereich der domänenoffenen Fragebeantwortung
- HyLaP-AM für die Forschung im Bereich des personalisierten, digitalen, assoziativen Speichers und der Realisierung der Anwendung.
HyLaP wird unter dem Vertragskennzeichen 01 IW F02 gefördert.
Kontakt
Ansprechpartner:
Priv.-Doz. Dr. Günter Neumann
Projektleitung:
Prof. Dr. Hans Uszkoreit
Homepage:
http://hylap.dfki.de/
Beteiligte Forschungsbereiche
Publikationen
- 2009
- Timothy Baldwin; Valia Kordoni; Aline Villavicencio
Prepositions in Applications: A Survey and Introduction to the Special Issue.
In: Robert Dale (Hrsg.). Computational Linguistics (CL), Vol. 35, No. No. 2, Pages 119-149, MIT Press, 2009. - Valia Kordoni; Yi Zhang
Annotating Wall Street Journal Texts Using a Hand-Crafted Deep Linguistic Grammar.
In: Nancy Ide; Adam Meyers (Hrsg.). Proceedings of the Third Linguistic Annotation Workshop. Linguistic Annotation Workshop (LAW), located at ACL-IJCNLP 2009, August 2-8, Singapore, Singapore, ACL, 2009. - Timothy Baldwin; Valia Kordoni (Hrsg.)
Proceedings of the EACL 2009 Workshop on the Interaction between Linguistics and Computational Linguistics: Virtuous, Vicious or Vacuous?.
Conference of the European Chapter of the Association for Computational Linguistics (EACL-2009), March 30 - April 3, Athens, Greece, EACL, 2009. - Faisal Mahbub Chowdhury; Yi Zhang; Valia Kordoni
Using Treebanking Discriminants as Parse Disambiguation Features.
In: Éric Villemonte de la Clergerie; Harry Bunt (Hrsg.). Proceedings of the 11th International Conference on Parsing Technologies 2009. International Conference on Parsing Technologies (IWPT-09), October 7-9, Paris, France, IWPT, 2009.
- 2008
- Ulrich Schäfer; Hans Uszkoreit; Christian Federmann; Torsten Marek; Yajing Zhang
Extracting and Querying Relations in Scientific Papers.
In: Andreas Dengel; K. Berns; Thomas Breuel; Frank Bomarius; Thomas Roth-Berghofer (Hrsg.). Proceedings of the 31st Annual German Conference on Artificial Intelligence. German Conference on Artificial Intelligence (KI-2008), 31st Annual German Conference on AI, September 23-26, Kaiserslautern, Germany, Pages 127-134, Lecture Notes in Artificial Intelligence (LNAI), No. 5243, ISBN 9783540858447, Springer, Heidelberg, 2008. - Ulrich Schäfer
Shallow, Deep and Hybrid Processing with UIMA and Heart of Gold.
In: Proceedings of the LREC-2008 Workshop Towards Enhanced Interoperability for Large HLT Systems: UIMA for NLP, 6th International Conference on Language Resources and Evaluation. LREC-2008, May 26 - June 1, Marrakesh, Morocco, Pages 43-50, ELRA, 2008. - Ulrich Schäfer
Integrating Natural Language Processing Components with XML and XSLT.
ISBN 9783836490276, VDM Verlag Dr. Müller, Saarbrücken, 4/2008. - Günter Neumann
A Computational Linguistics Perspective on the Anticipatory Drive. Commentary on the target article by Martin V. Butz.
In: Constructivist Foundations (CF), Vol. 4, No. 1, Pages 17-18, Alexander Riegler (Editor-in-chief), Brüssel, 11/2008.
- 2007
- Rui Wang
Textual Entailment Recognition: A Data-Driven Approach.
Mastersthesis, Universität des Saarlandes, 9/2007.
