Projekt

MONNET

Multilingual Ontologies for Networked Knowledge

Multilingual Ontologies for Networked Knowledge

  • Laufzeit:

Monnet (Multilingual ONtologies for NETworked knowledge) ist ein EU-finanziertes Projekt in der Sparte Sprachtechnologie im ICT- Bereichs des 7. Rahmenprogramms. Das Projekt hat im März 2010 die Arbeit aufgenommen.

Monnet wird technologische Lösungen anbieten, die den mehrsprachigen Zugang zu Online-Information ermöglicht. Der erste Schritt für Monnet besteht in der Errichtung einer Infrastruktur für Extraktion, Repräsentation und Zugang zum Wissen, das in multilingualen Dokumenten verfügbar ist. Dafür wird eine neuartige Kombination von Semantic-Web-Technologien und maschineller Übersetzung implementiert

Aktuelle Ansätze zum cross-lingualen Zugang zu Information bieten nur Teillösungen, die das Problems in einer eingeschränkten Weise behandeln, in dem sie auf der Ebene des Dokuments bleiben, ohne einen einheitlichen Ansatz zu Extraktion, Repräsentation, Integration und Abfrage von Informationen zu betrachten, die in verschiedenen Sprachen und heterogenen Datenquellen (freier Text, semi- strukturiert, strukturiert) verfügbar sind. Daher ist der Stand der Technik in der maschinellen Übersetzung noch unzureichend für die Bereitstellung von mehrsprachigen Dienstleistungen in bestimmten Bereichen.

Ein zentraler Aspekt der Lösung von Monnet liegt in der Tatsache, dass die eingesetzten Technologien Information auf einer semantischen Ebene verarbeiten und so über die jeweilige Sprache und Form der Dokumente abstrahieren, so dass ein einheitlicher Zyklus von Informationsverarbeitung (Extraktion und Integration) und Präsentation von mehrsprachigen Informationen ermöglicht wird. Zu diesem Zweck arbeitet Monnet an drei Komponenten, die alle auf einer neuartigen Repräsentation von linguistischem Wissen in Domänen-Ontologien beruhen:

  • Mehrsprachige Ontologielokalisierung, die die existierenden Ontologien semi-automatisch in mehrere Sprachen übersetzt. Damit wird die cross-linguale ontologiebasierte Informationsextraktion unterstützt.
  • Cross-linguale ontologiebasierte Informationsextraktion. Normiert und speichert die extrahierte Inforrmation aus Dokumenten in verschiedenen Sprachen in einem sprachunabhängigen Wissensrepräsentationssystem.
  • Cross-lingualer Zugang zum gespeicherten Wissen und dessen Präasentation in der Sprache des Benutzers

Der Ansatz zur Unterstützung des mehrsprachigen Internets wird im Rahmen von zwei Anwendungsfällen im Bereich des e-Governments und im Bereich der Finanz-und Wirtschaftsinformation validiert.

Partner

  • National University of Ireland Galway , Irland
  • DFKI , Deutschland
  • Universität Bielefeld , Deutschland
  • Universidad Politénica de Madrid , Spanien
  • SAP , Deutschland
  • XBRL Europe , Belgien
  • Be Informed , Niederlanden

Publikationen zum Projekt

Dagmar Gromann, Paul Buitelaar, Thierry Declerck

In: Paul Buitelaar, Philipp Cimiano. Towards the Multilingual Semantic Web. Seiten 227-242 ISBN 978-3-662-43584-7 Springer Heidelberg, New York, Dordrecht, London 9/2014.

Zur Publikation
Thierry Declerck, Karlheinz Mörth, Eveline Wand-Vogt

In: Nicoletta Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis (Hrsg.). Proceedings of the 9th International Conference on Language Resources and Evaluation (LREC-2014). International Conference on Language Resources and Evaluation (LREC-14) May 28-30 Reykjavik Iceland ELRA Paris 5/2014.

Zur Publikation
Eveline Wandl-Vogt, Thierry Declerck

In: Jelena Kallas, Iztok Kosem (Hrsg.). Proceedings of eLex 2013. Biennial Conference on Electronic Lexicography (eLex-13) Electronic Lexicography in the 21st Century: Thinking outside the Paper October 17-19 Tallinn Estonia trojina Ljubljana 10/2013.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence