Projekt

MEMPHIS

Multilingual Content for Flexible Format Internet Premium Services

Multilingual Content for Flexible Format Internet Premium Services

  • Laufzeit:

MEMPHIS definiert, entwickelt und evaluiert ein neues System, welches den Betrieb kommerzieller multilingualer Informationsdienste ermöglicht, die auf tragbare Clients wie Handys, PDAs usw. abzielen. MEMPHIS bezieht multilinguale Inhalte aus diversen Quellen in unterschiedlichen Formaten, z.B. aus dem Internet, basierend auf dynamischen Benutzerprofilen. Die Inhalt werden in eine XML-Meta-Repräsentation transformiert, die das Speichern der Inhalte unabhängig von Quell- und Zielsprache ermöglicht. Die Verarbeitung beinhaltet die Erkennung der Quellsprache und die automatische Übersetzung des Quelldokuments in eine Metasprache. Mittels Informationsextraktion werden komprimierte Dokumente erzeugt, etwa Zusammenfassungen. Bei einer Benutzeranfrage kann eine Übersetzung aus der Metasprache in die Zielsprache angefordert werden. Das Ausgabeformat berücksichtigt die Ausgabeanforderungen und -möglichkeiten des Clientgeräts, z.B. SMS, WAP, WWW, Email usw. Dies involviert eine Konversion in Dokumente unterschiedlicher Länge aus der gleichen Quelle.

Der Forschungsbereich Sprachtechnologie des DFKI ist verantwortlich sowohl für die multilinguale Analyse der Dokumente, d.h. Sprachenidentifikation, Kategorisierung, Extraktion relevanter Information und ihre sprachunabhängige XML-basierte Repräsentation für den sprachübergreifenden Retrieval, als auch für die Generierung von Text/Zusammenfassungen im Hinblick auf Benutzerprofil, Zielsprache und Zielgerät.

  • Identifikation der Sprache eines Dokuments multilinguale statistische Kategorisierung von Dokumenten
  • Extraktion von Zusammenfassungen, einschließlich Schlüsselwörtern und -phrasen
  • Extraktion relevanter Information als relationalen Templates
  • sprachunabhängige XML-basierte Repräsentation der extrahierten Information
  • flexible multilinguale Generierung von Text aus diesen Repräsentationen

Projekt teilen auf:

Ansprechpartner
Prof. Dr.-Ing. Sebastian Möller
Prof. Dr.-Ing. Sebastian Möller

Keyfacts

Publikationen zum Projekt

Hans-Ulrich Krieger, Witold Drozdzynski, Jakub Piskorski, Ulrich Schäfer, Feiyu Xu

In: Proceedings of 7th KONVENS. Konferenz zur Verarbeitung natürlicher Sprache (KONVENS) Vienna Seiten 105-112 9/2004.

Zur Publikation
Jörg Steffen

In: Proceedings of the 4th International Conference on Language Resources and Evaluation. International Conference on Language Resources and Evaluation (LREC) Seiten 731-734 ELRA 2004.

Zur Publikation
Witold Drozdzynski, Hans-Ulrich Krieger, Jakub Piskorski, Ulrich Schäfer, Feiyu Xu

In: KI - Künstliche Intelligenz, German Journal on Artificial Intelligence - Organ des Fachbereiches "Künstliche Intelligenz" der Gesellschaft für Informatik e.V. (KI) German Journal of Artificial Intelligence 'KI-Zeitschrift'. 1 1 Seiten 17-23 2004.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence