Projekt

MUSI

Mehrsprachige Zusammenfassung von Texten im Internet

Mehrsprachige Zusammenfassung von Texten im Internet

  • Laufzeit:

MUSI entwickelt Lösungen im Bereich mehrsprachiger Zusammenfassungen, um den Zugang zu Information- Retrieval-Systemen zu erleichtern und insbesondere auf den Inhalt elektronischer Dokumente im Internet. Als eine erste Ausbaustufe eines umfassenderen Systems wird MUSI französische und deutsche Zusammenfassungen aus englisch- und italienischsprachigen Textdokumenten erzeugen. Während die meisten aktuellen Verfahren für die Erzeugung von Zusammenfassungen auf statistisch basierter Satzextraktion und -kondensierung beruhen, verfolgt MUSI den Ansatz, auf der Ebene von Inhalten und Begriffen zusammenzufassen: Zunächst werden Sprachanalysetechniken eingesetzt, um auf Inhalte zuzugreifen. Sodann erzeugen Verdichtungs- und Eliminationsverfahren eine abstrakte Repräsentation des Inhalts der Zusammenfassung. Diese wird dann mithilfe von Sprachgenerierungstechnologie verbalisiert. Der gewählte Ansatz ist durch die sprachliche und begriffliche Abdeckung des Gegenstandsbereichs beschränkt. Andererseits bietet er wesentliche Vorteil, die alternative Verfahren entbehren: aktuelle Herausforderungen wie mehrsprachige Zusammenfassungen und Zusammenfassungen mehrer Dokumente lassen sich relativ problemlos umsetzen, und die Möglichkeit, Aussagen über Texte zu erzeugen, bietet das Ausmaß an Flexibilität, das so dringend für benutzerorientierte Zusammenfassungen benötigt wird.

  • Textzusammenfassung auf begrifflicher Ebene durch Sprachanalyse und -generierung
  • Mehrsprachige Zusammenfassungen und Zusammenfassungen aus mehreren Dokumenten
  • Benutzerorientierte Zusammenfassungen durch Erzeugung von Meta-Aussagen
  • Validierung im Rahmen einer medizinischen Anwendung

Partner

LexiQuest, France (Technical Co-ordinator)

Istituto di Linguistica Computazionale, Italy

DFKI GmbH, Germany

Projekt teilen auf:

Ansprechpartner
Prof. Dr. Stephan Busemann
Prof. Dr. Stephan Busemann

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence