Neue Technologien zur Unterstützung beim Post-Editing Maschineller Übersetzungen – Forschungsprojekt MMPE abgeschlossen

Die Qualität Maschineller Übersetzung hat sich in den letzten Jahren deutlich verbessert. Übersetzer verlagern ihre Tätigkeit immer öfter zum Post-Editing maschineller Übersetzungen. Das spart Zeit, reduziert Fehler, verändert aber die Art der Interaktion mit dem Text. Wie Post-Editing technologisch unterstützt werden kann, untersuchte ein interdisziplinäres Forscherteam des DFKI im Projekt MMPE (Multi-modal and Language Technology based Post-Editing Support for Machine Translation). MMPE unter der Leitung von Prof. Dr. Antonio Krüger und Prof. Dr. Josef van Genabith wurde von der Deutschen Forschungsgemeinschaft über einen Zeitraum von dreieinhalb Jahren gefördert und endete am 31.12.2020.

Post-Editing (PE) kombiniert die Vorteile von Künstlicher Intelligenz und menschlicher Intelligenz, verschiebt aber auch den Fokus von Übersetzungsarbeiten: Anstatt Text zu erzeugen, korrigieren Übersetzer Fehler in ansonsten hilfreichen Vorschlägen in der Zielsprache. Häufig wiederkehrende Fehler der maschinellen Übersetzung (MÜ) zu verbessern ist ermüdend, schwer zu findende oder komplexe Fehler zu beheben, macht die Tätigkeit kognitiv anspruchsvoll.

„Während die KI gut darin ist, schnell Übersetzungsentwürfe vorzuschlagen, kann nur ein Mensch mit fundierten Kenntnissen der Ausgangs- und Zielsprache lexikalische und semantische Nuancen analysieren und sicherstellen, dass die Bedeutung der Übersetzung identisch ist“, umreißt Projektleiter Prof. Dr. Josef van Genabith die Vorteile. Die Wissenschaftler aus den Forschungsbereichen Kognitive Assistenzsysteme unter der Leitung von Prof. Dr. Antonio Krüger sowie Sprachtechnologie und Multilingualität unter der Leitung von Prof. Josef van Genabith haben untersucht, wie Übersetzungsumgebungen multimodale Eingaben unterstützen können und kognitive Aspekte des Post-Editing berücksichtigt werden können. Außerdem befassten sie sich mit der Frage, wie Automatisches Post-Editing hilft, immer wiederkehrende Fehler zu vermeiden. Das Team erstellte eine Übersetzungsumgebung in einem benutzerzentrierten Designprozess. Die Umgebung ermöglicht es, Text durchzustreichen oder handschriftlich zu ergänzen, Wörter per Drag & Drop neu zu ordnen oder Sprachbefehle zur Editierung zu verwenden.

Eine Evaluierung mit professionellen Übersetzerinnen zeigt, dass diese Interaktionsmodalitäten gute Erweiterungen zu Maus & Tastatur sind, wobei sich Stift- und Touch-Eingabe für Lösch- und Neuordnungsaufgaben als geeignet erwiesen, während Sprachbefehle und multimodale Kombinationen von Auswählen & Sprechen gut für Ersetzungen und Einfügungen funktionieren. Post-Editing verändert aber auch die kognitive Dimension des Übersetzens. Es erfordert nicht nur ein Gespür für den Satz in der Originalsprache, sondern auch für die fehleranfällige Ausgabe der maschinellen Übersetzung, den umgebenden Kontext sowie die Leserschaft und deren kulturellen Hintergrund. Robuste Ansätze zur automatischen Abschätzung dieser veränderten kognitiven Belastung (Cognitive Load - CL) beim Post-Editing ermöglichen ein besseres Verständnis dafür, ob und wann maschinelles Übersetzen den Arbeitsprozess eher unterstützt oder behindert. Das Projektteam hat daher ein Sensor-Framework entwickelt, das eine breite Palette physiologischer und verhaltensbezogener Daten verwendet, um die wahrgenommene kognitive Belastung abzuschätzen, und hat es in mehreren Studien getestet. Dabei konnte gezeigt werden, dass multimodale Messungen von Augen-, Herz- und Haut-basierten Daten verwendet werden können, um die Übersetzungsumgebungen an die kognitive Belastung anzupassen.

Bei der maschinellen Übersetzung treten nicht nur tatsächliche Fehler auf, die MÜ trifft mitunter auch immer wieder dieselben lexikalischen oder stilistischen Entscheidungen, mit denen der Übersetzer möglicherweise nicht einverstanden ist. Im gesamten Text sind dann ähnliche Modifikationen erforderlich. Die Wissenschaftlerinnen und Wissenschaftler haben daher verschiedene Deep-Learning-Architekturen für das automatische Post-Editing (APE) untersucht, die die Ausgabe jedes Black-Box-MÜ-Systems an eine bestimmte Domäne oder einen bestimmten Stil anpassen können. Anstatt übersetzen zu lernen, lernen APE-Systeme aus wiederkehrenden menschlichen Korrekturen und wenden sie auf Vorschläge der maschinellen Übersetzung für neue Texte an.

Das MMPE-Projekt ist jetzt als Open Source auf Github verfügbar.
 

Beitrag teilen auf:

Kontakt:

Forschungsbereich Kognitive Assistenzsysteme, DFKI

    Pressekontakt:

    Reinhard Karger, M.A.

    Unternehmenssprecher, DFKI

    Weitere Informationen:

    Deutsches Forschungszentrum für Künstliche Intelligenz
    German Research Center for Artificial Intelligence