Sprachdaten bilden Brücken in Krisenkommunikation

16.07.2020 | Sprache & Textverstehen | Sprachtechnologie und Multilingualität | Saarbrücken

„Jeśli chcesz mieć wpływ na innych ludzi, musisz najpierw porozmawiać z nimi w ich języku.“ Haben Sie das verstanden? Nein. Es sei denn, Sie sprechen polnisch. „Wer auf andere Leute wirken will, der muss erst einmal in ihrer Sprache mit ihnen reden“, stellte der deutsche Journalist und Schriftsteller Kurt Tucholsky (1890-1932) in den bewegten Zeiten zu Beginn des letzten Jahrhunderts fest. Heute, ungefähr 100 Jahre später, ist diese Aussage von größerer Bedeutung denn je: Nach ersten Infektionen in Asien wurde Anfang 2020 auch Europa von der COVID-19-Pandemie erfasst. Ständig neue Erkenntnisse zu Aufbau, Ausbreitung und Bekämpfung des SARS-CoV-2-Virus mussten ohne Verzögerung in allen Landesprachen Europas zur Verfügung gestellt und von den dortigen Gesundheitsbehörden verarbeitet werden, um den Schutz der Bevölkerung sicherzustellen.

Der Forschungsbereich Sprachtechnologie und Multilingualität des DFKI unter Leitung von Prof. Josef van Genabith leistete hier mit der European Language Resource Coordination (ELRC) einen entscheidenden Beitrag: Die im Rahmen der ELRC zusammengetragenen Sprachdaten bilden die Basis für maschinelle Übersetzung und viele andere zentrale Anwendungen im Bereich der multilingualen Kommunikation. So wurden seit März 2020 mehr als 350 für COVID-19 relevante Sprachdaten über das ELRC-SHARE- Repository zur Verfügung gestellt, die sofortige Übersetzungen entsprechender Informationen mit Hilfe des Übersetzungstools eTranslation in allen offiziellen EU-Amtssprachen, Norwegisch, Isländisch, Russisch und nun auch Chinesisch möglich machen.

eTranslation wird unter der Leitung des DFKI gemeinsam mit Übersetzungsmaschinen von DeepL, Tilde und DFKI aktuell auch im Rahmen der deutschen EU-Ratspräsidentschaft eingesetzt und kann hier frei getestet und genutzt werden. Bis heute hat ELRC insgesamt mehr als 1.750 multilinguale Sprachdaten in verschiedensten Bereichen wie Kultur, Gesundheit, Sozialversicherung öffentliches Auftragswesen, Kundenrechte, Safer Internet u.v.m. gesammelt und zur weiteren Nutzung bereitgestellt. Eine Sammlung von unschätzbarem Wert für multilinguale Sprachanwendungen, Sprachdienstleister und Übersetzer, wie Prof. Josef van Genabith weiß: „Daten sind die Grundlage für Sprachtechnologien. ELRC hat seit 2015 bislang einzigartige Strukturen aufgebaut, in denen wir gemeinsam mit unseren Partnern in Europa Daten sammeln und teilen, und damit sprachliche und kulturelle Vielfalt unterstützen, und gleichzeitig helfen, Sprachbarrieren zu überwinden.“

Eine Umfrage unter mehr als 2.800 kleinen und mittleren europäischen Unternehmen zeigt, dass 92% großes Interesse an sicherer maschineller Übersetzung im Rahmen von eTranslation haben. 80% der Befragten möchten maschinelle Übersetzung zur Übersetzung von Webseiten und Beiträgen auf Sozialen Medien einsetzen. Für mehr als 70% ist das Übersetzungstool wichtig bei der Informationssammlung und -aufbereitung. Der Anwendungsbereich der ELRC-Sprachdaten geht jedoch weit über die maschinelle Übersetzung hinaus: So helfen Sprachdaten auch bei der Identifizierung und Filterung von „Fake News“, wie ein im April erschienener Artikel des EU Research & Innovation Magazine HORIZON zu den Gefahren, die Fehlinformation und die mangelnde Unterstützung für sprachliche Minderheiten mit sich bringt, belegt. Aber auch die Entwicklung multilingualer Chatbots (wie jüngst für die Europeana Collections geschehen) oder automatiiserter Post-editing Lösungen für Übersetzer sind ohne die entsprechenden Sprachdaten nicht möglich.

Das Engagement des DFKI-Forschungsbereichs Sprachtechnologie und Multilingualität macht jedoch nicht an den Grenzen Europas halt. Im Gegenteil: Seit Mai 2020 unterstützt der von Prof. van Genabith geleitete Forschungsbereich auch die Gesellschaft für Internationale Zusammenarbeit (GIZ) u.a. bei der Sprachdatensammlung für afrikanische Sprachen (AI4D African Language Dataset Challenge) sowie bei der Entwicklung eines Chatbots für COVID-19 und andere Fragen im Rahmen von Digital Umuganda. Prof. Josef van Genabith erklärt: „In Afrika entwickelt sich eine lebhafte KI-Szene, die modernste Technologien entwickelt und einsetzt, oft um konkrete lokale Probleme direkt anzugehen. Wir freuen uns sehr, als DFKI gemeinsam mit dem GIZ und unseren Partnern in Afrika, einen Beitrag zur KI in Afrika leisten zu können.“

Wenn auch Sie einen Beitrag zur Kommunikation ohne Grenzen leisten möchten und Sprachdaten suchen oder teilen wollen, wenden Sie sich bitte an das ELRC-Sekretariat des Forschungsbereichs Sprachtechnologie und Multilingualität des DFKI (E-Mail: info@lr-coordination.eu, Telefon: +49 681 85775 5285) oder besuchen Sie uns im Internet (www.lr-coordination.eu), auf Facebook (www.facebook.com/EuropeanLanguageResourceCoordination), Twitter (@LR_Coordination) oder LinkedIn. Czekamy na ciebie. Oder falls Ihnen das nichts sagt, finden Sie es doch einfach mit unserem Übersersetzungtool für die EU-Ratspräsidentschaft heraus.

Kontakt:

Dr. Andrea Lösch, M.A. M.Sc.

Andrea.Loesch@dfki.de
Tel.: +49 681 85775 5283