DFKI-LT - MaryLux - Luxemburgische Sprachsynthese

Ingmar Steiner, Jürgen Trouvain, Judith Manzoni, Peter Gilles
MaryLux -- Luxemburgische Sprachsynthese
1 5. Kongress der Internationalen Gesellschaft für Dialektologie des Deutschen e.V., Luxembourg, Luxembourg, k.A., 2015
 
Vorgestellt wird der Prototyp eines Sprachsynthesesystems für das Luxemburgische, basierend auf dem frei verfügbaren System MaryTTS (http://mary.dfki.de). Eine besondere Herausforderung stellt die Integration einer - für das Luxemburgische unabdingbaren - multilingualen Komponente dar, die französische und deutsche Äußerungsbestandteile automatisch erkennt und mit der korrekten Aussprache realisiert. Für das Englische ist es üblich, dass kommerzielle und auch forschungsbasierte Sprachsynthesesysteme in mindestens zwei verschiedenen Varietäten angeboten werden (US-amerikanisches und Britisches Englisch). Sprachsynthese für das Deutsche gibt es üblicherweise nur für eine Standardvarietät. Eine Ausnahme davon ist beispielsweise die österreichische Sprachsynthese von Pucher et al. (2010). Ein Nachteil der meisten regionalen Varietäten besteht in der beschränkten Anzahl bzw. des Umfangs notwendiger Ressourcen wie Aussprachelexikon, Sprachaufnahmen und Textkorpora. Mittlerweile gibt es aber auch für die "lower-resourced languages" Ansätze, Sprachverarbeitung und somit auch Text-to-Speech-Synthese sinnvoll zu betreiben (vgl. z.B. Schultz & Black 2008). Obwohl Ressourcen für das Luxemburgische für die automatische Spracherkennung immer mehr nutzbar gemacht werden (vgl. z.B. Adda-Decker et al. 2014), gibt es bislang keine Sprachsynthese für das Luxemburgische. Das hier vorgestellte System verwendet die Syntheseplattform MaryTTS (Schröder & Trouvain 2003, Schröder et al. 2011). Es werden Aufnahmen einer Muttersprachlerin auf Luxemburgisch (ca. 2 Stunden Material) und auf Französisch (ca. 1 Stunde Material) zu Synthesestimmen mit unterschiedlichen Technologien verarbeitet. Eine Herausforderung stellen Anglizismen, aber besonders die Fremdphoneme aus dem Deutschen, z.B.: /yː/, /øː/, und dem Französischen, z.B. /õ/, /ã/ dar (vgl. Gilles & Trouvain 2013). Die Modellierung der Prosodie erfolgt mittels Entscheidungsbäumen, die auf phonologischen und morpho-syntaktischen Informationen wie Wortart, Wortbetonung, Stellung im Satz basieren und aus den aufgenommenen Sprachdaten trainiert werden. Ein Ziel ist es, das MaryLux-System frei zugänglich zu machen. Ein anderes Ziel besteht darin, zu überprüfen, inwieweit die erhobenen Ressourcen für multilinguale Synthese (ein und derselben Stimme) ausreichend sind.
 
Files: BibTeX, IGDD2015Poster.pdf