Wie in der Europäischen Datenstrategie 2020 dargelegt, sind Daten der Treibstoff des 21. Jahrhunderts. Deshalb unterstützt die Europäische Kommission die Entwicklung gemeinsamer europäischer Datenräume in strategischen Wirtschaftssektoren und Bereichen von öffentlichem Interesse. Diese bündeln relevante Dateninfrastrukturen und Governance-Ansätze, um die Bündelung und gemeinsame Nutzung von Daten zu erleichtern. Dadurch können Daten aus der gesamten EU vertrauenswürdig und sicher bereitgestellt und ausgetauscht werden, während Unternehmen und Einzelpersonen die Kontrolle über die von ihnen generierten Daten behalten.
Einer der derzeit in Entwicklung befindlichen Datenräume ist der Language Data Space (LDS). Über ihn können relevante Akteure, z.B. aus der Verlags-, Sprachtechnologie- oder Pressebranche, ihre Sprachdaten und andere Sprachressourcen (z.B. Sprachmodelle) über eine einzige Plattform austauschen und monetarisieren, wobei die europäischen Werte und die Einhaltung der EU-Vorschriften uneingeschränkt berücksichtigt werden. Dadurch wird das LDS die dringend benötigte Verfügbarkeit hochwertiger und konformer Sprachdaten deutlich erhöhen und so die Entwicklung modernster Sprachtechnologien (LT) und KI-basierter LT-Dienste für eine Reihe von Unternehmen unterstützen.
Die Schaffung der LDS-Plattform soll einen Wendepunkt in der Erfassung von Sprachressourcen markieren: Das LDS wird der europäischen Industrie helfen, im globalen Wettbewerb mit den Sprachtechnologiediensten US-amerikanischer oder chinesischer Unternehmen zu bestehen und während des gesamten Prozesses des Sprachdatenaustauschs Vertrauen aufzubauen.