Skip to main content Skip to main navigation

Projekt | OpenGPT-X

Laufzeit:
Aufbau eines Gaia-X Knotens für große Kl-Sprachmodelle und innovative Sprachapplikations-Services; Teilvorhaben: Entwicklung von Sprachmodellen, Interoperabilitäts- und Nutzungskonzepten

Aufbau eines Gaia-X Knotens für große Kl-Sprachmodelle und innovative Sprachapplikations-Services; Teilvorhaben: Entwicklung von Sprachmodellen, Interoperabilitäts- und Nutzungskonzepten

Forschungsthemen

Generative KI und große KI- Sprachmodelle (Large Language Models, LLMs) sind spätestens seit ChatGPT in aller Munde und haben großes Potenzial für den Einsatz in Unternehmen. Ein Großteil der derzeit leistungsfähigsten Modelle ist jedoch “closed source” und wird von großen US-amerikanischen und chinesischen Unternehmen entwickelt. OpenGPT-X will ein Zeichen setzen: Mit den richtigen Rahmenbedingungen können Deutschland und Europa bei der Entwicklung dieser Schlüsseltechnologie international Schritt halten – und dabei eigene Alleinstellungsmerkmale betonen. Das Projekt will dazu beitragen, die Wahlfreiheit deutscher Unternehmen und die digitale Souveränität im Bereich GenAI zu stärken und damit bestehende Hürden für den Einsatz generativer KI in deutschen Unternehmen abzubauen.

OpenGPT-X und seine Konsortialpartner bilden die gesamte GenAI-Wertschöpfungskette ab: Von der hochskalierbaren, GPU-basierten Infrastruktur und den Daten für das Training großer Sprachmodelle, über das Design der Modelle selbst, bis hin zur produktiven Anwendung in Form von Prototypen und Proof of Concepts (PoCs) durch Konsortialpartner aus der Wirtschaft. Das Projekt hat damit den Anspruch, einerseits hochaktuelle Forschungsfragen voranzutreiben und wissenschaftliche Untersuchungen zu kritischen Entscheidungen für das Training der Modelle durchzuführen. Andererseits wird aber auch der produktive Einsatz der Modelle vom ersten Entwicklungsschritt an mitgedacht.

Das Vorhaben wird vom Bundesministerium für Wirtschaft und Klimaschutz (BMWK) im Rahmen des Förderwettbewerbs “Innovative und praxisnahe Anwendungen und Datenräume im digitalen Ökosystem Gaia-X” von Januar 2022 bis März 2025 mit insgesamt rund 14 Millionen Euro gefördert. Zuständig für die Durchführung des Gaia-X Förderwettbewerbs ist die Bundesnetzagentur (BNetzA). Der Gaia-X Hub Germany bei acatech ‒ Deutsche Akademie für Technikwissenschaften betreut und unterstützt die Gaia-X Fördervorhaben in der wissenschaftlichen Begleitung, bei der Vernetzung und im Ergebnistransfer.

Publikationen

Alle Publikationen
  1. Occiglot at WMT24: European open-source large language models evaluated on translation

    Eleftherios Avramidis; Annika Grützner-Zahn; Manuel Brack; Patrick Schramowski; Pedro Ortiz Suarez; Malte Ostendorff; Fabio Barth; Shushen Manakhimova; Vivien Macketanz; Georg Rehm; Kristian Kersting

    In: Philipp Koehn; Barry Haddow; Tom Kocmi; Christof Monz (Hrsg.). Proceedings of the Ninth Conference on Machine Translation. Conference on Machine Translation (WMT-24), located at EMNLP 2024, November 15-16, Miami, Florida, USA, Association for Computational Linguistics, 11/2024.
  2. Large Language Models are Echo Chambers

    Jan Nehring; Aleksandra Gabryszak; Pascal Jürgens; Aljoscha Burchardt; Stefan Schaffer; Matthias Spielkamp; Birgit Stark

    In: Nicoletta Calzolari; Min-Yen Kan; Veronique Hoste; Alessandro Lenci; Sakriani Sakti; Nianwen Xue (Hrsg.). Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024). Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING-2024), ELRA and ICCL, 2024.

Fördergeber

BMWi - Bundesministerium für Wirtschaft und Energie

68GX21007D

BMWi - Bundesministerium für Wirtschaft und Energie