Sprachtechnologie und Multilingualität

D&R Gruppe

Sprachressourcen bilden die Basis für die Entwicklung, Anpassung und/oder Evaluierung von Sprachtechnologien wie z.B. Systemen für maschinelle Übersetzung, Chatbots, Question-Answering-Systemen etc.

Das Team Daten & Ressourcen des Forschungsbereichs Multilinguality and Language Technology befasst sich insbesondere mit der Sammlung und Verarbeitung von Sprachdaten in Europa und der ganzen Welt und erstellt aus ihnen wertvolle Ressourcen für die Entwicklung intelligenter Sprachtechnologien. Alle Sprachressourcen – sowie entsprechende Sprachentools und Services – stehen Forschern und Entwicklern aus Wissenschaft, Industrie und anderen Bereichen im ELRC-SHARE Repository zur weiteren Nutzung zur Verfügung.

Die Nachhaltigkeit und der Erfolg unserer Aktivitäten im Bereich der Sprachdatensammlung stützt sich auf die enge Zusammenarbeit mit den ELRC National Anchor Points – einem einzigartigen Netzwerk aus Sprachtechnologen und Experten des öffentlichen Dienstes, das von der Forschungsgruppe Daten & Ressourcen 2015 ins Leben gerufen wurde und aus Vertretern aller EU- Mitgliedstaaten sowie Norwegen und Island besteht, die die Sprachdatensammlung in ihren Ländern unterstützen und mitbegleiten.


Auswahl aktueller Projekte

ELRC

European Language Resource Coordination (ELRC).
SMART 2019/1083

Projektseite

LT-BRIDGE

“Bridging the technology gap: Integrating Malta into European Research and Innovation efforts for AI-based language technologies”.
H2020-WIDESPREAD-2020-5 Grant Agreement No. 952194

Projektseite

Fair Forward

Laufzeit: 01.05.2020–30.06.2021
Beratungsdienste für die Gesellschaft für Internationale Zusammenarbeit (GIZ) zu technischen Aspekten der KI in der internationalen Zusammenarbeit einschließlich Verarbeitung natürlicher Sprache (NLP), Trainingsdaten und Datenzugang für FAIR Forward - Künstliche Intelligenz für alle. GIZ Project No. 19.2010.7-003.00

Projektseite

ELG

European Language Grid (ELG).
H2020-EU.2.1.1. Grant Agreement No. 825627

Projektseite

CEF AT Tools and Services

Study on service portfolio development and implementation of the “service desk” component of the CEF Automated Translation Platform (CEF AT Tools and Services).
SMART 2016/0103

Projektseite


Ausgewählte neuere Veröffentlichungen

  • Lilli Smal, Andrea Lösch, Josef van Genabith, Maria Giagkou, Thierry Declerck, Stephan Busemann: “Language Data Sharing in European Public services – Overcoming Obstacles and Creating Sustainble Data Sharing Infrastructures” in: Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Christopher Cieri, Khalid Choukri, Thierry Declerck, , Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis (eds.): Proceedings of the Twelfth International Conference on Language Resources and Evaluation (LREC 2020), Pages 3443-3448, Marseille, France, ELRA, Paris, 5/2020
  • Thierry Declerck; John McCrae; Matthias Hartung; Jorge Gracia; Christian Chiarcos; Elena Montiel; Philipp Cimiano; Artem Revenko; Roser Sauri; Deirdre Lee; Stefania Racioppa; Jamal Nasir; Matthias Orlikowski; Marta Lanau-Coronas; Christian Fäth; Mariano Rico; Mohammad Fazleh Elahi; Maria Khvalchik; Meritxell Gonzalez; Katharine Cooney: „Recent Developments for the Linguistic Linked Open Data Infrastructure“, in: Nicoletta Calzolari; Frédéric Béchet; Philippe Blache; Christopher Cieri; Khalid Choukri; Thierry Declerck; Sara Goggi; Hitoshi Isahara; Bente Maegaard; Joseph Mariani; Hélène Mazo; Asuncion Moreno; Jan Odijk; Stelios Piperidis (eds.): Proceedings of the Twelfth International Conference on Language Resources and Evaluation (LREC 2020), Pages 5660-5667, Marseille, France, ELRA, Paris, 5/2020
  • Christian Chiarcos, Maxim Ionov, Jesse de Does, Katrien Depuydt, Anas Fahad Khan, Sander Stolk, Thierry Declerck, John Philip McCrae: „ Modelling Frequency and Attestations for OntoLex-Lemon “ in: Ilan Kernerman, Simon Krek, John P. McCrae, Jorge Gracia, Sina Ahmadi, Besim Kabashi (eds.): Proceedings of the 2020 Globalex Workshop on Linked Lexicography, Pages 1-9, Marseille, France, ELRA, Paris, 5/2020
  • Sina Ahmadi, John P. McCrae, Sanni Nimb, Fahad Khan, Monica Monachini, Bolette S. Pedersen, Thierry Declerck, Tanja Wissik, Andrea Bellandi, Irene Pisani, Thomas Troelsgård, Sussi Olsen, Simon Krek, Veronika Lipp, Tamás Váradi, László Simon, András Győrffy, Carole Tiberius, Tanneke Schoonheim, Yifat Ben Moshe, Maya Rudich, Raya Abu Ahmad, Dorielle Lonke, Kira Kovalenko, Margit Langemets, Jelena Kallas, Oksana Dereza, Theodorus Fransen, David Cillessen, David Lindemann, Mikel Alonso, Ana Salgado, José Luis Sancho, Rafael-J. Ureña-Ruiz, Jordi Porta Zamorano, Kiril Simov, Petya Osenova, Zara Kancheva, Ivaylo Radev, Ranka Stanković, Andrej Perdih, Dejan Gabrovšek: “A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment” in: Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis (eds.): Proceedings of the Twelfth International Conference on Language Resources and Evaluation (LREC 2020), Pages 3232-3242, Marseille, France, ELRA, Paris, 5/2020
  • Thierry Declerck; Stefania Racioppa; Galia Angelova (Hrsg.); Ruslan Mitkov (Hrsg.); Ivelina Nikolova (Hrsg.); Irina Temnikova (Hrsg.) (2019) „Porting Multilingual Morphological Resources to OntoLex-Lemon“, in: Galia Angelova; Ruslan Mitkov; Ivelina Nikolova; Irina Temnikova (eds.): Proceedings of the International Conference Recent Advances in Natural Language Processing (RANLP 2019), Pages, Varna, Bulgaria, INCOMA Ltd., Shoumen, Bulgaria, 9/2019
  • Andrea Lösch, Valérie Mapelli, Stelios Piperidis, Andrejs Vasiļjevs, Lilli Smal, Thierry Declerck, Eileen Schnur, Khalid Choukri, Josef van Genabith: “European Language Resource Coordination: Collecting Language Resources for Public Sector Multilingual Information Management”, in: Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan, ELRA, Paris, France, 5/2018
  • Thierry Declerck, Kseniya Egorova, Eileen Schnur: “An Integrated Formal Representation of Terminological and Lexical Data included in Classification Schemes” in:  Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018), Miyazaki, Japan, ELRA, Paris, France, Paris, 5/2018

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence