Projekt

Pret-a-LLOD

Scalable Open Linked Data environment

  • Laufzeit:

Sprachtechnologien sind zunehmend auf große Datenmengen angewiesen, um einen besseren Zugang zu Sprachressourcen zu ermöglichen. Damit koennen mehrsprachige Lösungen angeboten werden, die den digitalen Binnenmarkt in Europa unterstützen würden. Allerdings sind Daten selten "ready-to-use" und Sprachtechnologiespezialisten verbringen über 80% ihrer Zeit mit der Bereinigung, Organisation und Sammlung von Datensätzen. Die Reduzierung dieses Aufwands verspricht enorme Kosteneinsparungen für alle Bereiche, in denen Sprachtechnologien benötigt werden. Ein wesentlicher Bestandteil des Extract-Transform-Load-Prozesses ist die Verknüpfung von Datensätzen mit bestehenden Schemata. Aber nur wenige Spezialisten nutzen die Vorteile verknüpfter Datentechnologien, um diese Aufgabe zu erfüllen. Im Pret-a-LLOD Projekts wollen wir die Verbreitung von Sprachtechnologien steigern, indem wir die Kombination aus verknüpften Daten und Sprachtechnologien, nämlich die "Linguistic Linked Open Data" (LLOD) Wwolke, nutzen, um gebrauchsfertige mehrsprachige Daten zu erstellen. Prêt-à-LLOD will dies erreichen, indem es eine neue Methodik für den Aufbau von Daten-Wertschöpfungsketten schafft, die für ein breites Spektrum von Sektoren und Anwendungen anwendbar ist und auf Sprachressourcen und Sprachtechnologien basiert, die mittels semantischer Technologien integriert werden können, insbesondere die Verwendung von Linguistic Linked Open Data (LLOD). Das Projekt wird neue Werkzeuge für die Transformation und Verknüpfung von Datensätzen entwickeln und diese sowohl auf Daten als auch auf Metadaten anwenden, um einen Multi-Portal-Zugang zu heterogenen Datenspeichern zu ermöglichen. Wir werden untersuchen, wie wir Lizenzen automatisch analysieren können, um daraus abzuleiten, wie Daten von Sprachressourcenanbietern rechtmäßig verwendet und verkauft werden können. Schließlich werden wir Werkzeuge zur Verfügung stellen, um Sprachdienste und -ressourcen durch den Einsatz semantischer Technologien zu komplexen Pipelines zu kombinieren. Dies wird zu nachhaltigen Datenangeboten und -diensten führen, die auf vielen Plattformen, einschließlich bisher unbekannter Plattformen, bereitgestellt und mit verknüpfter Datensemantik selbst beschrieben werden können.

Partner

NATIONAL UNIVERSITY OF IRELAND GALWAY (Coordinator)
Ireland UNIVERSIDAD DE ZARAGOZA -- Spain UNIVERSIDAD POLITECNICA DE MADRID -- Spain UNIVERSITAET BIELEFELD -- Germany JOHANN WOLFGANG GOETHEUNIVERSITATFRANKFURT AM MAIN -- Germany DEUTSCHES FORSCHUNGSZENTRUM FUR KUNSTLICHE INTELLIGENZ GMBH -- Germany SEMALYTIX GMBH -- Germany THE CHANCELLOR, MASTERS AND SCHOLARS OF THE UNIVERSITY OF OXFORD -- United Kingdom SEMANTIC WEB COMPANY GMBH -- Austria DERILINX LIMITED -- Ireland

Projekt teilen auf:

Ansprechpartner

Publikationen zum Projekt

Lenka Bajčetić, Thierry Declerck

In: Zoe Gavriilidou, Maria Mitsiaki, Asimakis Fliatouras (Hrsg.). Proceedings of XIX EURALEX Congress. EURALEX International Congress (EURALEX-2020) Lexicography for Inclusion September 7-11 Seiten 73-80 1 ISBN 978-618-85138-1-5 Euralex 11/2020.

Zur Publikation
Tanja Wissik, Thierry Declerck

In: Actes de la conférence TOTh 2019. Terminology & Ontology: Theories and applications (TOTh-2019) June 6-7 Le Bourget du Lac France Seiten 365-381 ISBN 978-2-919732-80-7 Presses Universitaires Savoie Mont Blanc Chambéry 7/2020.

Zur Publikation
Thierry Declerck, John McCrae, Matthias Hartung, Jorge Gracia, Christian Chiarcos, Elena Montiel, Philipp Cimiano, Artem Revenko, Roser Sauri, Deirdre Lee, Stefania Racioppa, Jamal Nasir, Matthias Orlikowski, Marta Lanau-Coronas, Christian Fäth, Mariano Rico, Mohammad Fazleh Elahi, Maria Khvalchik, Meritxell Gonzalez, Katharine Cooney

In: Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Christopher Cieri, Khalid Choukri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis (Hrsg.). Proceedings of the Twelfth International Conference on Language Resources and Evaluation (LREC 2020). International Conference on Language Resources and Evaluation (LREC-2020) May 11-16 Marseille France Seiten 5660-5667 ISBN 979-10-95546-34-4 ELRA Paris 5/2020.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence