Skip to main content Skip to main navigation

Projekt | CLARIN

Laufzeit:
Common Language Resources and Technology Infrastructure

Common Language Resources and Technology Infrastructure

Das Projekt CLARIN stellt eine große pan-europäische Initiative dar, die in einer kollaborativen Anstrengung darauf abzielt, Sprachressourcen zu kreieren, zu koordinieren und für eine größere Gemeinschaft verfügbar und verwendbar zu machen. So sollten zum Beispiel Akademiker einen vereinfachten Zugriff auf computergestützte Sprachressourcen erhalten, die für verschiedene wissenschaftliche Felder unterschiedliche Rollen spielen können, sei es als Träger von kulturellen Inhalten und von Wissen, als Kommunikationswerkzeuge, als Komponenten verschiedenen Typen von Identität oder ganz einfach als Studiumsgegenstand.

Kernpunkte von CLARIN

  • Umfassende Dienste zu Sprachressourcen und -technologien für die Geisteswissenschaften
  • Technologien, die die zahlreichen Grenzen überwinden, welche heute die Ressourcen- und Werkzeug-Landschaft fragmentieren, etwa Probleme der institutionalen, strukturellen und semantischen Interoperabilität
  • Interoperable Werkzeuge und Ressourcen üer Sprach- und Domänengrenzen hinweg, so dass das multilinguale und multikulturelle Erbe Europas erhalten werden kann.
  • Umfassende Trainings- und Ausbildungsprogramme, die universitäte Ausbildung in den unterschiedlichen Mitgliedsstaaten einschließen
  • Verbesserung und erweiterung der webbasierten zusammenarbeit, d.h. Schaffung virtueller interdisziplinärer Arbeitsgruppen
  • Entwicklung oder Verbesserung von Standards zur Pflege von Sprachressourcen.
  • Eine dauerhafte und stabile Infrastruktur, auf die Forscher in den kommenden Dekaden aufbauen können

Schlüsseltechnologien von CLARIN

  • Data-Grid-Technologien, um Repositorien zu verknüpfen, wie sie im Pilotproject DAM-LR implementiert wurden, und um Webdienste der verschiedenen zentren miteinander zu berbinden;
  • Ausbau von Ideen der Digital Library Gemeinschaft zur Schaffung von Live-Archiven und Unterstützung solcher Initiativen;
  • Einsatz von und Beiträge zu technologien des Semantischen Webs, um die strukturellen und semantischen Kodierungsprobleme zu lösen;
  • IEinsatz fortgeschriettener multi-lingualer Sprachtechnologie, die kulturelle und sprachliche Integration fördert.

Partner

  • Universiteit Utrecht (NL)
  • Max-Planck-Gesellschaft (DE)
  • Research Institute for Linguistics, Hungarian Academy of Sciences (HU)
  • The Chancellor, Masters and Scholars of the University of Oxford (UK)
  • Institutul de Cercetari pentru Inteligenta Artificiala (RO)
  • Fundacao da Faculdade de Ciencias da Universidade de Lisboa (PT)
  • Universitat Pompeu Fabra (ES)#
  • Institute for Parallel Processing of the Bulgarian Academy of Sciences (BG)
  • Centre National de la Recherche Scientifique (FR)
  • University of Zagreb, Faculty of Humanities and Social Sciences (HR)
  • University of Copenhagen (DK)
  • Universitetet i Bergen (NO)
  • Eberhard Karls Universität Tübingen (DE)
  • University of Malta (MT)
  • Univerzita Karlova v Praze (CZ)
  • Instituut voor Nederlandse Lexicologie (NL)
  • Lunds universitet (SE)
  • Helsingin yliopisto (FI)
  • University Al.I. Cuza of Iasi (RO)
  • Institute for Language and Speech Processing - Athena Research and Innovation Centre in Information, Communication and Knowledge Technologies (GR)
  • Consiglio Nazionale delle Ricerche - Istituto di Linguistica Computazionale (IT)
  • Politechnika Wroclawska (PL)
  • Kungliga Tekniska Hoegskolan (SE)
  • Deutsches Forschungszentrum für Künstliche Intelligenz GmbH (DE)
  • The University of Sheffield (UK)
  • Instytut Podstaw Informatyki Polskiej Akademii Nauk (PL)
  • European Language Resources Distribution Agency S.A. (FR)
  • Lancaster University (UK)
  • Universität Wien (AT)
  • University of Tartu (EE)
  • CSC-Tieteellinen laskenta Oy (FI)
  • Katholieke Universiteit Leuven (BE)

Publikationen zum Projekt

  1. Linguistic and Semantic Representation of the Thompson's Motif-Index of Folk-Literature

    Thierry Declerck; Piroska Lendvai

    In: Stefan Gradmann; Francesca Borri; Carlo Meghini; Heiko Schuldt (Hrsg.). Research and Advanced Technology for Digital Libraries - International Conference on Theory and Practice of Digital Libraries. International Conference on Theory and Practice of Digital Libraries (TPDL-2011), Research and Advanced Technology for Digital Libraries, September 26-28, Berlin, Germany, Lecture Notes in Computer…
  2. A Text Technology Infrastructure for Annotating Corpora in the eHumanities

    Thierry Declerck; Ulrike Czeitschner; Karlheinz Moerth; Claudia Resch; Gerhard Budin

    In: Stefan Gradmann; Francesca Borri; Carlo Meghini; Heiko Schuldt (Hrsg.). esearch and Advanced Technology for Digital Libraries - International Conference on Theory and Practice of Digital Libraries. International Conference on Theory and Practice of Digital Libraries (TPDL-2011), September 26-28, Berlin, Germany, LNCS, No. 6966, ISBN 978-3-642-24468-1, Springer, 9/2011.
  3. Proppian Content Descriptors in an Integrated Annotation Schema for Fairy Tales

    Thierry Declerck; Antonia Scheidel; Piroska Lendvai

    In: Caroline Sporleder; Antal van den Bosch; Kalliopi Zervanou. Language Technology for Cultural Heritage. Selected Papers from the LaTeCH Workshop Series. Pages 155-169, Theory and Applications of Natural Language Processing, ISBN 978-3-642-20226-1, Springer, Heidelberg, 2011.

Fördergeber

EU - Europäische Union

CP-CSA_INFRA-2007-2.2.01

EU - Europäische Union