Projekt

TWENTYONE

Erschließung und Online-Zugriff auf Dokumente zu Nachhaltiger Entwicklung

Erschließung und Online-Zugriff auf Dokumente zu Nachhaltiger Entwicklung

  • Laufzeit:

Im Projekt TWENTYONE arbeiten Umweltschutzorganisationen, Technologiefirmen und Forschungsinstitute aus verschiedenen europäischen Ländern zusammen, um Dokumente aus dem Umweltschutzbereich, insbesondere zum Thema "nachhaltige Entwicklung" auf CD-ROM und im Internet verfügbar zu machen. Diese Dokumente existieren heute in verschiedenen Medien (Papier, elektronische Dokumente, audio-visuelles Material), Formaten (HTML, Word, PageMaker), und Sprachen und sind oftmals nur als "graue" Literatur verfügbar. Diese Vielfalt von Medien, Formaten und Sprachen behindert die Verbreitung der Dokumente und das zielgerichtete Auffinden von Informationen. Als Ergebnis des Projekts TWENTYONE sollen alle diese Dokumente auf CD-ROM und im Internet angeboten werden. Zum Auffinden von Information werden Suchmaschinen entwickelt, und zum Verstehen fremdsprachlicher Texte automatische Übersetzungssysteme eingesetzt. Der wirtschaftliche Nutzen für die Autoren und Herausgeber der Dokumente besteht in der größeren Verbreitung, während der Benutzer von der besseren Zugänglichkeit und der verbesserten inhaltlichen Erschließung der Dokumente profitiert.

  • Dokumente, die nicht elektronisch sondern in Papierform vorliegen, werden eingescannt und umgewandelt, die Dokumentstruktur wird automatisch analysiert, und der Textinhalt mittels optischer Zeichenerkennung (OCR) extrahiert.
  • Durch Fuzzy Matching bei der Suche ist das System robust gegenüber Schreibfehlern in den Dokumenten, in der Anfrage und gegenüber OCR-Fehlern.
  • Durch linguistische Analyse der Texte kann nicht nur nach Einzelwörtern gesucht werden, sondern auch nach wichtigen Phrasen (z. B. ßustainable development").

Partner

Getronics Software NL (Co-ordinator), Environ Trust Ltd UK, Highland Software UK, Friends of the Earth Europe Belgium, Klima-Bündnis, Rank Xerox Research Center Grenoble, MOOI Foundation NL, TNO-TPD Delft NL, University of Tübingen, University of Twente NL, VODO Belgium

Projekt teilen auf:

Ansprechpartner
Prof. Dr. Hans Uszkoreit

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence