Projekt

TrendMiner

Large-scale, Cross-lingual Trend Mining and Summarisation of Real-time Media Streams

Large-scale, Cross-lingual Trend Mining and Summarisation of Real-time Media Streams

  • Laufzeit:

Das massive Wachstum von Online-Medien und die Zunahme von verteilt erstellten Inhalten (z.B. Weblogs, Twitter, Facebook) hat neue technologische Herausforderungen mit sich gebracht. Darunter fällt die Frage wie man den interpretierenden Zugriff auf solche mehrsprachigen (Text-)Daten effizient und zu erschwinglichen Preisen gewährleisten kann.

TrendMiner setzt sich insbesondere mit (multilingualen) Streaming Online-Medien auseinander und erarbeitet Lösungen für die Verarbeitung der sehr diversen natürsprachlichen Daten, die kurz, grammatisch fehlerhaft und umgangssprachlicher Natur sind.

Die temporale Dimension von Streaming Online-Medien stellt eine zusätzliche Herausforderung dar, da der zeitliche Kontext von Äußerungen mitberücksichtigt werden muss, wenn kurze Nachrichten zuverlässig interpretiert werden sollen.

Das Ziel von TrendMiner sind innovative und übertragbare Open-Source-Echtzeit-Methoden für das cross-linguale Mining und für die Zusammenfassung von großen Streamings von sprachlichen Daten in sozialen Medien. TrendMiner wird dies durch einen interdisziplinären Ansatz erreichen, der linguistische Methoden, wissensbasiertes Ableiten und maschinelles Lernen mit Verfahren aus den Wirtschafts- und Politikwissenschaften kombiniert.

TrendMiner verzichtet auf teure manuelle Annotierung von Daten und nutzt stattdessen Zeitreihendaten (z.B. von den Finanzmärkten und von politischen Umfragen) als Proxy. Eine wichtige Neuerung liegt im Einsatz von schwach überwachten Algorithmen des maschinellen Lernens für die automatische Erkennung von neuen Trends und Korrelationen.

Skalierbarkeit und Erschwinglichkeit werden durch eine Cloud-basierte Infrastruktur für Echtzeit-Text-Mining gewährleistet. Finanz-Decision Support und automatische politische Analyse werden in Kooperation mit Fachleuten implementiert. Die Ergebnisse von TrendMiner werden in zweiFallstudien validiert werden.

Partner

  • Deutsches Forschungszentrum für Künstliche Intelligenz GmbH, Germany (Coordinator)
  • The University of Sheffield, United Kingdom
  • Ontotext AD, Bulgaria 1 36
  • University of Southampton, United Kingdom
  • Stichting Internet Memory Foundation, The Netherlands
  • Eurokleis S.R.L., Italy
  • Sora Ogris & Hofinger GmbH, Austria
  • Hardik Fintrade Pvt Ltd., India

Publikationen zum Projekt

Christian Eisenreich, Jana Ott, Tonio Süßdorf, Christian Willms, Thierry Declerck

In: Proceedings of ISWC 2014. International Semantic Web Conference (ISWC-14) 13th October 19-23 Riva del Garda Italy Springer 10/2014.

Zur Publikation
Dagmar Gromann, Paul Buitelaar, Thierry Declerck

In: Paul Buitelaar, Philipp Cimiano. Towards the Multilingual Semantic Web. Seiten 227-242 ISBN 978-3-662-43584-7 Springer Heidelberg, New York, Dordrecht, London 9/2014.

Zur Publikation
Paloma Martínez, Isabel Segura, Thierry Declerck, José L. Martínez

In: Proceedings of the XXX Conference of the Spanish Society for Natural Language Processing. Conference of the Spanish Society for Natural Language Processing (SEPLN-14) September 16-19 Girona Spain SEPL 9/2014.

Zur Publikation

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence