Sprachtechnologie - Trendminer / monnet / EXCITEMENT
Die Datenmenge, die im Minutentakt über formale Nachrichtenkanäle oder über Twitter verbreitet wird, wächst dynamisch und kann als Stimmungsbarometer Politik- und Finanztrends abbilden. TrendMiner ermöglicht eine semantische Echtzeit-Analyse heterogener Datenquellen wie Newsticker, Börsenmeldungen oder Social Networks. Die Plattform erkennt, extrahiert und klassifiziert Themen mit Hilfe von maschinellen Lernverfahren und unterstützt z.B. die Auswertung von Aktientrends oder politischen Stimmungsbildern im Vorfeld einer Wahl.
TrendMiner wird im 7.Forschungsrahmenprogramm unter dem Förderkennzeichen 287863 von der Europäischen Union ko-finanziert und hat eine Laufzeit von drei Jahren (2011-2014).
monnet macht Geschäftsberichte über Sprachgrenzen hinweg durchsuchbar
In monnet werden mit Hilfe von XBRL (eXtended Business Reporting Language) einfache Internet-Tools entwickelt, die die multilinguale Extraktion und die automatische Übersetzung von strukturierten Informationen aus Geschäftsberichten ermöglichen.
XBRL ist ein auf XML basierender, offener Standard für den technisch und inhaltlich standardisierten Austausch von komplexen Finanzinformationen in Geschäftsberichten. XBRL ermöglicht die strukturierte Darstellung von Informationen und erlaubt so die direkte Vergleichbarkeit strukturierter bilanztechnischer Begrifflichkeiten über Sprachgrenzen hinweg.
Dazu haben Forscher aus dem DFKI-Forschungsbereich Sprachtechnologie in Zusammenarbeit mit den Partnern DERI (Digital Enterprise Research Institute Galway), XBRL-Europa und SAP Geschäftsberichte in mehreren Sprachen auf semantischer Ebene analysiert. Ziel ist es, extrem präzise semantische Ansätze zur Übersetzung und Informationsextraktion zu entwickeln, ohne den etablierten Work-Flow zu stören. Die neuen Technologien und Ressourcen werden so integriert, dass die Nutzer der bisherigen XBLR-Informationen sich nicht an neue Vorgehensweisen gewöhnen müssen.
Das Projektergebnis ist eine Reihe von Software-Komponenten, mit denen Finanzdaten aus mehrsprachigen Quellen extrahiert, integriert und dargestellt werden können.
Der monnet-Demonstrator auf der CeBIT 2013 zeigt die Bearbeitung von XBRL-Dokumenten und die Abbildung der Informationen in einer semantischen Repräsentation. Er unterstützt die Erstellung eines Berichts über die wichtigsten Informationen und übersetzt ihn in andere Sprachen. Zusätzlich verknüpft er diesen Bericht zu Taxonomien, die in anderen europäischen Ländern, insbesondere Deutschland und Spanien, angewendet werden.
monnet wird im 7. Forschungsrahmenprogramm der Europäischen Union unter der Förderkennziffer 248458 gefördert.
EXCITEMENT – Multilinguale Plattform für textuelle Inferenz
Die Analyse von Kundeninteraktionen ist ein großer und wachsender Geschäftsbereich, in dem verschiedenste Kommunikationskanäle eine Rolle spielen, z.B. Call Center, E-Mail-Kontake, Web-Foren. Durch die Analyse dieser Daten erhalten Unternehmen Informationen über Vor- und Nachteile ihrer Produkte, Berichte über typische Kundenanliegen oder über Defizite im Umgang mit Kunden. Durch den enormen Wachstum Web-basierter Märkte müssen Analysten durch automatische Systeme unterstützt werden, die Kundeninteraktionen kompakt und ausdrucksstark repräsentieren können und über die aktuellen Keyword-basierten Technologien weit hinausgehen. Semantische Ähnlichkeiten von Kundenberichten können automatisch identifiziert und klassifiziert und zur Ableitung von Inferenzen herangezogen werden.
Das von der EU geförderte Forschungsprojekt EXCITEMENT hat als zentrale Ziele die Entwicklung einer generischen multilingualen Plattform für textuelle Inferenz, die auf dem erfolgreichen Paradigma der "textuellen Implikation" (textual entailment) basiert und die der wissenschaftlichen und technischen Gemeinschaft zur Verfügung gestellt wird. Dies ermöglicht vielen Anwendungen, diese offene Plattform wirksam und nachhaltig für die Entwicklung einer neuartigen Generation von Technologien zur unüberwachten Textexploration von Kundeninteraktionen einzusetzen, um hierdurch besser an die unterschiedlichen und oft unvorhergesehenen Inhalte und Meinungen von Kunden zu gelangen.
Weitere Informationen
http://www.dfki.de/lt/project.php?id=Project_683&l=en
Kontakt
Thierry Declerck
Forschungsbereich Sprachtechnologie
E-Mail:
Thierry.Declerck@dfki.de
Tel.: +49 681 85775 5358
Günter Neumann
Forschunsgbereich Sprachtechnologie
E-Mail: Guenter.Neumann@dfki.de
Tel.: +49 +49 681 85775 5358
Stand-Koordinaten
CeBIT 2013, Halle 9, Stand F50
Pressekontakt auf der CeBIT 2013
Heike Leonhard, DFKI
Tel. +49 174 3076888
Email: Heike.Leonhard@dfki.de
