Intelligente Analytik für Massendaten

Smart Data

Die Aufgabe der Forschungsgruppe Intelligente Analytik für Massendaten (IAM) ist es, Datenanalysten Technologien und Werkzeuge bereitzustellen, mit denen sich neuartige Erkenntnisse aus großen, vielfältigen und sich schnell verändernden Datenmengen gewinnen lassen.

Unser Team 

  • erforscht Methoden, Technologien und Werkzeuge für Datenanalytik, unter Einbeziehung der gesamten Datenwertschöpfungskette: von Datenerfassung und Informationsextraktion über Informationsintegration und Speicherung bis hin zu skalierbarer Datenverarbeitung, interaktiver Analyse und Visualisierung, unter Berücksichtigung von Crowd-Computing und Benutzerfeedback.
  •  unterstützt datengetriebene Entscheidungsfindung durch Systeme zur Ableitung und Bereitstellung von hochwertigen und verwertbaren Informationen für Wissenschaft, Industrie und Gesellschaft.
  •  entwickelt neuartige und verbesserte Werkzeuge und Lösungen für Informationsmanagement, Data Science und Anwendungen von „Smart Data“.
     

Unsere Forschungsschwerpunkte liegen in den Bereichen skalierbare Datenmanagementsysteme und ‑werkzeuge, Data-Mining und Open Data/Informationsmarktplätze. 

Die Forschungsgruppe unter Leitung von Prof. Dr. Markl arbeitet eng mit dem Fachgebiet Datenbanksysteme und Informationsmanagement (DIMA) der TU Berlin zusammen und ist am Berlin Big Data Center (BBDC) beteiligt.

Das vom Bundesministerium für Bildung und Forschung (BMBF) geförderte BBDC ist ein Kompetenzzentrum für Big Data unter der Konsortialführerschaft der TU Berlin.

Flink / Stratosphere

"Apache Flink" [1] is a stream-processing framework for distributed, high-performing, always-available, and accurate data streaming applications. It originated from the joined research project "Stratosphere" [2], funded by the Deutsche Forschungsgemeinschaft (DFG). After a successful incubator phase, Flink graduated to a top-level project of the Apache Foundation [3] and became one of the most important and promising projects within the Apache Big Data Stack. Flink has a big and lively community, numerous well-known users, such as Zalando, Alibaba, and Netflix, and features it's own annually conference "FlinkForward" [4] taking place in Berlin and San Francisco.

[1] https://flink.apache.org

[2] http://stratosphere.eu/

[3] https://www.apache.org/

[4] https://flink-forward.org/

EMMA

Emma is a quotation-based Scala DSL that enables holistic optimizations of data flow programs for scalable data analysis on Apache Flink and Spark.

http://emma-language.org

Hawk

A Hardware Adaptive Query Compiler

The performance of modern processors is primarily bound by a fixed energy budget. This power wall forces processor vendors to specialize their processors to certain applications to provide the speedups users expect.

http://cogadb.dfki.de/

Myriad

The Myriad Toolkit facilitates the specification of scalable data generation programs with complex statistical constraints via a special XML data generator prototyping language.

The Myriad Toolkit uses advanced PRNG algorithms to implement offset-based access to the elements of the generated domain type sequences within a bounded time. This feature facilitates an efficient data-parallel execution mode. Data generation programs created with the Myriad Toolkit therefore can be scaled-out in a massively parallel manner in order to quickly generate large synthetic datatets with complex statistical dependencies.

http://www.myriad-toolkit.com

https://github.com/TU-Berlin-DIMA/myriad-toolkit

Peel

Peel is a framework that helps you to define, execute, analyze, and share experiments for distributed systems and algorithms. A Peel package bundles together the configuration data, datasets, and workload applications required for the execution of a particular collection of experiments. Peel bundles can be largely decoupled from the underlying operational environment and easily migrated and reproduced to new environments.​

http://peel-framework.org/

Kontakt

Deutsches Forschungszentrum für
Künstliche Intelligenz GmbH (DFKI)
Intelligente Analytik für Massendaten
DFKI Projektbüro Berlin
Alt-Moabit 91c
10559 Berlin
Deutschland

News aus dem Forschungsbereich

Team der TU Berlin und des DFKI zeigen ihren Preis

Die Deutsche Gesellschaft für Informatik (GI) veranstaltet jedes Jahr ein Symposium zu Datenbanksystemen für Wirtschaft, Technologie und Web (BTW). In...

Zum Artikel

Mit einem Kick-off-Meeting im Smart Data Forum wurde am 18. Januar die zweite Förderphase des Berlin Big Data Center (BBDC) eingeläutet. Nach vier...

Zum Artikel
DFKI-Stand auf der CEBIT 2018

Auf dem neuen CEBIT Business Festival für Innovation und Digitalisierung präsentiert das DFKI vom 12. bis 15. Juni 2018 „Künstliche Intelligenz für...

Zum Artikel

Deutsches Forschungszentrum für Künstliche Intelligenz
German Research Center for Artificial Intelligence