TU Berlin- und DFKI-Researcher präsentieren mehrere Paper auf der VLDB 2020

25.09.2020 | Data Management & Analysis | Intelligente Analytik für Massendaten | Berlin

Forschende der Gruppe Datenbanksysteme und Informationsmanagement (DIMA) der TU Berlin und der Gruppe Intelligente Analytik für Massive Daten (IAM) am DFKI präsentierten auf der 46th International Conference on Very Large Databases (VLDB 2020) ein Full-Paper, ein Demo-Paper, ein Workshop-Paper und drei PhD-Paper.

Alexander Renz-Wieland präsentiert sein Paper "Dynamic Parameter Allocation in Parameter Servers" auf der VLDB 2020

Das Paper "Dynamic Parameter Allocation in Parameter Servers" von Alexander Renz-Wieland et al. schlägt vor, die dynamische Parameterzuweisung in Parameterserver zu integrieren, beschreibt eine effiziente Implementierung eines solchen Parameterservers namens Lapse und vergleicht dessen Leistung experimentell mit bestehenden Parameterservern über eine Reihe von Machine-Learning-Aufgaben hinweg.
Die Präsentation von Alexander Renz-Wieland finden Sie hier:https://www.youtube.com/watch?v=aMSjPW8Dmc0Das Paper ist hier verfügbar:https://www.vldb.org/pvldb/vol13/p1877-renz-wieland.pdf

Im Demo-Paper "Demand-based Sensor Data Gathering with Multi-Query Optimization" demonstrieren Julius Hülsmann et al. eine Technik zur Minimierung der Anzahl von Netzwerkübertragungen bei gleichzeitiger Beibehaltung der gewünschten Genauigkeit. Der vorgestellte Algorithmus für die gemeinsame Nutzung von Lese- und Übertragungsvorgängen zwischen Queries geht Hand in Hand mit modernsten maschinellen Lernverfahren zur adaptiven Abtastung. Sie i. implementieren die Technik und setzen sie auf einem Sensorknoten ein, i. spielen Sensordaten aus zwei realen Szenarien ab, i. stellen eine Schnittstelle für das Einreichen kundenspezifischer Anfragen bereit und i. Präsentieren ein interaktives Dashboard. Hier beobachten Besucher live Statistiken über die in realen Anwendungsfällen erzielten Einsparungen beim Lesen und Übertragen. Das Dashboard visualisiert auch Optimierungen, die derzeit durch ein Leseplanungsverfahren durchgeführt werden, und vermittelt somit Echtzeit-Einblicke und ein tiefes Verständnis des vorgestellten Algorithmus.
Die Präsentation von Julius Hülsmann finden Sie hier:https://www.youtube.com/watch?v=ctpj-o3b4B4Das Paper ist hier verfügbar: http://www.vldb.org/pvldb/vol13/p2801-hulsmann.pdf

Auf dem diesjährigen International Workshop on Very Large Internet of Things (VLIOT 2020), der in Verbindung mit VLDB 2020 stattfand, stellten Dr. Steffen Zeuch et al. ihr IoT-Analyse-Paper "NebulaStream: Complex Analytics Beyond the Cloud" vor. Das Ziel dieses Papers ist es, die Lücke zwischen den Anforderungen kommender IoT-Anwendungen und den unterstützten Funktionen eines IoT-Datenmanagementsystems zu schließen. Zu diesem Zweck wird skizziert, wie hochmoderne SPEs sich ändern müssen, um die neuen Möglichkeiten des IoT nutzen zu können und gezeigt, wie die Herausforderungen des IoT im System NebulaStream angegangen werden. Dieses Paper legt den Grundstein für eine neue Art von Systemen, die das IoT nutzen, um groß angelegte Anwendungen über Millionen von IoT-Geräten in hochdynamischen und geodistributierten Umgebungen zu ermöglichen.
Die Präsentation von Dr. Steffen Zeuch finden Sie hier: https://www.youtube.com/watch?v=PCvihOXjhI8

Das Paper ist hier verfügbar: https://www.ronpub.com/ojiot/OJIOT_2020v6i1n07_Zeuch.html

Ebenfalls in Verbindung mit der VLDB 2020 fand in diesem Jahr am 04. September der 2nd International Workshop on Large Scale Graph Data Analytics (LSGDA 2020) statt. Muhammad Imran präsentierte basierend auf seinem Paper “Distributed Graph Analytics with Datalog Queries in Flink”, mit verfasst von Gábor Gévay und Prof. Dr. Volker Markl, das System Cog, das Datalog-Programme auf Apache Flink ausführt. Die Autoren implementierten einen parallelen semi-naiven Auswertungsalgorithmus, der die Delta-Iteration von Flink ausnutzt, um nur die Tupel zu propagieren, die für die nachfolgenden Iterationen weiterverarbeitet werden müssen. Die Delta-Iterationsfunktion von Flink reduziert den Overhead, der in azyklischen Datenflusssystemen wie Spark bei der Auswertung rekursiver Abfragen anfällt, und macht sie dadurch effizienter. Ihre Experimente zeigen, dass Cog in den meisten Tests BigDatalog, das hochmoderne verteilte Datalog-Auswertungssystem, übertroffen hat.
Die Präsentation von Muhammad Imran finden Sie hier:https://www.youtube.com/watch?v=Ozvr1wrQcy4

Ein Preprint des Papers ist hier verfügbar: https://bit.ly/2HhzIsh

Außerdem präsentierten drei PhD-Studenten ihre Arbeiten auf dem VLDB 2020 PhD Workshop:

Serafeim Papadias: “Tunable Streaming Graph Embeddings at Scale”
Presentation | Paper

Kajetan Maliszewski: “Secure Data Processing at Scale”
Presentation | Paper

Ariane Ziehn: “Complex Event Processing for the Internet of Thing”
Paper

Mehr über VLDB 2020:

https://vldb2020.org/

Kontakt:

Prof. Dr. Volker Markl

Volker.Markl@dfki.de