Maximilian Langohr
Maximilian Langohr, M. Sc.
Maximilian Langohr war von August 2020 bis Juli 2024 wissenschaftlicher Mitarbeiter an unserem Lehrstuhl. Seit August 2024 ist er externer Doktorand.
Forschungsschwerpunkt
ReProVide
Dieses Projekt wird durch die Deutsche Forschungsgemeinschaft (DFG) im Rahmen des Schwerpunktprogramms SPP 2037 „Scalable Data Management for Future Hardware“ gefördert.
Ziel dieses Projekts ist es, neuartige Hardware und Optimierungstechniken für die skalierbare, leistungsfähige Verarbeitung von Big Data bereitzustellen. Wir zielen insbesondere auf große Datenmengen mit flexiblen Schemata (zeilenorientierte, spaltenorientierte, dokumentenorientierte, irreguläre und/oder nicht-indexierte Daten) sowie auf Datenströme, wie sie in der Klick-Strom-Analyse, in Unternehmensquellen wie E-Mails, Software-Logs und Diskussionsforum-Archiven sowie in Sensoren im Internet of Things (IoT) und Industrie 4.0 zu finden sind. In diesem Bereich untersucht das Projekt das Potenzial Hardware-konfigurierbarer, FPGA-basierter Systems-on-Chip (SoCs) für die Daten-nahe Verarbeitung, bei der Berechnungen direkt bei den Datenquellen stattfinden. Basierend auf FPGA-Technologie und insbesondere deren dynamischer Rekonfiguration schlagen wir eine generische Architektur mit dem Namen ReProVide für die kostengünstige Verarbeitung von Datenbankanfragen vor.
Die Konzepte sollen die Integration von FPGA-basierten Beschleunigern in verfügbare SQL-, NoSQL- und In-Memory-Datenbanksysteme sowie Stream-Processing-Frameworks ermöglichen. Unser Ziel ist es dabei, flüchtige und nichtflüchtige Daten direkt an ReProVide-Knotenpunkte anzuschließen, die nicht nur bereinigte und integrierte Datensätze enthalten, sondern auch zur temporären oder persistenten Speicherung ungereinigter Daten aus neuen Datenquellen und Datenströmen verwendet werden können.
Projekte
KR@KEN
Im Rahmen des DFG geförderten Projektes „ReProVide“ entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FPG, SoC) ausführt. KR@KEN ist dabei zuständig für die Verwaltung des Clusters, das Sammeln von Meta-Informationen und Statistiken, sowie die Einplanung und Ausführung der Anfragen. |
SKYSHARK
Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, dass sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FGPA, SoC) ausführt. Im Rahmen des Forschungsprojektes soll ein neuer Datenbank-Benchmark entwickelt werden. Dieser soll dabei helfen, die Stärken des im Projekt entwickelten Prototypens zeigen. Dabei wollen wir evaluieren, ob und wie man Echtzeit Flugdaten (ADS-B Transponder) und Flugpläne für die Entwicklung eines solchen Benchmarks verwenden kann. Der Fokus liegt dabei auf drei Kategorien von Datenbankanfragen:
Der Benchmark soll dabei nicht, wie z.B. die Benchmarks der TCP, zur reinen Leistungsevaluierung dienen, sondern einen Test unter realen Bedingungen und auf der Realität basierenden Anwendungsszenarien darstellen. Mehr Informationen zu unserem Benchmark gibt es auf skyshark.org.
|
HiWi Stellen
Aktuell gibt es keine offene Stellen.
Abschlussarbeiten und Projekte
Offen
Vergeben
Abgeschlossen
Master-Projekt – „SKYSHARK 2.0: Weiterentwicklung und Verbesserung von SKYSHARK“
SKYSHARK ist ein Benchmark für stromverarbeitende Systeme mit dem Fokus auf moderner Hardware (z.B. FPGA). Für den Benchmark verwendet SKYSHARK Echtzeit- Trackingdaten von Flugzeugen (ADS-B). Im Rahmen des Master-Projekts soll der Benchmark weiterentwickelt und mittels Referenzimplementierungen (z.B. Apache Flink) auf unseren Messrechnern getestet werden. Weiterhin soll das Tooling sowie das Benchmarking-Tool weiterentwickelt werden. Die Ergebnisse dieser Arbeit werden auf unserer Homepage (https://skyshark.org) sowie auf GitHub veröffentlicht und helfen Wissenschaftler:innen auf der ganzen Welt, ihre Systeme zu testen und zu benchmarken.
Bachelor-Praktikum – „Konzeptionierung und Entwicklung eines Demo-Dashboards zur Visualisierung von Echtzeit Flugdaten (ADS-B)“
Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, das sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FPGA, SoC) ausführt. Für die Demonstration unseres Prototyps nutzen wir einen selbstentwickelten Benchmark namens Skyshark. Auf Basis dieses Benchmarks soll ein Dashboard entwickelt werden, welches Flugzeugbewegungen und Flugpläne in Echtzeit anzeigen kann.
- Kentnisse in der Webentwicklung (Angular, NodeJS, REST) erforderlich
- Kenntnisse in Java, SpringBoot wünschenswert
- Grundlegende Kenntnisse in SQL wünschensert
Masterarbeit – „Konzeption und Entwicklung eines Query Repository zum Speichern und Verwlaten von relationalen und strombasierten Anfragen für das Forschungsprojekt ReProVide“
Im Rahmen des DFG geförderten Projektes “ReProVide” entwickeln wir ein System, das sowohl relationale als auch strombasierte Anfragen mittels eines Clusters aus sogenannten RPUs (FGPA, SoC) ausführt. Im Rahmen des Forschungsprojektes soll ein Query Repository entwickelt werden. Dieses Repository soll folgende Aufgaben erfüllen:
- Speichern und Verwalten von relationalen und strombasierten Anfragen
- Verwlaten der Danebankschemata und Acceleratoren
- Auswergun und Visualisierung von Performanve Metriken
Alle Funktionen müssen mittels einer Web-Applikation verwaltbar und visualisierbar sein.
Masterarbeit – SKYSHARK
Im Rahmen der Masterarbeit soll ein Prototyp entwickelt werden, der es ermöglicht Echtzeit Flugdaten mittels Diensten wie OpenSky Network (https://opensky-network.org ) zu sammeln und mit Informationen zu Flugplänen anzureichern. Weiterhin sollen Anfragen aus den oben genannten Kategorien konzeptioniert und an Hand der vorhandenen Daten getestet und evaluiert werden. Als letztes solle der so entwickelte Benchmark mit bestehenden Benchmarks, verglichen und Vor- und Nachteil herausgestellt werden.
Bachelorarbeit – KR@KEN
Im Rahmen der Bachelorarbeit soll eine solche prototypische Implementierung geplant und umgesetzt werden. Dabei sind folgende Punkte besonders wichtig:
- Implementierung der physischen Operatoren zur Ausführung der Teilgraphen
- Integration von möglichen Verzögerungen, die jederzeit angepasst werden können
- Modularer Aufbau des Prototypens für zukünftige Erweiterungen
Der entwickelte Prototyp muss mit dem bestehenden System kommunizieren können. Nötige Schnittstellen und Protokolle sind bereits vorhanden. Die Implementierung des Prototypens findet in Java statt. Ein wichtiger Teil der Arbeit ist neben der Ausarbeitung der Bachelorarbeit die Dokumentation des Codes.
Das Team
- Mert Baran
- Benedikt Döring
- David Schmidt
- Açelya Aksu
- Tim Vogler
- Stefan Meißner
Publikationen
2023
SKYSHARK: A Benchmark with Real-world Data for Line-rate Stream Processing with FPGAs
Lernen, Wissen, Daten, Analysen (LWDA) (Marburg, 9. Oktober 2023 - 11. Oktober 2023)
In: Leyer M, Wichmann J (Hrsg.): Lernen, Wissen, Daten, Analysen (LWDA) Conference Proceedings, Marburg, Germany, October 9-11, 2023 2023
Open Access: https://ceur-ws.org/Vol-3630/LWDA2023-paper9.pdf
URL: https://ceur-ws.org/Vol-3630/LWDA2023-paper9.pdf
BibTeX: Download
, , :
2021
Performance Evaluation of Policy-Based SQL Query Classification for Data-Privacy Compliance
In: Datenbank-Spektrum (2021)
ISSN: 1618-2162
DOI: 10.1007/s13222-021-00385-9
URL: https://link.springer.com/article/10.1007/s13222-021-00385-9
BibTeX: Download
, , , :
2020
Konzeption und prototypische Implementierung einer regelbasierten Anfrageklassifizierung zur Einhaltung des Datenschutzes (Masterarbeit, 2020)
BibTeX: Download
:
A Framework for DSL-Based Query Classification Using Relational and Graph-Based Data Models
3rd Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA) (Portland, OR, 14. Juni 2020 - 14. Juni 2020)
In: ACM (Hrsg.): GRADES-NDA'20: Proceedings of the 3rd Joint International Workshop on Graph Data Management Experiences & Systems (GRADES) and Network Data Analytics (NDA) 2020
DOI: 10.1145/3398682.3399167
URL: https://dl.acm.org/doi/abs/10.1145/3398682.3399167
BibTeX: Download
, , :
We Know What You Did Last Session: Policy-Based Query Classification for Data-Privacy Compliance With the DataEconomist
SSDBM 2020: 32nd International Conference on Scientific and Statistical Database Management (Vienna, Virtual Conference, 7. Juli 2020 - 9. Juli 2020)
DOI: 10.1145/3400903.3401692
BibTeX: Download
, , :
2019
Query-Driven Enforcement of Rule-Based Policies for Data-Privacy Compliance
LWDA 2019 Lernen, Wissen, Daten, Analysen (Berlin, Germany, 30. September 2019 - 2. Oktober 2019)
In: Proc. Conf. "Lernen, Wissen, Daten, Analysen" 2019
Open Access: http://ceur-ws.org/Vol-2454/paper_56.pdf
URL: http://ceur-ws.org/Vol-2454/paper_56.pdf
BibTeX: Download
, , , , , :