Datenstromsysteme
Datenströme entstehen immer häufiger (z.B. in Sensornetzen) und es müssen relevante Ereignisse aus ihnen extrahiert werden. Mit Datenstromsystemen (DSS) versucht man, die bekannten Vorzüge von Datenbanksystemen - wie beispielsweise die Möglichkeit, deskriptive Anfragen formulieren zu können - auf den Umgang mit Datenströmen zu übertragen.
Projekte:
Die Beobachtung von Tieren kann durch moderne Technik enorm verbessert werden. Gerade bei Fledermäusen war das in der Vergangenheit sehr schwierig, denn sie sind nachtaktiv und auch relativ klein. Was man ihnen als Sender zumuten darf, muss weniger als 10% ihres Körpergewichts ausmachen. Die Entwicklung der Mikroelektronik erlaubt es inzwischen, komplette Computer zu bauen, die diese Bedingung erfüllen. Die senden nicht mehr nur einen Signalton, sondern Daten. Die Bodenstation nimmt diese Daten auf und wertet sie aus. Das beginnt mit der aktuellen Position der Fledermaus, geht weiter über die Begegnung mit anderen Fledermäusen (besonders interessant: Mutter und Kind) und endet bei Körpertemperatur, Pulsschlag und anderen Biosensoren. Die Daten werden gesammelt und im Verbund ausgewertet. Leider sind sie relativ ungenau und auch mit vielen Störungen behaftet, so dass es eine erhebliche Aufgabe bedeutet, sie zunächst zu bereinigen. Das Fernziel des Projekts ist die gezielte Erhebung der Daten in Bezug auf die gewünschten Auswertungen, um so Energie zu sparen und die Fledermäuse noch länger beobachten zu können.
DSAM ist eine Middleware zur Verwaltung von globalen und auf heterogene Plattformen verteilten Datenstromanfragen. Diese Plattformen umfassen sowohl Datenstrommanagementsysteme (DSMS) als auch Sensornetzwerke. Das Ziel ist wie beim MDA-Ansatz, ein plattformunabhängiges Modell, das hier in Form von globalen Anfragen vorliegt, automatisch auf eine heterogene und verteilte Landschaft von stromverarbeitenden Komponenten abzubilden. Die in einer abstrakten Anfragesprache definierten Anfragen werden unter Berücksichtigung von Kostenschätzern und topologischen Einschränkungen partitioniert. Die dadurch entstehenden Teilanfragen werden in die Anfragesprachen der Zielsysteme übersetzt. Bei Sensornetzwerken verfolgen wir dabei den Ansatz der Codegenerierung. Weitere Herausforderungen sind das Monitoring des gesamten Systems sowie insbesondere im Bereich der Sensornetzwerke die effiziente Verwaltung von Metadaten und die Dezentralisierung der Anfrageverwaltung.
To test and evaluate a heterogeneous stream-processing system consisting of an FPGA-based systemon-chip and a host, we develop a benchmark called SKYSHARK. It uses real-world data from air-traffic control that is publicly available. These data are enhanced for the purpose of the benchmark without changing their characteristics. They are further enriched with aircraft and airport data. We define 14 queries with respect to the particular requirements of our system. They should be useful for other…
Kontaktpersonen:
- Klaus Meyer-Wegener
Beteiligte Wissenschaftler:
- Klaus Meyer-Wegener
- Thomas Niko Pollner
- Sebastian Herbst
- Michael Daum
- Frank Lauterwald
- Maximilian Langohr