Optimierung kontinuierlicher Anfragen auf Basis statistischer Metadaten

Die kontinuierliche Verarbeitung aktiv bereitgestellter Daten, wie beispielsweise Sensordaten oder Börsenkurse, wird in vielen Branchen mehr und mehr zu einer Notwendigkeit. Da Anfragen über solchen Daten im Allgemeinen eine sehr lange Lebensdauer besitzen und somit ihre Ressourcen entsprechen lange...

Ausführliche Beschreibung

Gespeichert in:
1. Verfasser: Riemenschneider, Tobias
Beteiligte: Seeger, Bernhard (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Deutsch
Veröffentlicht: Philipps-Universität Marburg 2008
Datenbanksysteme
Schlagworte:
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Zusammenfassung:Die kontinuierliche Verarbeitung aktiv bereitgestellter Daten, wie beispielsweise Sensordaten oder Börsenkurse, wird in vielen Branchen mehr und mehr zu einer Notwendigkeit. Da Anfragen über solchen Daten im Allgemeinen eine sehr lange Lebensdauer besitzen und somit ihre Ressourcen entsprechen lange binden, stellt die Optimierung so genannter kontinuierlicher Anfragen eine zentrale Voraussetzung für deren effiziente Verarbeitung dar. Daher widmet sich die vorliegende Arbeit genau diesem Themenbereich. Die Aufgabe der Anfrageoptimierung besteht darin, die Berechnung des Ergebnisses einer mehr oder weniger abstrakt definierten Anfrage möglichst effizient zu planen. Der so genannte Anfrageplan, welcher das Ergebnis einer Anfrageoptimierung darstellt, gibt also genau vor, auf welche Weise eintreffende Daten zu verarbeiten und in welcher Reihenfolge die Daten mehrerer Datenquellen zu kombinieren sind. Um diesen optimalen Anfrageplan bereitstellen zu können, erzeugt die Anfrageoptimierung eine große Menge verschiedener Anfragepläne, welche alle dasselbe Ergebnis berechnen. Im Anschluss daran schätzt sie für jeden der erzeugten Anfragepläne ab, welche Kosten dieser bei der Berechnung seines Ergebnisses verursacht, und leitet den günstigsten als Ergebnis der Anfrageoptimierung weiter. Jedoch erweist sich die exakte Abschätzung der Kosten eines Anfrageplans im Kontext kontinuierlicher Anfragen als problematisch, was zur Folge hat, dass eine Bewertungsgrundlage für die Wahl des optimalen Anfrageplans fehlt. Um eine solche Bewertungsgrundlage liefern zu können, wird im Rahmen der vorliegenden Arbeit eine Simulation der Anfragepläne vorgeschlagen. Diese simulierte Anfrageausführung basiert auf künstlichen Datenquellen, deren Daten durch den zu bewertenden Anfrageplan verarbeitet werden. Auf diese Weise können dessen Kosten einfach durch Messung bestimmt und zur Bewertung herangezogen werden. Ein weiteres Problem kontinuierlicher Anfragen ergibt sich aus dem unvorhersehbaren Verhalten der verarbeiteten Daten. Dies hat oftmals zur Folge, dass ein durch die Anfrageoptimierung bestimmter Anfrageplan nach einiger Zeit sehr viel höhere Kosten verursacht, als zunächst angenommen. Dies kann beispielsweise passieren, wenn die zugrunde liegenden Datenquellen plötzlich ihre Daten in größeren Mengen und in sehr viel schneller Folge liefern. In diesem Fall muss die Anfrageoptimierung überprüfen, ob die Kosten der Anfrageverarbeitung mithilfe eines anderen Anfrageplans gesenkt werden können. Um den Aufwand, der mit dieser regelmäßig wiederkehrenden, so genannten Reoptimierung verbunden ist, in Grenzen zu halten, wird in der vorliegenden Arbeit ein Verfahren vorgestellt, welches die Optimierungen einer kontinuierlichen Anfrage archiviert. Im Falle einer anstehenden Reoptimierung ermöglicht dieses Verfahren eine vorhergehende Überprüfung, ob eine explizite Reoptimierung durch die Wiederverwendung eines archivierten Anfrageplans verhindert werden kann.