Supporting Quality of Service in Scientific Workflows

While workflow management systems have been utilized in enterprises to support businesses for almost two decades, the use of workflows in scientific environments was fairly uncommon until recently. Nowadays, scientists use workflow systems to conduct scientific experiments, simulations, and distr...

Full description

Saved in:
Bibliographic Details
Main Author: Dörnemann, Tim
Contributors: Freisleben, Bernd (Prof. Dr.) (Thesis advisor)
Format: Dissertation
Language:English
Published: Philipps-Universität Marburg 2012
Mathematik und Informatik
Subjects:
Online Access:PDF Full Text
Tags: Add Tag
No Tags, Be the first to tag this record!
Table of Contents: Während Unternehmen bereits seit zwei Jahrzehnten auf Workflow-Systeme zur Modellierung und Ausführung von komplexen, IT-gestützten Arbeitsabläufen (Geschäftsprozesse) zurückgreifen, kommen derartige Technologien im wissenschaftlichen Umfeld erst seit wenigen Jahren verbreitet zum Einsatz. Seitdem wurde von Wissenschaftlern eine Reihe von Workflow-Systemen entwickelt, mit deren Hilfe komplexe Experimente modelliert und ausgeführt werden können. Dabei handelt es sich meist um rechenintensive, auf verteilten Rechnersystemen berechnete, Simulationen. Die bisher entwickelten wissenschaftlichen Workflow-Systeme sind in der Regel stark auf die Besonderheiten der Anwendungsfälle der jeweiligen Wissenschaftsdomäne ausgerichtet und können daher in anderen Anwendungsgebieten schlecht oder gar nicht eingesetzt werden. Ausserdem wurden die Workflow-Systeme oft sehr eng an bestimmte Technologien (z.B. eine Grid-Middleware) gekoppelt und sind daher ebenfalls in ihrer Wiederverwendbarkeit eingeschränkt. In dieser Doktorarbeit wird daher vorgeschlagen, den Industriestandard BPEL, eine Workflow-Sprache zur Modellierung von Geschäftsprozessen, zur Modellierung und Ausführung von wissenschaftlichen Workflows zu verwenden. Durch die grosse Verbreitung von BPEL im kommerziellen Umfeld existiert eine Reihe von stabilen und ausgereiften Software-Produkten, die auch im wissenschaftlichen Umfeld eingesetzt werden könnten. Weiterhin ist die Sprache sehr ausdrucksstark (Turing-vollständig) und nicht auf bestimmte Anwendungsbereiche eingeschränkt. Der Standard wird zunächst auf seine Anwendbarkeit zur Modellierung von wissenschaftlichen Workflows hin untersucht. Während BPEL sehr gut zur Modellierung geeignet ist, fehlen existierenden Implementierungen des Standards wichtige Fähigkeiten, die zur Ausführung von wissenschaftlichen Workflows notwendig sind. Diese Arbeit präsentiert daher Komponenten, die eine existierende Implementierung des BPEL-Standards erweitern und die identifizierten Schwachstellen beseitigen. Sie stellen somit die technische Grundlage zur Verwendung von BPEL im wissenschaftlichen Umfeld dar. Der besondere Fokus liegt dabei auf sog. nichtfunktionalen Anforderungen bezüglich der Dienstgüte (Quality of Service). Darunter sind insbesondere Anforderungen wie Skalierbarkeit, Zuverlässigkeit (Fehlertoleranz), Datensicherheit und Kosten (der Ausführung eines Workflows) zu verstehen. Aus technischer Sicht muss das Workflow-System gängige Middleware-Systeme unterstützen, um den Zugriff auf verschiedenartige, verteilte Ressourcen (insbesondere Grid und Cloud-Ressourcen) zu ermöglichen. Die entwickelten Hauptkomponenten decken genau diese Anforderungen ab: Cloud Resource Provisioner Skalierbarkeit wird durch die automatisierte Hinzunahme von weiteren (Cloud) Ressourcen erreicht, wenn das Workflow-System stark ausgelastet ist. Fault Tolerance Module Hohe Zuverlässigkeit wird durch kontinuierliche Überwachung der Workflow-Ausführung und korrigierender Eingriffe, wie erneute Ausführung eines fehlgeschlagenenWorkflow-Schritts oder Austausch der fehlerhaften Ressource, erreicht. Cost And Data Flow Aware Scheduler Viele Workflow-Systeme berücksichtigung bei der Auswahl von Ressourcen zur Ausührung der einzelnen Workflow- Schritte nur die Leistungsfähigkeit und Auslastung in Frage kommender Ressourcen. Das hier präsentierte System geht darüber hinaus: Der Workflow- Nutzer kann durch Angabe von Präferenzwerten entscheiden, welchen Einfluss Kosten und zu erwartende Workflow-Ausführungsdauer auf die Auswahl von Ressourcen haben soll. Der entwickelte multikriterielle Scheduling-Algorithmus beachtet die definierte Gewichtung und trifft durch den Einsatz eines heuristischen Verfahrens schnelle und gute Auswahlentscheidungen. Security Extensions Durch die Unterstützung verschiedener Verschlüsselungs-, Signatur- und Authentisierungsmechanismen (insbesondere Grid Security Infrastructure) wird Datensicherheit bei der Übertragung von Workflow-Daten garantiert. Weiterhin identifiziert diese Arbeit die Notwendigkeit, Workflow-Entwicklern intuitiv bedienbare Werkzeuge zur Workflow-Modellierung zur Verfügung zu stellen. Es werden zwei Modellierungswerkzeuge präsentiert, die Anwender mit unterschiedlichen Bedürfnissen unterstützen. DAVO (Domain-adaptable, Visual BPEL Orchestrator) arbeitet auf einem niedrigen Abstraktionsniveau und erlaubt es Anwendern mit Kenntnissen in BPEL, den vollen Umfang der Sprache zu nutzen. DAVO ist eine Software mit umfangreichen Erweiterungs- und Anpassungsmöglichkeiten. Diese Fähigkeiten werden bei der Umsetzung des zweiten Werkzeugs, SimpleBPEL Composer, genutzt. SimpleBPEL richtet sich an Anwender mit geringen Informatik- Kenntnissen und ermöglicht die schnelle und intuitive Entwicklung von BPELWorkflows auf Basis vordefinierter Bausteine.