Virtual Machine Image Management for Elastic Resource Usage in Grid Computing

Grid Computing has evolved from an academic concept to a powerful paradigm in the area of high performance computing (HPC). Over the last few years, powerful Grid computing solutions were developed that allow the execution of computational tasks on distributed computing resources. Grid computing has...

Full description

Saved in:
Bibliographic Details
Main Author: Fallenbeck, Niels
Contributors: Freisleben, Bernd (Prof. Dr.) (Thesis advisor)
Format: Dissertation
Language:English
Published: Philipps-Universität Marburg 2011
Mathematik und Informatik
Subjects:
VM
Online Access:PDF Full Text
Tags: Add Tag
No Tags, Be the first to tag this record!
Table of Contents: Grid Computing hat sich von einem im wissenschaftlichen Umfeld initiierten Konzept zu einem mächtigen Paradigma im Bereich des Höchstleistungsrechnens entwickelt. Während der letzten Jahre wurden Grid-Systeme entwickelt, welche die automatische Verteilung und Ausführung von Berechnungen auf (geografisch) verteilten Ressourcen ermöglichen. Diese Grid-Systeme haben in den letzten Jahren die Aufmerksamkeit immer mehr kommerzieller Anwender erregt. Um diesen Anwendern die Verarbeitung vertraulicher Daten in Grid-Systemen zu ermöglichen, müssen starke Sicherheitsmechanismen entwickelt werden, um diese Daten vor dem Zugriff unberechtigter Dritter zu schützen. Im Gegensatz zu Grid Computing wurde das Konzept des Cloud Computing, welches im Jahr 2006 öffentlich vorgestellt wurde, von industriellen Anbietern entwickelt: Datensicherheit war von Anfang an ein wichtiger Aspekt. Um dies zu gewährleisten, wird Virtualisierungstechnologie eingesetzt, die eine sichere Trennung der Anwender ermöglicht, indem jeder Anwender eine eigene virtuelle Maschine zugeteilt bekommt, die verhindert, dass der Benutzer nur auf die in seiner virtuellen Maschine vorhandenen Daten zugreifen kann. Um die Sicherheit in Grid-Systemen zu erhöhen, wurde daher früh die Verwendung von Virtualisierungstechnologie auch in diesem Umfeld untersucht. Dabei stellte sich heraus, dass dieser Ansatz vielversprechend ist, um die Sicherheitsanforderungen kommerzieller Anwender in Grid-Systemen zu erfüllen. Ein Hauptteil der in dieser Dissertation vorgestellten Arbeit stellt die Image Creation Station (ICS) dar, eine Komponente, die es Anwendern erlaubt, ihre virtuellen Maschinen selbst zu erstellen und zu administrieren, und die für die automatische Verteilung dieser virtuellen Maschinen auf alle Ressourcen eines verteilten Systems verantwortlich ist. Im Gegensatz zu Cloud Computing, das auch unerfahrenen Benutzern das Ausführen ihrer Programme in der Cloud einfach ermöglicht, sind Grid-Systeme auf Grund ihrer Komplexität deutlich schwieriger zu verwenden. Die ICS vereinfacht die Benutzung eines Grid-Systems, indem sie traditionelle Einschränkungen beseitigt. Dazu zählt vor allem die Installation eigener Software auf den Rechenknoten, die für die Ausführung der Berechnungen der Anwender verwendet werden. Dies war früher nur durch den Administrator der physikalischen Ressourcen möglich und musste für jede im verteilten System vorhandene Ressource wiederholt werden. Durch die ICS ist es Anwendern möglich, sogar kommerzielle Software in Grid-Systemen zu verwenden, ohne dass andere Anwender des Systems Zugriff auf die Software haben. Weiterhin findet eine Verschiebung der Administrationstätigkeit vom Administrator der physikalischen Ressourcen hin zu den Anwendern oder erfahrenen Kollegen statt und ermöglicht die Bereitstellung individuell angepasster virtueller Maschinen für jeden Anwendungszweck. Die ICS ist nicht nur für die Bereitstellung der Administrationswerkzeuge verantwortlich, sondern sorgt auch dafür, dass die verschiedenen virtuellen Maschinen auf allen dem verteilten System angeschlossenen physikalischen Ressourcen verwendet werden können. Ein zweiter Aspekt der vorgestellten Lösung zielt auf die Elastizität des Systems, indem abhängig von der aktuellen Auslastung des Systems automatisch Ressourcen angefordert werden. Im Gegensatz zu bestehenden Systemen erlaubt die vorgestellte Lösung das Hinzufügen und Entfernen von Ressourcen, ohne die Ausführung von Berechnungen zu unterbrechen. Weiterhin können mit den präsentierten Komponenten nicht nur Grid-Ressourcen zur Durchführung von Berechnungen genutzt werden, sondern auch Cloud-Ressourcen dynamisch angefordert und verwendet werden, falls die vorhandenen Ressourcen nicht ausreichen, den Bedarf an Rechenkapazität zu decken. Durch das sofortige Herunterfahren nicht mehr benötigter Cloud-Ressourcen werden die Kosten für die Durchführung einer einzelnen Berechnung minimiert. Zusätzlich hat ein Anwender des präsentierten Systems die Möglichkeit, die Entscheidung zu beeinflussen, auf welchen Ressourcen seine Berechnungen durchgeführt werden. Dies ist entscheidend, wenn Daten verarbeitet werden müssen, die auf Grund gesetzlicher Bestimmungen oder sicherheitsrelevanter Bedenken die Firma oder das Land nicht verlassen dürfen. Um in heutigen Systemen ein vergleichbares Verhalten zu erreichen, ist der Anwender gezwungen, seine Berechnungen direkt an die entsprechenden Ressourcen zu senden und damit die Möglichkeit der automatischen Verteilung und optimalen Ressourcennutzung aufzugeben. Die in dieser Dissertation vorgestellten Komponenten ermöglichen den Aufbau eines System, das sich automatisch an die aktuelle Auslastung anpasst, indem es Grid und Cloud-Ressourcen zusammen mit lokal vorhandenen Ressourcen für die Durchführung von Berechnungen nutzen kann und jedem Anwender individuell angepasste virtuelle Ausführungsumgebungen zur Verfügung stellt.