Information Visualization Techniques for Metabolic Engineering

The main purpose of metabolic engineering is the modification of biological systems towards specific goals using genetic manipulations. For this purpose, models are built that describe the stationary and dynamic behaviour of biochemical reaction networks inside a biological cell. Based on these mode...

Ausführliche Beschreibung

Gespeichert in:
1. Verfasser: Qeli, Ermir
Beteiligte: Freisleben, Bernd (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2007
Mathematik und Informatik
Schlagworte:
XML
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Inhaltsangabe:
  • Metabolic Engineering beabsichtigt die zielgerichtete Modifikation biologischer Systeme mittels genetischer Manipulationen. In diesem Kontext werden Modelle gebaut, die sowohl das stationäre, als auch das dynamische Verhalten der biochemischen Reaktionen innerhalb einer biologischen Zelle beschreiben. Auf dieser Basis werden Simulationen durchgeführt, mit dem Ziel, das Verhalten einer Zelle zu verstehen. Der Modellierungsprozess ist mit der Erzeugung großer Datenmengen, sowohl während der Modellierung, als auch nach der Simulation der erstellten Modelle, verknüpft. Da eine manuelle Auswertung nahezu unmöglich ist, werden Techniken zur Analyse und Visualisierung solcher Daten benötigt. Die vorliegende Dissertation behandelt geeignete Ansätze der Visualisierung und des Data Minings zur Unterstützung des metabolischen Modellierungsprozesses. Die Arbeit liefert Beiträge zu folgenden Problemstellungen: -Visualisierung metabolischer Netzwerke sowie der zugehörigen Simulationsdaten. Neuartige Visualisierungstechniken, die die visuelle Exploration des Simulationsverlaufs metabolischer Netzwerke jenseits von statischen Schnappschüssen erlauben, werden vorgestellt. Knoten-Kanten Darstellungen von metabolischen Netzwerken werden durch Benutzung der jeweiligen Zeitreihen der Metabolitenkonzentrationen und Reaktionsraten animiert. Engpässe und aktive Teile eines Netzwerks werden leichter identifizierbar. 3D Visualisierungsmethoden, die das Zeichnen von Netzwerken ohne Überschneidungen von Kanten ermöglichen, werden untersucht. Das Konzept des gesteuerten Zeichnens metabolischer Netzwerke wird eingeführt. Im Gegensatz zu anderen Ansätzen wird ein vom Benutzer steuerbarer Ansatz zum Zeichnen metabolischer Netzwerke laut biochemischer Anforderungen mittels Einbindung von Benutzerrückmeldungen vorgestellt. -Vergleich von XML/SBML Dateien. SBML (Systems Biology Markup Language), ein XML-Format zur Speicherung und zum Austausch von biochemischen Modellen, ist allgegenwärtig in der metabolischen Modellierung geworden. Die metabolische Modellierung funktioniert üblicherweise als ein iterativer Prozess, bei dem neue Modelle aus vorhergehenden Modellen abgeleitet werden. Somit entstehen Familien von Modellen, die im SBML-Format gespeichert werden. Die abgespeicherten Daten enthalten eine große Menge an Informationen, von der Struktur eines Netzwerkes bis zu den Parametern eines Modells oder entsprechenden Messdaten. Zur Reduktion der Datenmenge wird der CustX-Diff Algorithmus zum gesteuerten Vergleich von XML-Dokumenten eingeführt. Durch Spezifikation von XPath-Ausdrücken wird ein anpassbarer Differenzprozess ermöglicht, der eine Fokussierung des Vergleichs auf bestimmte Teile von XML/SBML-Dokumenten erlaubt. -Visuelle Exploration von zeitabhängigen Sensitivitätsmatrizen. Sensitivitätsanalyse wird desöfteren in der Modellierung genutzt, um die Sensitivität eines Modells in Bezug auf seine Parameter zu untersuchen. Die Ergebnisse der Sensitivitätsanalyse eines metabolischen Modells sind große zeitabhängige Matrizen, die analysiert bzw. visualisiert werden sollen. Die Visualisierung hochdimensionaler Datensätze ist ein anspruchsvolles Problem. Daher wird ein erweiterbares System, bestehend aus vorhandenen und neuartigen Visualisierungstechniken zur visuellen Exploration von zeitabhängigen Sensitivitätsmatrizen, vorgestellt. Tabellarische Visualisierungsansäatze wie die sogenannte "Reorderable Matrix" werden weiterentwickelt, und Algorithmen für deren Sortierung werden diskutiert. Techniken zur Visualisierung von Proximitätsdaten, sowohl in Matrizenform, als auch projeziert anhand der Methode der Multidimensionalen Skalierung (MDS) werden erforscht. Informationsvisualisierungsparadigmen wie die focus+context basierte Verzerrung, sowie overview+details Methoden werden eingesetzt, um die vorgeschlagenen Visualisierungstechniken zu verbessern. -Cluster Ensembles zur Analyse von zeitabhängigen Sensitivitätsmatrizen. Neuartige verwandtschaft-basierte Cluster-Ensembles, die sich auf die Akkumulation der enstehenden paarweisen Ähnlichkeiten zwischen Objekten stützen, werden zur Clusterung von zeitabhängigen hochdimensionalen Datensätzen vorgeschlagen. Die zeitabhängigen Ähnlichkeiten, die aus den unscharfen Partitionen des Fuzzy-Clustering Prozesses enstehen, werden aggregiert, und die daraus resultierende Proximitätsmatrix wird zur Erzeugung des endgültigen Clusterergebnisses verwendet.