Information Visualization Techniques for Metabolic Engineering

The main purpose of metabolic engineering is the modification of biological systems towards specific goals using genetic manipulations. For this purpose, models are built that describe the stationary and dynamic behaviour of biochemical reaction networks inside a biological cell. Based on these mode...

Ausführliche Beschreibung

Gespeichert in:
1. Verfasser: Qeli, Ermir
Beteiligte: Freisleben, Bernd (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2007
Mathematik und Informatik
Schlagworte:
XML
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
building Fachbereich Mathematik und Informatik
topic Metabolische Netzwerke
Clustering
Visualisierung
Explorative Datenanalyse
Metabolic Engineering
Graphenzeichnen
Bioinformatik
(Information)Visualization
Metabolic Networks
XML Verlgleichsalgorithmen
Metabolic Engineering
XML
XML Comparison
(Informations)Visualisierung
Cluster <Datenanalyse>
Clustering
Informatik
Datenanalyse
spellingShingle Metabolische Netzwerke
Clustering
Visualisierung
Explorative Datenanalyse
Metabolic Engineering
Graphenzeichnen
Bioinformatik
(Information)Visualization
Metabolic Networks
XML Verlgleichsalgorithmen
Metabolic Engineering
XML
XML Comparison
(Informations)Visualisierung
Cluster <Datenanalyse>
Clustering
Informatik
Datenanalyse
Information Visualization Techniques for Metabolic Engineering
Qeli, Ermir
Metabolic Engineering beabsichtigt die zielgerichtete Modifikation biologischer Systeme mittels genetischer Manipulationen. In diesem Kontext werden Modelle gebaut, die sowohl das stationäre, als auch das dynamische Verhalten der biochemischen Reaktionen innerhalb einer biologischen Zelle beschreiben. Auf dieser Basis werden Simulationen durchgeführt, mit dem Ziel, das Verhalten einer Zelle zu verstehen. Der Modellierungsprozess ist mit der Erzeugung großer Datenmengen, sowohl während der Modellierung, als auch nach der Simulation der erstellten Modelle, verknüpft. Da eine manuelle Auswertung nahezu unmöglich ist, werden Techniken zur Analyse und Visualisierung solcher Daten benötigt. Die vorliegende Dissertation behandelt geeignete Ansätze der Visualisierung und des Data Minings zur Unterstützung des metabolischen Modellierungsprozesses. Die Arbeit liefert Beiträge zu folgenden Problemstellungen: -Visualisierung metabolischer Netzwerke sowie der zugehörigen Simulationsdaten. Neuartige Visualisierungstechniken, die die visuelle Exploration des Simulationsverlaufs metabolischer Netzwerke jenseits von statischen Schnappschüssen erlauben, werden vorgestellt. Knoten-Kanten Darstellungen von metabolischen Netzwerken werden durch Benutzung der jeweiligen Zeitreihen der Metabolitenkonzentrationen und Reaktionsraten animiert. Engpässe und aktive Teile eines Netzwerks werden leichter identifizierbar. 3D Visualisierungsmethoden, die das Zeichnen von Netzwerken ohne Überschneidungen von Kanten ermöglichen, werden untersucht. Das Konzept des gesteuerten Zeichnens metabolischer Netzwerke wird eingeführt. Im Gegensatz zu anderen Ansätzen wird ein vom Benutzer steuerbarer Ansatz zum Zeichnen metabolischer Netzwerke laut biochemischer Anforderungen mittels Einbindung von Benutzerrückmeldungen vorgestellt. -Vergleich von XML/SBML Dateien. SBML (Systems Biology Markup Language), ein XML-Format zur Speicherung und zum Austausch von biochemischen Modellen, ist allgegenwärtig in der metabolischen Modellierung geworden. Die metabolische Modellierung funktioniert üblicherweise als ein iterativer Prozess, bei dem neue Modelle aus vorhergehenden Modellen abgeleitet werden. Somit entstehen Familien von Modellen, die im SBML-Format gespeichert werden. Die abgespeicherten Daten enthalten eine große Menge an Informationen, von der Struktur eines Netzwerkes bis zu den Parametern eines Modells oder entsprechenden Messdaten. Zur Reduktion der Datenmenge wird der CustX-Diff Algorithmus zum gesteuerten Vergleich von XML-Dokumenten eingeführt. Durch Spezifikation von XPath-Ausdrücken wird ein anpassbarer Differenzprozess ermöglicht, der eine Fokussierung des Vergleichs auf bestimmte Teile von XML/SBML-Dokumenten erlaubt. -Visuelle Exploration von zeitabhängigen Sensitivitätsmatrizen. Sensitivitätsanalyse wird desöfteren in der Modellierung genutzt, um die Sensitivität eines Modells in Bezug auf seine Parameter zu untersuchen. Die Ergebnisse der Sensitivitätsanalyse eines metabolischen Modells sind große zeitabhängige Matrizen, die analysiert bzw. visualisiert werden sollen. Die Visualisierung hochdimensionaler Datensätze ist ein anspruchsvolles Problem. Daher wird ein erweiterbares System, bestehend aus vorhandenen und neuartigen Visualisierungstechniken zur visuellen Exploration von zeitabhängigen Sensitivitätsmatrizen, vorgestellt. Tabellarische Visualisierungsansäatze wie die sogenannte "Reorderable Matrix" werden weiterentwickelt, und Algorithmen für deren Sortierung werden diskutiert. Techniken zur Visualisierung von Proximitätsdaten, sowohl in Matrizenform, als auch projeziert anhand der Methode der Multidimensionalen Skalierung (MDS) werden erforscht. Informationsvisualisierungsparadigmen wie die focus+context basierte Verzerrung, sowie overview+details Methoden werden eingesetzt, um die vorgeschlagenen Visualisierungstechniken zu verbessern. -Cluster Ensembles zur Analyse von zeitabhängigen Sensitivitätsmatrizen. Neuartige verwandtschaft-basierte Cluster-Ensembles, die sich auf die Akkumulation der enstehenden paarweisen Ähnlichkeiten zwischen Objekten stützen, werden zur Clusterung von zeitabhängigen hochdimensionalen Datensätzen vorgeschlagen. Die zeitabhängigen Ähnlichkeiten, die aus den unscharfen Partitionen des Fuzzy-Clustering Prozesses enstehen, werden aggregiert, und die daraus resultierende Proximitätsmatrix wird zur Erzeugung des endgültigen Clusterergebnisses verwendet.
format Dissertation
oai_set_str_mv doc-type:doctoralThesis
open_access
ddc:004
xMetaDissPlus
first_indexed 2007-04-12T00:00:00Z
author2 Freisleben, Bernd (Prof. Dr.)
author2_role ths
language English
title Information Visualization Techniques for Metabolic Engineering
title_short Information Visualization Techniques for Metabolic Engineering
title_full Information Visualization Techniques for Metabolic Engineering
title_fullStr Information Visualization Techniques for Metabolic Engineering
title_full_unstemmed Information Visualization Techniques for Metabolic Engineering
title_sort Information Visualization Techniques for Metabolic Engineering
description The main purpose of metabolic engineering is the modification of biological systems towards specific goals using genetic manipulations. For this purpose, models are built that describe the stationary and dynamic behaviour of biochemical reaction networks inside a biological cell. Based on these models, simulations are carried out with the intention to understand the cell's behaviour. The modeling process leads to the generation of large amounts of data, both during the modeling itself and after the simulation of the created models. The manual interpretation is almost impossible; consequently, appropriate techniques for supporting the analysis and visualization of these data are needed. The purpose of this thesis is to investigate visualization and data mining techniques to support the metabolic modeling process. The work presented in this thesis is divided into several tracks: -Visualization of metabolic networks and the associated simulation data. Novel visualization techniques will be presented, which allow the visual exploration of metabolic network dynamics, beyond static snapshots of the simulated data plots. Node-link representations of the metabolic network are animated using the time series of metabolite concentrations and reaction rates. In this way, bottlenecks and active parts of metabolic networks can be distinguished. Additionally, 3D visualization techniques for metabolic networks are explored for cross-free drawing of the networks in 3D visualization space. Steerable drawing of metabolic networks is also investigated. In contrast to other approaches for drawing metabolic networks, user guided drawing of the networks allows the creation of high quality drawings by including user feedback in the drawing process. -Comparison of XML/SBML files. SBML (Systems Biology Markup Language) has become ubiquitous in metabolic modeling, serving the storage and exchange of models in XML format. Generally, the modeling process is an iterative task where the next generation model is a further development of the current model, resulting in a family of models stored in SBML format. The SBML format, however, includes a great deal of information, from the structure of the biochemical network to parameters of the model or measured data. Consequently, the CustX-Diff algorithm for a customizable comparison of XML files will be introduced. By customizing the comparison process through the specification of XPath expressions, an adaptable change detection process is enabled. Thus, the comparison process can be focused on specific parts of a XML/SBML document, e.g. on the structure of a metabolic network. -Visual exploration of time-varying sensitivity matrices. Sensitivity analysis is a special method used in simulation to analyze the sensitivity of a model with respect to its parameters. The results of sensitivity analysis of a metabolic network are large time-varying matrices, which need to be properly visualized. However, the visualization of time-varying high-dimensional data is a challenging problem. For this purpose, an extensible framework is proposed, consisting of existing and novel visualization methods, which allow the visual exploration of time-varying sensitivity matrices. Tabular visualization techniques, such as the reorderable matrix, are developed further, and algorithms for their reordering are discussed. Existing and novel techniques for exploring proximity data, both in matrix form and projected using multi-dimensional scaling (MDS), are also discussed. Information visualization paradigms such as focus+context based distortion and overview+details are proposed to enhance such techniques. -Cluster ensembles for analyzing time-varying sensitivity matrices. A novel relationship-based cluster ensemble, which relies on the accumulation of the evolving pairwise similarities of objects (i.e. parameters) will be proposed, as a robust and efficient method for clustering time-varying high-dimensional data. The time-dependent similarities, obtained from the fuzzy partitions created during the fuzzy clustering process, are aggregated, and the final clustering result is derived from this aggregation.
publisher Philipps-Universität Marburg
title_alt Informationsvisualisierungstechniken für das Metabolic Engineering
last_indexed 2011-08-10T23:59:59Z
publishDate 2007
era_facet 2007
url http://archiv.ub.uni-marburg.de/diss/z2007/0108/pdf/deq.pdf
author Qeli, Ermir
contents Metabolic Engineering beabsichtigt die zielgerichtete Modifikation biologischer Systeme mittels genetischer Manipulationen. In diesem Kontext werden Modelle gebaut, die sowohl das stationäre, als auch das dynamische Verhalten der biochemischen Reaktionen innerhalb einer biologischen Zelle beschreiben. Auf dieser Basis werden Simulationen durchgeführt, mit dem Ziel, das Verhalten einer Zelle zu verstehen. Der Modellierungsprozess ist mit der Erzeugung großer Datenmengen, sowohl während der Modellierung, als auch nach der Simulation der erstellten Modelle, verknüpft. Da eine manuelle Auswertung nahezu unmöglich ist, werden Techniken zur Analyse und Visualisierung solcher Daten benötigt. Die vorliegende Dissertation behandelt geeignete Ansätze der Visualisierung und des Data Minings zur Unterstützung des metabolischen Modellierungsprozesses. Die Arbeit liefert Beiträge zu folgenden Problemstellungen: -Visualisierung metabolischer Netzwerke sowie der zugehörigen Simulationsdaten. Neuartige Visualisierungstechniken, die die visuelle Exploration des Simulationsverlaufs metabolischer Netzwerke jenseits von statischen Schnappschüssen erlauben, werden vorgestellt. Knoten-Kanten Darstellungen von metabolischen Netzwerken werden durch Benutzung der jeweiligen Zeitreihen der Metabolitenkonzentrationen und Reaktionsraten animiert. Engpässe und aktive Teile eines Netzwerks werden leichter identifizierbar. 3D Visualisierungsmethoden, die das Zeichnen von Netzwerken ohne Überschneidungen von Kanten ermöglichen, werden untersucht. Das Konzept des gesteuerten Zeichnens metabolischer Netzwerke wird eingeführt. Im Gegensatz zu anderen Ansätzen wird ein vom Benutzer steuerbarer Ansatz zum Zeichnen metabolischer Netzwerke laut biochemischer Anforderungen mittels Einbindung von Benutzerrückmeldungen vorgestellt. -Vergleich von XML/SBML Dateien. SBML (Systems Biology Markup Language), ein XML-Format zur Speicherung und zum Austausch von biochemischen Modellen, ist allgegenwärtig in der metabolischen Modellierung geworden. Die metabolische Modellierung funktioniert üblicherweise als ein iterativer Prozess, bei dem neue Modelle aus vorhergehenden Modellen abgeleitet werden. Somit entstehen Familien von Modellen, die im SBML-Format gespeichert werden. Die abgespeicherten Daten enthalten eine große Menge an Informationen, von der Struktur eines Netzwerkes bis zu den Parametern eines Modells oder entsprechenden Messdaten. Zur Reduktion der Datenmenge wird der CustX-Diff Algorithmus zum gesteuerten Vergleich von XML-Dokumenten eingeführt. Durch Spezifikation von XPath-Ausdrücken wird ein anpassbarer Differenzprozess ermöglicht, der eine Fokussierung des Vergleichs auf bestimmte Teile von XML/SBML-Dokumenten erlaubt. -Visuelle Exploration von zeitabhängigen Sensitivitätsmatrizen. Sensitivitätsanalyse wird desöfteren in der Modellierung genutzt, um die Sensitivität eines Modells in Bezug auf seine Parameter zu untersuchen. Die Ergebnisse der Sensitivitätsanalyse eines metabolischen Modells sind große zeitabhängige Matrizen, die analysiert bzw. visualisiert werden sollen. Die Visualisierung hochdimensionaler Datensätze ist ein anspruchsvolles Problem. Daher wird ein erweiterbares System, bestehend aus vorhandenen und neuartigen Visualisierungstechniken zur visuellen Exploration von zeitabhängigen Sensitivitätsmatrizen, vorgestellt. Tabellarische Visualisierungsansäatze wie die sogenannte "Reorderable Matrix" werden weiterentwickelt, und Algorithmen für deren Sortierung werden diskutiert. Techniken zur Visualisierung von Proximitätsdaten, sowohl in Matrizenform, als auch projeziert anhand der Methode der Multidimensionalen Skalierung (MDS) werden erforscht. Informationsvisualisierungsparadigmen wie die focus+context basierte Verzerrung, sowie overview+details Methoden werden eingesetzt, um die vorgeschlagenen Visualisierungstechniken zu verbessern. -Cluster Ensembles zur Analyse von zeitabhängigen Sensitivitätsmatrizen. Neuartige verwandtschaft-basierte Cluster-Ensembles, die sich auf die Akkumulation der enstehenden paarweisen Ähnlichkeiten zwischen Objekten stützen, werden zur Clusterung von zeitabhängigen hochdimensionalen Datensätzen vorgeschlagen. Die zeitabhängigen Ähnlichkeiten, die aus den unscharfen Partitionen des Fuzzy-Clustering Prozesses enstehen, werden aggregiert, und die daraus resultierende Proximitätsmatrix wird zur Erzeugung des endgültigen Clusterergebnisses verwendet.
institution Mathematik und Informatik
license_str http://archiv.ub.uni-marburg.de/adm/urhg.html
dewey-raw 004
dewey-search 004
genre Data processing, Computer science
genre_facet Data processing, Computer science
topic_facet Informatik
thumbnail http://archiv.ub.uni-marburg.de/diss/z2007/0108/cover.png
spelling diss/z2007/0108 2007-02-05 2007-04-12 Information Visualization Techniques for Metabolic Engineering The main purpose of metabolic engineering is the modification of biological systems towards specific goals using genetic manipulations. For this purpose, models are built that describe the stationary and dynamic behaviour of biochemical reaction networks inside a biological cell. Based on these models, simulations are carried out with the intention to understand the cell's behaviour. The modeling process leads to the generation of large amounts of data, both during the modeling itself and after the simulation of the created models. The manual interpretation is almost impossible; consequently, appropriate techniques for supporting the analysis and visualization of these data are needed. The purpose of this thesis is to investigate visualization and data mining techniques to support the metabolic modeling process. The work presented in this thesis is divided into several tracks: -Visualization of metabolic networks and the associated simulation data. Novel visualization techniques will be presented, which allow the visual exploration of metabolic network dynamics, beyond static snapshots of the simulated data plots. Node-link representations of the metabolic network are animated using the time series of metabolite concentrations and reaction rates. In this way, bottlenecks and active parts of metabolic networks can be distinguished. Additionally, 3D visualization techniques for metabolic networks are explored for cross-free drawing of the networks in 3D visualization space. Steerable drawing of metabolic networks is also investigated. In contrast to other approaches for drawing metabolic networks, user guided drawing of the networks allows the creation of high quality drawings by including user feedback in the drawing process. -Comparison of XML/SBML files. SBML (Systems Biology Markup Language) has become ubiquitous in metabolic modeling, serving the storage and exchange of models in XML format. Generally, the modeling process is an iterative task where the next generation model is a further development of the current model, resulting in a family of models stored in SBML format. The SBML format, however, includes a great deal of information, from the structure of the biochemical network to parameters of the model or measured data. Consequently, the CustX-Diff algorithm for a customizable comparison of XML files will be introduced. By customizing the comparison process through the specification of XPath expressions, an adaptable change detection process is enabled. Thus, the comparison process can be focused on specific parts of a XML/SBML document, e.g. on the structure of a metabolic network. -Visual exploration of time-varying sensitivity matrices. Sensitivity analysis is a special method used in simulation to analyze the sensitivity of a model with respect to its parameters. The results of sensitivity analysis of a metabolic network are large time-varying matrices, which need to be properly visualized. However, the visualization of time-varying high-dimensional data is a challenging problem. For this purpose, an extensible framework is proposed, consisting of existing and novel visualization methods, which allow the visual exploration of time-varying sensitivity matrices. Tabular visualization techniques, such as the reorderable matrix, are developed further, and algorithms for their reordering are discussed. Existing and novel techniques for exploring proximity data, both in matrix form and projected using multi-dimensional scaling (MDS), are also discussed. Information visualization paradigms such as focus+context based distortion and overview+details are proposed to enhance such techniques. -Cluster ensembles for analyzing time-varying sensitivity matrices. A novel relationship-based cluster ensemble, which relies on the accumulation of the evolving pairwise similarities of objects (i.e. parameters) will be proposed, as a robust and efficient method for clustering time-varying high-dimensional data. The time-dependent similarities, obtained from the fuzzy partitions created during the fuzzy clustering process, are aggregated, and the final clustering result is derived from this aggregation. Informationsvisualisierungstechniken für das Metabolic Engineering 2011-08-10 2007 urn:nbn:de:hebis:04-z2007-01082 Metabolic Engineering beabsichtigt die zielgerichtete Modifikation biologischer Systeme mittels genetischer Manipulationen. In diesem Kontext werden Modelle gebaut, die sowohl das stationäre, als auch das dynamische Verhalten der biochemischen Reaktionen innerhalb einer biologischen Zelle beschreiben. Auf dieser Basis werden Simulationen durchgeführt, mit dem Ziel, das Verhalten einer Zelle zu verstehen. Der Modellierungsprozess ist mit der Erzeugung großer Datenmengen, sowohl während der Modellierung, als auch nach der Simulation der erstellten Modelle, verknüpft. Da eine manuelle Auswertung nahezu unmöglich ist, werden Techniken zur Analyse und Visualisierung solcher Daten benötigt. Die vorliegende Dissertation behandelt geeignete Ansätze der Visualisierung und des Data Minings zur Unterstützung des metabolischen Modellierungsprozesses. Die Arbeit liefert Beiträge zu folgenden Problemstellungen: -Visualisierung metabolischer Netzwerke sowie der zugehörigen Simulationsdaten. Neuartige Visualisierungstechniken, die die visuelle Exploration des Simulationsverlaufs metabolischer Netzwerke jenseits von statischen Schnappschüssen erlauben, werden vorgestellt. Knoten-Kanten Darstellungen von metabolischen Netzwerken werden durch Benutzung der jeweiligen Zeitreihen der Metabolitenkonzentrationen und Reaktionsraten animiert. Engpässe und aktive Teile eines Netzwerks werden leichter identifizierbar. 3D Visualisierungsmethoden, die das Zeichnen von Netzwerken ohne Überschneidungen von Kanten ermöglichen, werden untersucht. Das Konzept des gesteuerten Zeichnens metabolischer Netzwerke wird eingeführt. Im Gegensatz zu anderen Ansätzen wird ein vom Benutzer steuerbarer Ansatz zum Zeichnen metabolischer Netzwerke laut biochemischer Anforderungen mittels Einbindung von Benutzerrückmeldungen vorgestellt. -Vergleich von XML/SBML Dateien. SBML (Systems Biology Markup Language), ein XML-Format zur Speicherung und zum Austausch von biochemischen Modellen, ist allgegenwärtig in der metabolischen Modellierung geworden. Die metabolische Modellierung funktioniert üblicherweise als ein iterativer Prozess, bei dem neue Modelle aus vorhergehenden Modellen abgeleitet werden. Somit entstehen Familien von Modellen, die im SBML-Format gespeichert werden. Die abgespeicherten Daten enthalten eine große Menge an Informationen, von der Struktur eines Netzwerkes bis zu den Parametern eines Modells oder entsprechenden Messdaten. Zur Reduktion der Datenmenge wird der CustX-Diff Algorithmus zum gesteuerten Vergleich von XML-Dokumenten eingeführt. Durch Spezifikation von XPath-Ausdrücken wird ein anpassbarer Differenzprozess ermöglicht, der eine Fokussierung des Vergleichs auf bestimmte Teile von XML/SBML-Dokumenten erlaubt. -Visuelle Exploration von zeitabhängigen Sensitivitätsmatrizen. Sensitivitätsanalyse wird desöfteren in der Modellierung genutzt, um die Sensitivität eines Modells in Bezug auf seine Parameter zu untersuchen. Die Ergebnisse der Sensitivitätsanalyse eines metabolischen Modells sind große zeitabhängige Matrizen, die analysiert bzw. visualisiert werden sollen. Die Visualisierung hochdimensionaler Datensätze ist ein anspruchsvolles Problem. Daher wird ein erweiterbares System, bestehend aus vorhandenen und neuartigen Visualisierungstechniken zur visuellen Exploration von zeitabhängigen Sensitivitätsmatrizen, vorgestellt. Tabellarische Visualisierungsansäatze wie die sogenannte "Reorderable Matrix" werden weiterentwickelt, und Algorithmen für deren Sortierung werden diskutiert. Techniken zur Visualisierung von Proximitätsdaten, sowohl in Matrizenform, als auch projeziert anhand der Methode der Multidimensionalen Skalierung (MDS) werden erforscht. Informationsvisualisierungsparadigmen wie die focus+context basierte Verzerrung, sowie overview+details Methoden werden eingesetzt, um die vorgeschlagenen Visualisierungstechniken zu verbessern. -Cluster Ensembles zur Analyse von zeitabhängigen Sensitivitätsmatrizen. Neuartige verwandtschaft-basierte Cluster-Ensembles, die sich auf die Akkumulation der enstehenden paarweisen Ähnlichkeiten zwischen Objekten stützen, werden zur Clusterung von zeitabhängigen hochdimensionalen Datensätzen vorgeschlagen. Die zeitabhängigen Ähnlichkeiten, die aus den unscharfen Partitionen des Fuzzy-Clustering Prozesses enstehen, werden aggregiert, und die daraus resultierende Proximitätsmatrix wird zur Erzeugung des endgültigen Clusterergebnisses verwendet. opus:1617 ths Prof. Dr. Freisleben Bernd Freisleben, Bernd (Prof. Dr.) Philipps-Universität Marburg Qeli, Ermir Qeli Ermir
recordtype opus
id urn:nbn:de:hebis:04-z2007-0108
urn_str urn:nbn:de:hebis:04-z2007-01082
collection Monograph
uri_str http://archiv.ub.uni-marburg.de/diss/z2007/0108
callnumber-raw diss/z2007/0108
callnumber-search diss/z2007/0108
callnumber-sort diss/z2007/0108
callnumber-label diss z2007 0108
callnumber-first diss
callnumber-subject diss z2007
_version_ 1563293735851130880
score 9,617626