Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules

Microarray technology enables the study of gene expression on a large scale. One of the main challenges has been to devise methods to cluster genes that share similar expression profiles. In gene expression time courses, a particular gene may encode transcription factor and thus controlling several...

Ausführliche Beschreibung

Gespeichert in:
1. Verfasser: Balasubramaniyan, Rajarajeswari
Beteiligte: Kämper Jörg (Dr. ) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2005
Biologie
Schlagworte:
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
oai_set_str_mv ddc:570
doc-type:doctoralThesis
xMetaDissPlus
dewey-raw 570
dewey-search 570
genre Life sciences
genre_facet Life sciences
topic_facet Biowissenschaften, Biologie
topic Biowissenschaften, Biologie
Zeitversetzte Korrelationen
Funktionelle Module
Time-delayed correlation
Optimierung
Datenanalyse
Saccharomyces cerevisiae
Functional Modules
Molekulare Bioinformatik
Genexpr
Ustilago zeae
Globale Optimierung
Optimierungsproblem
spellingShingle Biowissenschaften, Biologie
Zeitversetzte Korrelationen
Funktionelle Module
Time-delayed correlation
Optimierung
Datenanalyse
Saccharomyces cerevisiae
Functional Modules
Molekulare Bioinformatik
Genexpr
Ustilago zeae
Globale Optimierung
Optimierungsproblem
Balasubramaniyan, Rajarajeswari
Die Mikroarray-Technologie ermöglicht es, die Expression von Genen im großen Maßstab zu analysieren. Einer der größten Anreize bei der Daten-Analyse besteht darin, Methoden zu entwickeln, um Gene mit einem ähnlichen Expressionsprofil in gemeinsamen Clustern zu gruppieren. Bei Experimenten, in denen die Veränderung der Gen-Expression zeitabhängig verfolgt wird, ist es möglich, dass ein bestimmtes Gen für einen Transkriptionsfaktor die Expression weiterer Gene kontrolliert. Dadurch bedingt können die Profile einzelner Gene zueinander verschoben sein. Die Standard-Cluster-Algorithmen betrachten Gen-Expressionsprofile oftmals global, womit solche zeitversetzten Zusammenhänge in vielen Fällen ignoriert werden. Wir haben neuartige Methoden entwickelt, um zeitversetzte Zusammenhänge zwischen Expressionsprofilen zu detektieren: (1) Eine Methode, die dynamische Programmierung verwendet und (2) CLARITY; ein Algorithmus, der über den Vergleich lokaler Ähnlichkeiten im der Kurvenform sowohl zeitversetzte als auch lokale Ähnlichkeiten entdecken kann. Wir haben CLARITY verwendet, um einen Datensatz, der die Veränderungen der Gen-Expression währen des Zellzyklus von Saccharomyces cerevisiae beschreibt, zu analysieren. Die erhaltenen Cluster zeigen eine signifikante Anreicherung mit Genen bestimmter Funktionen, was deutlich macht, dass Gene mit einer ähnlichen Funktion oft auch co-reguliert und damit co-exprimiert sind. Durch CLARITY wurden sowohl zeitversetzte als auch lokale Korrelationen entdeckt. In Datensätzen, die verschiedene voneinander unabhängige Experimente miteinander kombinieren, versuchen Standard-Algorithmen oftmals, Cluster zu bilden, indem sie alle Bedingungen und alle Gene berücksichtigen. Diese Vorgehensweise erhöht den Hintergrund (Rauschen), was dazu führen kann, dass bestimmte Gene, die ihre Expression nur unter bestimmten, aber nicht allen Bedingungen ändern, nicht erfasst werden. Wir haben ein Programm zur Modul-Vorhersage entwickelt, das auf der Anwendung genetischer Algorithmen beruht, und das Gruppen von Genen identifizieren kann, die nur in einer Untergruppe der Bedingungen ihre Expression verändern. Mit dem Ziel, die funktionelle Annotierung des Ustilago maydis Genoms zu unterstützen, haben wir das Modul-Vorhersage Programm für die Analyse verschiedener unabhängiger Expressions- Datensätze von U. maydis verwendet. Die vorhergesagten Module wurden auf verschiedene Expressions-Datensätze von S. cerevisiae übertragen, um die evolutionäre Konservierung zwischen den beiden Organismen zu untersuchen. Der Hauptbeitrag dieser Arbeit liegt in der Entwicklung neuartiger Methoden, die es ermöglichen, biologische Informationen in Mikroarray-Datensätzen zu untersuchen.
Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
language English
format Dissertation
url http://archiv.ub.uni-marburg.de/diss/z2005/0134/pdf/drb.pdf
institution Biologie
building Fachbereich Biologie
author Balasubramaniyan, Rajarajeswari
author2 Kämper Jörg (Dr. )
author2_role ths
description Microarray technology enables the study of gene expression on a large scale. One of the main challenges has been to devise methods to cluster genes that share similar expression profiles. In gene expression time courses, a particular gene may encode transcription factor and thus controlling several genes downstream; in this case, the gene expression profiles may be staggered, indicating a time-delayed response in transcription of the later genes. The standard clustering algorithms consider gene expression profiles in a global way, thus often ignoring such local time-delayed correlations. We have developed novel methods to capture time-delayed correlations between expression profiles: (1) A method using dynamic programming and (2) CLARITY, an algorithm that uses a local shape based similarity measure to predict time-delayed correlations and local correlations. We used CLARITY on a dataset describing the change in gene expression during the mitotic cell cycle in Saccharomyces cerevisiae. The obtained clusters were significantly enriched with genes that share similar functions, reflecting the fact that genes with a similar function are often co-regulated and thus co-expressed. Time-shifted as well as local correlations could also be predicted using CLARITY. In datasets, where the expression profiles of independent experiments are compared, the standard clustering algorithms often cluster according to all conditions, considering all genes. This increases the background noise and can lead to the missing of genes that change the expression only under particular conditions. We have employed a genetic algorithm based module predictor that is capable to identify group of genes that change their expression only in a subset of conditions. With the aim of supplementing the Ustilago maydis genome annotation, we have used the module prediction algorithm on various independent datasets from Ustilago maydis. The predicted modules were cross-referenced in various Saccharomyces cerevisiae datasets to check its evolutionarily conservation between these two organisms. The key contributions of this thesis are novel methods that explore biological information from DNA microarray data.
publishDate 2005
era_facet 2005
contents Die Mikroarray-Technologie ermöglicht es, die Expression von Genen im großen Maßstab zu analysieren. Einer der größten Anreize bei der Daten-Analyse besteht darin, Methoden zu entwickeln, um Gene mit einem ähnlichen Expressionsprofil in gemeinsamen Clustern zu gruppieren. Bei Experimenten, in denen die Veränderung der Gen-Expression zeitabhängig verfolgt wird, ist es möglich, dass ein bestimmtes Gen für einen Transkriptionsfaktor die Expression weiterer Gene kontrolliert. Dadurch bedingt können die Profile einzelner Gene zueinander verschoben sein. Die Standard-Cluster-Algorithmen betrachten Gen-Expressionsprofile oftmals global, womit solche zeitversetzten Zusammenhänge in vielen Fällen ignoriert werden. Wir haben neuartige Methoden entwickelt, um zeitversetzte Zusammenhänge zwischen Expressionsprofilen zu detektieren: (1) Eine Methode, die dynamische Programmierung verwendet und (2) CLARITY; ein Algorithmus, der über den Vergleich lokaler Ähnlichkeiten im der Kurvenform sowohl zeitversetzte als auch lokale Ähnlichkeiten entdecken kann. Wir haben CLARITY verwendet, um einen Datensatz, der die Veränderungen der Gen-Expression währen des Zellzyklus von Saccharomyces cerevisiae beschreibt, zu analysieren. Die erhaltenen Cluster zeigen eine signifikante Anreicherung mit Genen bestimmter Funktionen, was deutlich macht, dass Gene mit einer ähnlichen Funktion oft auch co-reguliert und damit co-exprimiert sind. Durch CLARITY wurden sowohl zeitversetzte als auch lokale Korrelationen entdeckt. In Datensätzen, die verschiedene voneinander unabhängige Experimente miteinander kombinieren, versuchen Standard-Algorithmen oftmals, Cluster zu bilden, indem sie alle Bedingungen und alle Gene berücksichtigen. Diese Vorgehensweise erhöht den Hintergrund (Rauschen), was dazu führen kann, dass bestimmte Gene, die ihre Expression nur unter bestimmten, aber nicht allen Bedingungen ändern, nicht erfasst werden. Wir haben ein Programm zur Modul-Vorhersage entwickelt, das auf der Anwendung genetischer Algorithmen beruht, und das Gruppen von Genen identifizieren kann, die nur in einer Untergruppe der Bedingungen ihre Expression verändern. Mit dem Ziel, die funktionelle Annotierung des Ustilago maydis Genoms zu unterstützen, haben wir das Modul-Vorhersage Programm für die Analyse verschiedener unabhängiger Expressions- Datensätze von U. maydis verwendet. Die vorhergesagten Module wurden auf verschiedene Expressions-Datensätze von S. cerevisiae übertragen, um die evolutionäre Konservierung zwischen den beiden Organismen zu untersuchen. Der Hauptbeitrag dieser Arbeit liegt in der Entwicklung neuartiger Methoden, die es ermöglichen, biologische Informationen in Mikroarray-Datensätzen zu untersuchen.
last_indexed 2011-08-10T23:59:59Z
title_alt Neue Methoden zur Analyse von Genexpressionsdaten: Voraussage von zeitversetzten Korrelationen und evolutionär konservierten funktionellen Modulen
first_indexed 2005-09-09T00:00:00Z
title Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
title_short Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
title_full Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
title_fullStr Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
title_full_unstemmed Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
title_sort Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules
publisher Philipps-Universität Marburg
thumbnail http://archiv.ub.uni-marburg.de/diss/z2005/0134/cover.png
spelling diss/z2005/0134 2005-07-22 urn:nbn:de:hebis:04-z2005-01342 opus:1121 Microarray technology enables the study of gene expression on a large scale. One of the main challenges has been to devise methods to cluster genes that share similar expression profiles. In gene expression time courses, a particular gene may encode transcription factor and thus controlling several genes downstream; in this case, the gene expression profiles may be staggered, indicating a time-delayed response in transcription of the later genes. The standard clustering algorithms consider gene expression profiles in a global way, thus often ignoring such local time-delayed correlations. We have developed novel methods to capture time-delayed correlations between expression profiles: (1) A method using dynamic programming and (2) CLARITY, an algorithm that uses a local shape based similarity measure to predict time-delayed correlations and local correlations. We used CLARITY on a dataset describing the change in gene expression during the mitotic cell cycle in Saccharomyces cerevisiae. The obtained clusters were significantly enriched with genes that share similar functions, reflecting the fact that genes with a similar function are often co-regulated and thus co-expressed. Time-shifted as well as local correlations could also be predicted using CLARITY. In datasets, where the expression profiles of independent experiments are compared, the standard clustering algorithms often cluster according to all conditions, considering all genes. This increases the background noise and can lead to the missing of genes that change the expression only under particular conditions. We have employed a genetic algorithm based module predictor that is capable to identify group of genes that change their expression only in a subset of conditions. With the aim of supplementing the Ustilago maydis genome annotation, we have used the module prediction algorithm on various independent datasets from Ustilago maydis. The predicted modules were cross-referenced in various Saccharomyces cerevisiae datasets to check its evolutionarily conservation between these two organisms. The key contributions of this thesis are novel methods that explore biological information from DNA microarray data. 2005 Die Mikroarray-Technologie ermöglicht es, die Expression von Genen im großen Maßstab zu analysieren. Einer der größten Anreize bei der Daten-Analyse besteht darin, Methoden zu entwickeln, um Gene mit einem ähnlichen Expressionsprofil in gemeinsamen Clustern zu gruppieren. Bei Experimenten, in denen die Veränderung der Gen-Expression zeitabhängig verfolgt wird, ist es möglich, dass ein bestimmtes Gen für einen Transkriptionsfaktor die Expression weiterer Gene kontrolliert. Dadurch bedingt können die Profile einzelner Gene zueinander verschoben sein. Die Standard-Cluster-Algorithmen betrachten Gen-Expressionsprofile oftmals global, womit solche zeitversetzten Zusammenhänge in vielen Fällen ignoriert werden. Wir haben neuartige Methoden entwickelt, um zeitversetzte Zusammenhänge zwischen Expressionsprofilen zu detektieren: (1) Eine Methode, die dynamische Programmierung verwendet und (2) CLARITY; ein Algorithmus, der über den Vergleich lokaler Ähnlichkeiten im der Kurvenform sowohl zeitversetzte als auch lokale Ähnlichkeiten entdecken kann. Wir haben CLARITY verwendet, um einen Datensatz, der die Veränderungen der Gen-Expression währen des Zellzyklus von Saccharomyces cerevisiae beschreibt, zu analysieren. Die erhaltenen Cluster zeigen eine signifikante Anreicherung mit Genen bestimmter Funktionen, was deutlich macht, dass Gene mit einer ähnlichen Funktion oft auch co-reguliert und damit co-exprimiert sind. Durch CLARITY wurden sowohl zeitversetzte als auch lokale Korrelationen entdeckt. In Datensätzen, die verschiedene voneinander unabhängige Experimente miteinander kombinieren, versuchen Standard-Algorithmen oftmals, Cluster zu bilden, indem sie alle Bedingungen und alle Gene berücksichtigen. Diese Vorgehensweise erhöht den Hintergrund (Rauschen), was dazu führen kann, dass bestimmte Gene, die ihre Expression nur unter bestimmten, aber nicht allen Bedingungen ändern, nicht erfasst werden. Wir haben ein Programm zur Modul-Vorhersage entwickelt, das auf der Anwendung genetischer Algorithmen beruht, und das Gruppen von Genen identifizieren kann, die nur in einer Untergruppe der Bedingungen ihre Expression verändern. Mit dem Ziel, die funktionelle Annotierung des Ustilago maydis Genoms zu unterstützen, haben wir das Modul-Vorhersage Programm für die Analyse verschiedener unabhängiger Expressions- Datensätze von U. maydis verwendet. Die vorhergesagten Module wurden auf verschiedene Expressions-Datensätze von S. cerevisiae übertragen, um die evolutionäre Konservierung zwischen den beiden Organismen zu untersuchen. Der Hauptbeitrag dieser Arbeit liegt in der Entwicklung neuartiger Methoden, die es ermöglichen, biologische Informationen in Mikroarray-Datensätzen zu untersuchen. 2011-08-10 Neue Methoden zur Analyse von Genexpressionsdaten: Voraussage von zeitversetzten Korrelationen und evolutionär konservierten funktionellen Modulen 2005-09-09 Balasubramaniyan, R., Hüllermeier, E., Weskamp, N., Kämper, J. (2005). Clustering of Gene Expression Data Using a Local Shape-Based Similarity Measure, Bioinformatics 21, 1069-1077. Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules Balasubramaniyan, Rajarajeswari Balasubramaniyan Rajarajeswari ths Kämper Jörg (Dr. ) Philipps-Universität Marburg
recordtype opus
id urn:nbn:de:hebis:04-z2005-0134
urn_str urn:nbn:de:hebis:04-z2005-01342
collection Monograph
uri_str http://archiv.ub.uni-marburg.de/diss/z2005/0134
callnumber-raw diss/z2005/0134
callnumber-search diss/z2005/0134
callnumber-sort diss/z2005/0134
callnumber-label diss z2005 0134
callnumber-first diss
callnumber-subject diss z2005
_version_ 1563293711666774016
score 9,617626