Gene expression data analysis using novel methods: Predicting time delayed correlations and evolutionarily conserved functional modules

Microarray technology enables the study of gene expression on a large scale. One of the main challenges has been to devise methods to cluster genes that share similar expression profiles. In gene expression time courses, a particular gene may encode transcription factor and thus controlling several...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Balasubramaniyan, Rajarajeswari
Beteiligte: Kämper Jörg (Dr. ) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2005
Biologie
Schlagworte:
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Inhaltsangabe: Die Mikroarray-Technologie ermöglicht es, die Expression von Genen im großen Maßstab zu analysieren. Einer der größten Anreize bei der Daten-Analyse besteht darin, Methoden zu entwickeln, um Gene mit einem ähnlichen Expressionsprofil in gemeinsamen Clustern zu gruppieren. Bei Experimenten, in denen die Veränderung der Gen-Expression zeitabhängig verfolgt wird, ist es möglich, dass ein bestimmtes Gen für einen Transkriptionsfaktor die Expression weiterer Gene kontrolliert. Dadurch bedingt können die Profile einzelner Gene zueinander verschoben sein. Die Standard-Cluster-Algorithmen betrachten Gen-Expressionsprofile oftmals global, womit solche zeitversetzten Zusammenhänge in vielen Fällen ignoriert werden. Wir haben neuartige Methoden entwickelt, um zeitversetzte Zusammenhänge zwischen Expressionsprofilen zu detektieren: (1) Eine Methode, die dynamische Programmierung verwendet und (2) CLARITY; ein Algorithmus, der über den Vergleich lokaler Ähnlichkeiten im der Kurvenform sowohl zeitversetzte als auch lokale Ähnlichkeiten entdecken kann. Wir haben CLARITY verwendet, um einen Datensatz, der die Veränderungen der Gen-Expression währen des Zellzyklus von Saccharomyces cerevisiae beschreibt, zu analysieren. Die erhaltenen Cluster zeigen eine signifikante Anreicherung mit Genen bestimmter Funktionen, was deutlich macht, dass Gene mit einer ähnlichen Funktion oft auch co-reguliert und damit co-exprimiert sind. Durch CLARITY wurden sowohl zeitversetzte als auch lokale Korrelationen entdeckt. In Datensätzen, die verschiedene voneinander unabhängige Experimente miteinander kombinieren, versuchen Standard-Algorithmen oftmals, Cluster zu bilden, indem sie alle Bedingungen und alle Gene berücksichtigen. Diese Vorgehensweise erhöht den Hintergrund (Rauschen), was dazu führen kann, dass bestimmte Gene, die ihre Expression nur unter bestimmten, aber nicht allen Bedingungen ändern, nicht erfasst werden. Wir haben ein Programm zur Modul-Vorhersage entwickelt, das auf der Anwendung genetischer Algorithmen beruht, und das Gruppen von Genen identifizieren kann, die nur in einer Untergruppe der Bedingungen ihre Expression verändern. Mit dem Ziel, die funktionelle Annotierung des Ustilago maydis Genoms zu unterstützen, haben wir das Modul-Vorhersage Programm für die Analyse verschiedener unabhängiger Expressions- Datensätze von U. maydis verwendet. Die vorhergesagten Module wurden auf verschiedene Expressions-Datensätze von S. cerevisiae übertragen, um die evolutionäre Konservierung zwischen den beiden Organismen zu untersuchen. Der Hauptbeitrag dieser Arbeit liegt in der Entwicklung neuartiger Methoden, die es ermöglichen, biologische Informationen in Mikroarray-Datensätzen zu untersuchen.