Statistische Auswertung und Interpretation von hochdimensionalen molekularbiologischen Datensätzen

Samans, Birgit

Statistische Auswertung und Interpretation von hochdimensionalen molekularbiologischen Datensätzen

Der Einsatz von Hochdurchsatz-Methoden ist in der molekularbiologischen Forschung zu einem elementaren Werkzeug zur Aufklärung der komplexen zellulären Vorgänge geworden. Ein wichtiger Aspekt bei der Durchführung von Hochdurchsatz-Methoden ist die Etablierung von geeigneten Algorithmen zur Auswertun...

Ausführliche Beschreibung

Gespeichert in:

Bibliographische Detailangaben
1. Verfasser:	Samans, Birgit
Beteiligte:	Eilers, Martin (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format:	Dissertation
Sprache:	Deutsch
Veröffentlicht:	Philipps-Universität Marburg 2008
Schlagworte:	Transkriptionsfaktor-Bindestellen RNAi screening RNAi-Screening Transcription factor binding sites Funktionelle Interpretation Naturwissenschaften Statistische Datenauswertung miRNA Microarray Data analysis Natural sciences & mathematics
Online Zugang:	PDF-Volltext
Tags:	Tag hinzufügen Keine Tags, Fügen Sie den ersten Tag hinzu!

Beschreibung
Zusammenfassung:	Der Einsatz von Hochdurchsatz-Methoden ist in der molekularbiologischen Forschung zu einem elementaren Werkzeug zur Aufklärung der komplexen zellulären Vorgänge geworden. Ein wichtiger Aspekt bei der Durchführung von Hochdurchsatz-Methoden ist die Etablierung von geeigneten Algorithmen zur Auswertung der Daten. Für die DNA-Chiptechnologie sind in den letzen Jahren standardisierte Methoden zur Auswertung der Daten etabliert worden. Es hat sich jedoch gezeigt, dass die Interpretation der Daten im Kontext der biologischen Fragestellung sich trotz effizienter Datenanalyse als schwierig gestaltet. Deshalb wurde stärker darauf fokussiert, bioinformatische Methoden zur funktionellen Interpretation der Daten zu etablieren. In Kapitel 3 werden einige dieser Methoden dargestellt und anschließend auf einen Mikroarray-Datensatz angewendet, mit dem die c-Myc abhängige Genexpression in T-Lymphozyten von transgenen Mäusen untersucht wird. Es konnte gezeigt werden, dass die hier angewendeten Methoden für die funktionelle Interpretation von Genlisten geeignet sind. Da die Methoden zu unterschiedlichen Ergebnissen führen, bzw. auf unterschiedliche Schwerpunkte fokussieren, ist es sinnvoll, mehrere Methoden parallel anzuwenden, um eine möglichst effiziente Interpretation zu erzielen. Ein Aspekt der funktionellen Analyse ist die Untersuchung von ko-regulierten Genen eines Datensatzes auf eine mögliche Regulation durch einen gemeinsamen Transkriptionsfaktor. Eine Methode zur Detektion signifikant überrepräsentierter cis-regulativer Motive in den Promotersequenzen eines Sets von ko-regulierten Genen wurde im Rahmen der Arbeit etabliert. Diese Methode beinhaltet folgende Schritte: • Erstellung einer Datenbank mit orthologen Promotorsequenzen (Maus/Mensch) • Maskierung von repetitiven Sequenzelementen • Alignment der orthologen Sequenzen • Untersuchung von konservierten Sequenzbereichen auf Transkriptionsfaktor-Bindungsstellen (TFBS) • Korrektur der Anzahl der Bindungsstellen auf die Länge der konservierten Promotorsequenzen • Untersuchung einer Gruppe von ko-regulierten Genen auf die Anreicherung von TFBS im Vergleich zu einem Hintergrundset Die Methode wurde auf den in Kapitel 3 verwendeten Mikroarray-Datensatzes angewendet. Position weight matrices (PWM) mit E-Box-Motiven, die als Bindungsmotive für c-Myc bereits beschrieben wurden, konnten als signifikant überrepräsentiert gefunden werden. Zudem findet sich eine Anreicherung der PWM für den Transkriptionsfaktor YY1, dessen konstitutive Repression durch die Überexpression von c-Myc reduziert wird. Neben der Regulation der Genexpression z.B. durch Trankriptionsfaktoren gibt es weiteren Faktoren, die eine Rolle bei der Regulation der zellulären Prozesse spielen. Hierzu gehören u.a. die miRNAs, die als zelluläre Regulatoren in den letzten Jahren vermehrt in den Fokus der molekularbiologischen Forschung gerückt sind. Es treten z.B. zeit- und gewebespezifische miRNA-Expressions¬muster bei der Entwicklung von Pflanzen und Tieren oder bei der Regulation von physiolo¬gischen Prozessen wie der Apoptose, der Zellteilung und der Zelldifferenzierung auf. Da häufig eine Vielzahl von miRNAs an der Regulation eines Prozesses beteiligt sind, ist es notwendig, die Expression der verschiedenen miRNAs gleichzeitig zu messen, um so die entsprechenden Expressionmuster zu finden. Hierzu eignen sich miRNA-Mikroarrays, deren Auswertung im Rahmen dieser Arbeit etabliert wurde. Als Basis hierfür wurden die in Kapitel 2 beschriebenen Methoden verwendet. Die Algorithmen wurden dann in zwei Versuchen zur Untersuchung der N-Myc abhängigen miRNA Expression in vivo und in vitro eingesetzt. Die Ergebnisse beider Experimente zeigen eine deutliche Überlappung auf, somit konnte sowohl in den Vorversuchen, die im Rahmen der Etablierung durchgeführt wurden, als auch in den Experimenten gezeigt werden, dass sich die miRNA Mikroarray-Plattform für die experimentelle Anwendung eignet und die Auswertungsroutine zu Ergebnissen führt. Es wurde jedoch auch deutlich, dass durch eine Optimierung des derzeitigen Array-Designs, andere Normalisierungsmethoden angewendet werden könnten, die zu einer besseren Reduzierung von systematischen Fehlern führen könnten. Mit der RNAi-Screening Technologie steht eine weitere Hochdurchsatz-Technologie zur Verfügung, die eine Untersuchung der direkten Interaktion verschiedener Genprodukte ermöglicht. Die Screens generieren sehr große Datenmengen, die häufig eine sehr hohe Variabilität ausweisen, somit ebenfalls eine effiziente Datenanalyse erfordern. In dieser Arbeit wurde anhand der Auswertung eines shRNA-Screens, mit dem der Einfluss verschiedener Kinasen auf die Stabilität von c-Myc getestet werden sollte, die Etablierung einer Auswertungsroutine beschrieben.
Umfang:	208 Seiten
DOI:	10.17192/z2008.0986

Statistische Auswertung und Interpretation von hochdimensionalen molekularbiologischen Datensätzen

Ähnliche Einträge