Comprehensive analysis of methylation data in non-model plant species

One of the goals of plant epigenetics is detecting differential methylation that may occur following specific treatments or in variable environments. This can be achieved with a single-base resolution with standard methods for whole-genome bisulfite sequencing (WGBS) and reduced representation bisul...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Can, Sultan Nilay
Beteiligte: Rensing, Stefan A. (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2021
Schlagworte:
Online-Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!

Eines der Ziele der Pflanzen-Epigenetik ist der Nachweis differentieller Methylierung, die nach bestimmten Behandlungen oder in variablen Umgebungen auftreten kann. Dies kann mit einer Einzelbasenauflösung mit Standardmethoden für die Ganzgenom-BisulfitSequenzierung (WGBS) und die Bisulfit-Sequenzierung mit reduzierter Repräsentation (RRBS) erreicht werden. Ein weiteres wichtiges Ziel ist es, Sequenziermethoden in Kombination mit Bisulfit-Behandlung anzuwenden, um Genetik und Epigenetik mit phänotypischen Merkmalen in Verbindung zu bringen. In den letzten 19 Jahren ist dies durch sogenannte genomweite Assoziationsstudien (GWAS) und epigenomweite Assoziationsstudien (EWAS) möglich geworden, wobei Letztere darauf abzielen, die potenziellen Biomarker zwischen phänotypischen Merkmalen und epigenetischer Variation aufzudecken. In der Praxis sind derartige Studien auf Softwarepakete oder "Bioinformatik-Pipelines" angewiesen, die die erforderlichen Rechenprozesse routinemäßig und zuverlässig durchführen. Diese Arbeit beschreibt mehrere solcher Pipelines, die im Rahmen von EpiDiverse, einem Innovative Training Network (ITN) (https://epidiverse.eu/, Zugriff am 1.2.2021), entwickelt wurden, das umfassende Untersuchungen zu Pipelines für WGBS, differenziell methylierte Regionen (DMR), EWAS und Einzelnukleotid-Polymorphismus (SNP)-Analysen ermöglicht. Hier stelle ich die Benchmark-Untersuchungmit DMR-Tools, die EWAS-Pipeline und Bioinformatik-Pipelines vor, die im EpiDiverse-Toolkit implementiert sind. Zunächst habe ich gemeinsam mit den Co-Autoren durch die Analyse von DMR-Tools mit simulierten Datensätzen mit sieben verschiedenen Tools (metilene, methylKit, MOABS, DMRcate, Defiant, BSmooth, MethylSig) und vier Pflanzenarten (Aethionema arabicum, Arabidopsis thaliana, Picea abies und Physcomitrium patens) gezeigt, dass metilene eine überlegene Performanz in Bezug auf die Gesamtgenauigkeit und den Recall aufweist. Aus diesem Grund haben wir beschlossen, dieses Tool als Standard-DMR-Caller in der EpiDiverse-DMR-Pipeline einzusetzen. Anschließend führte ich erweiterte Funktionen der EWAS-Pipeline über das GEM R-Paket hinaus ein, wie z.B. grafische Ausgaben, neuartige Imputation fehlender Daten, Kompatibilität mit neuen Eingabetypen usw. Dann deckte ich den Effekt fehlender Daten mit dem Datensatz von Picea abies (Fichte) auf und konnte zeigen, dass die Pipeline eine logische Imputation von fehlenden Daten aufweist. Des Weiteren ergab sich eine signifikante Überlappung zwischen den Analyseergebnissen der Pipeline und der Quercus lobata (Tal-Eiche). Durch umfangreichen Benchmark mit verschiedenen Tools wurde eine Gruppe von Pipelines veröffentlicht, wobei sich das EpiDiverse-Toolkit für die Arbeit mit WGBSDatensätzen eignet (https://github.com/EpiDiverse, Zugriff am 1.2.2021).