Publikationsserver der Universitätsbibliothek Marburg

Titel:Characterization of the CRISPR-Cas subtype I-B proteins Cas6b and Cas8b of Methanococcus maripaludis C5
Autor:Richter, Hagen Klaus Gunther
Weitere Beteiligte: Randau, Lennart (Dr.)
Veröffentlicht:2013
URI:https://archiv.ub.uni-marburg.de/diss/z2014/0252
URN: urn:nbn:de:hebis:04-z2014-02525
DOI: https://doi.org/10.17192/z2014.0252
DDC: Biowissenschaften, Biologie
Publikationsdatum:2015-01-21
Lizenz:https://rightsstatements.org/vocab/InC-NC/1.0/

Dokument

Schlagwörter:
Immunsystem, Immune System, Prokaryoten, Prokaryotes

Summary:
The CRISPR-Cas system is an adaptive immune system found in archaea and bacteria to defend themselves against mobile genetic elements (e.g. phages). The system employs base complementarity of small RNA species (crRNAs) to target the foreign nucleic acids for degradation. The hallmark of the system is the CRISPR array or locus, which is composed of repetitive DNA sequences (repeats) that are interspersed by unique sequences (spacers). Spacer sequences can be derived from earlier encounters with viruses and, as part of the crRNAs, confer the base complementarity during a reoccurring attack. During the ongoing battle between prokaryotes and viruses diverse CRISPR-Cas systems evolved into three main types that are further subdivided. This thesis shows the first characterization of a subtype I-B CRISPR-Cas system. RNA-Seq data proved the in vivo activity of this CRISPR-Cas system in Methanococcus maripaludis C5. The data further revealed that the crRNAs are always composed of a complete spacer sequence flanked by an 8 nt 5' repeat tag and a 2 nt 3' repeat tag. Eigth cas genes were identified for M. maripaludis. Two Cas proteins, Cas8b and an annotated hypothetical protein were characterized in more detail. The hypothetical protein was shown to be the endoribonuclease responsible for the single-turnover catalysis of precursor crRNA into mature crRNA and was termed Cas6b. The reaction performed by Cas6b yields the 8 nt 5' terminal tag of the mature crRNAs. Despite sharing only low sequence identity of 11 %, the two Cas6 proteins of M. maripaludis and Pyrococcus furiosus could be well aligned using a structural model of Cas6b and the crystal structure of P. furiosus Cas6. Cas6b mutant analysis was used to determine four amino acid residues (lysine 30, histidine 38, histidine 40 and tyrosine 47) that comprise the catalytic site of Cas6b. The RNA binding properties of Cas6b were determined and showed a dimerization upon binding to a non-cleavable substrate. Further analyses including RNA crosslinking experiments followed by mass spectrometry identified a methionine residue (M185) that tightly coordinated to a uridine (U15) of the repeat sequence. Cas6b activity assays employing differently structured repeat variants of M. maripaludis and a 37 nt repeat sequence of Clostridium thermocellum could show, that the processing reaction performed by Cas6b does not recognize a secondary structure of the substrate. In addition to the verification to the in vivo activity of the CRISPR-Cas system, the RNA-Seq data also revealed a varying abundance pattern of crRNAs. To assess the crRNA abundance a experimental procedure was designed, which was aimed to analyse the influence of spacer sequences on a) the processing by Cas6 and b) the stability of crRNAs. With the help of this global approach influences of the spacer length and spacer sequence on the crRNA maturation and in vitro stability were recognized. In this context, future experiments will also determine further possible influences on crRNA abundance including i) crRNA loading into the Cas protein interference complex (Cascade) and ii) possible regulatory effects in terms of crRNA utilization dependent regulation. The characterization of the subtype-specific protein Cas8b revealed a splitting of the recombinant protein into two defined fragments. The exact point of cleavage was determined by Edman sequencing and provides evidence for a proteolytic cleavage of the full-length protein (either autocatalytically or by a protease). Other CRISPR-Cas subtypes were reported to contain two proteins serving as small and big subunit of the interference complex Cascade. For subtype I-B on the other hand Cas8b was found to be the only equivalent to these two proteins and it was proposed that the identified cleavage generates the large and small Cascade subunit. A biochemical analysis of Cas8b with respect to its putative roles during CRISPR-Cas immunity showed an unspecific binding to nucleic acids while no nucleolytic cleavage was observed. Possible functions of Cas8b are discussed and future studies will focus on the analysis of the protein functions in the context of a complete Cascade.

Zusammenfassung:
Mit dem CRISPR-Cas System wurde ein adaptives Immunsystem identifiziert, mit dem sich sowohl Archaen also auch Bakterien gegen fremde Nukleinsäuren zur Wehr setzen können. Dabei wird die Komplementarität einer kleinen RNA (crRNA) zur eindringenden Nukleinsäure ausgenutzt um diese abzubauen. Namensgebend für dieses System ist der CRISPR-Array oder Lokus, welcher sich aus sich wiederholenden DNA-Sequenzen (Repeats) und einzigartigen Elementen zwischen den Repeats (Spacer) zusammensetzt. Diese Spacersequenzen können aus vorausgegangenen Infektionen von Viren stammen und vermitteln, als Teil der kleinen crRNA, die nötige Komplementarität im Falle einer Neuinfektion. Im Zuge der Co-Evolution von Prokaryoten und ihren Viren hat sich eine hohe Diversität von verschiedenen CRISPR-Cas Systemen entwickelt. Es wird zwischen drei Haupttypen unterschieden, welche in weitere Subtypen unterteilt werden können. Die vorliegende Arbeit zeigt die erste Charakterisierung eines Subtyp I-B CRISPR-Cas Systems. Die in vivo Aktivität dieses CRISPR-Cas Systems wurde mittels RNA Sequenzierung in Methanococcus maripaludis C5 bestätigt. Die in den RNA-Seq Daten identifizierten crRNAs bestehen jeweils aus einer kompletten Spacersequenz und einer konservierten 8 Nukleotid Sequenz am 5' Terminus sowie einer 2 Nukleotid Sequenz am 3' Terminus. Es wurden 8 cas Gene identifiziert. Von den Cas-Proteinen wurden mit Cas8b und einem zunächst nur mit hypothetischer Funktion annotierten Protein zwei subtypisch spezifische Vertreter genauer analysiert. Für das letzte Protein wurde eine Endoribonuclease-Aktivität identifiziert und das Protein als Cas6b bezeichnet. Cas6b ist ein “single-turnover” Enzym, welches die längeren Vorläufer crRNAs in kleine reife crRNAs prozessiert. Dabei wurde bewiesen, dass Cas6b für die 8 Nukleotid Repeatsequenz am 5' Terminus der reifen crRNAs verantwortlich ist. Trotz einer sehr geringen Sequenzidentität von nur 11%, zeigte eine Modellierung der Cas6b Struktur eine hohe Ähnlichkeit zur Kristallstruktur des in Pyrococcus furiosus identifizierten Cas6 Enzyms. Mit Hilfe von eingefügten Punktmutationen konnten vier Aminosäurereste des katalytischen Zentrums von Cas6b identifiziert werden: Lysin (K30), Histidin (H38), Histidin (H40) und Tyrosin (Y47). Analysen der RNA-Bindefähigkeit von Cas6b haben gezeigt, dass Cas6b nach erfolgter Substratbindung in der Lage ist Dimerstrukturen zu formen. Weitere Untersuchungen mittels „RNA-Crosslinking“ gefolgt von massenspektrometrischen Analysen haben ein Methionrest (M185) identifiziert, welcher eng mit einem Uridin (U15) der Repeatsequenz koordiniert ist. Cas6b Aktivitäts-Assays mit Repeatvarianten von M. maripaludis sowie der Repeatsequenz von Clostridium thermocellum konnten belegen, dass die Prozessierung von Vorläufer crRNA durch Cas6b unabhängig von möglichen Sekundärstrukturen in der RNA stattfindet. Neben dem Vorhandensein von reifen crRNAs geht aus den RNA-Seq Daten auch eine hoche Variabilität der crRNA Häufigtkeit hervor. Um die identifizierten crRNA Mengen zu bewerten, wurde ein experimentaler Ablauf entworfen, mit welchem der Einfluss jeder einzelnen Spacersequenz auf a) die Prozessierung durch Cas6b und b) die Stabilität der crRNAs analysiert werden konnte. Mit Hilfe dieses globalen Analyseansatzes wurden geringe Einflüsse der Spacerlänge sowie Spacersequenz auf die in vitro Prozessierung und Stabilität beobachtet. In diesem Zusammenhang werden zukünftige Experimente auch den Einfluss des Cas-Protein Interferenzkomplexes (Cascade) sowie mögliche regulatorische Effekte auf die Häufigkeit der crRNAs betrachten. Die Charakterisierung des subtypspezifischen Cas8b ergab eine Spaltung des rekombinaten Proteins in zwei definierte Fragmente. Mittels Edman-Sequenzierung wurde die Schnittstelle innerhalb der Proteinsequenz identifiziert. In anderen CRISPR-Cas Subtypen sind zwei Proteine vorhanden, welche als große und kleine Untereinheit des Interferenzkomplexes Cascade beschrieben werden. Im Subtyp I-B hingegen ist Cas8b als einziges äquivalent zu den beiden Proteinen zu finden und es wurde postuliert das seine mögliche autokatalytische Spaltung die kleine und große Cascade-Untereinheit generiert. Die biochemische Charakterisierung von Cas8b und dessen mögliche Rolle innerhalb der Interferenzantwort ergab eine unspezifische Bindefähigkeit zu Nukleinsäuren und konnte keine nukleolytische Aktivität zeigen. Mögliche Funktionen von Cas8b werden diskutiert und in zukünftigen Studien sollen diese im Kontext des Interferenzkomplexes Cascade weiterführend untersucht werden.


* Das Dokument ist im Internet frei zugänglich - Hinweise zu den Nutzungsrechten