Editorial

Auslesen übergeordneter Informationen - Epigenetische Sequenzierung

Karin Hollricher


(14.06.2023) Die Bisulfit-Sequenzierung war lange Zeit die einzige Möglichkeit, um an epigenetische Methylierungsmuster heranzukommen. Enzymatische Tricks und Sequenzierverfahren der dritten Generation eröffnen jedoch interessante Alternativen. An der Sequenzierung modifizierter RNA beißt man sich aber immer noch meist die Zähne aus.

Modifikationen von Nukleotiden tragen bei Eukaryoten entscheidend zur Kontrolle der Transkription und somit zum Phänotyp eines Organismus bei. Sie steuern nicht nur die Entwicklung eines Organismus, sondern können auch Krankheiten wie Adipositas und Krebs beeinflussen. Pflanzen begrenzen mit ihnen beispielsweise das Umherspringen von Transposons.

Einige epigenetische Markierungen sind stabil und werden vererbt. Ein prominentes Beispiel dafür ist das epigenetische Gedächtnis, das von Müttern, die während der Schwangerschaft hungerten, an ihre Nachkommen weitergegeben wird. Epigenetische Varianten könnten also zur Adaptation und Evolution beitragen.

An der C5-Position methyliertes Cytosin (5-Methyl-Cytosin, 5mC) ist die bei Mäusen und Menschen am häufigsten anzutreffende epigenetische Variante eines Nukleotids. Schon 1992 fand Rudolf Jänischs Gruppe am Whitehead Institute for Biomedical Research in Cambridge, USA, heraus, dass sie überlebenswichtig ist – schaltet man die für die Methylierung benötigte Methyltransferase aus, stirbt der Embryo (Cell 69(6): 915-26). Andererseits beobachtete man bei Säugetieren eine drastische DNA-Demethylierung der Genome junger Embryonen. Bei Pflanzen ist eine aktive DNA-Demethylierung Voraussetzung für die sexuelle Vermehrung, ohne sie entstehen keine funktionalen Pollen.

DNA Methylation - Histone Modification
lllustr.: Garvan Institute

Den Methylierungs-Zustand des gesamten Genoms oder von Genen in einzelnen Zellen zu bestimmten Zeitpunkten zu untersuchen, ist technisch aber nicht trivial. Die klassische Methode, methylierte Cytosine nachzuweisen, ist die Bisulfit-Sequenzierung. Behandelt man DNA zunächst mit Bisulfit und deaminiert anschließend die nicht-methylierten Cytosine zu Uracil, wird die Base in der darauffolgenden PCR als Thymin erkannt. Im komplementären Strang wird daher Adenin statt Guanin eingebaut. Vergleicht man die Sequenzen der so behandelten DNA mit den Daten eines Referenzgenoms, lässt sich anhand der Unterschiede feststellen, welche Cytosine methyliert waren und welche nicht. Tatsächlich wurden mit dieser Methode bereits ganze Genome analysiert. Um aber sicher sein zu können, dass ein mit der Bisulfit-Sequenzierung identifiziertes 5mC tatsächlich ein methyliertes Cytosin war und kein Einzelnukleotid-Polymorphismus (SNP) des Genoms, muss man eine zweite „normale“ Sequenzierung durchführen, die zusätzliches Geld kostet.

Portrait Markus Müller
Markus Müller versucht an der Ludwig-Maximilians-Universität München, RNAs mit modifizierten Nukleosiden zu sequenzieren. Foto: LMU

Kostengünstiger als die Bestimmung des gesamten Methyloms ist die Analyse der CpG-Dinukleotide, die die meisten methylierten Cytosine enthalten. Man kann dazu Chips verwenden, doch diese decken maximal 860.000 CpG-Dinukleotide ab – das sind nur drei Prozent von rund dreißig Millionen CpGs im Genom.

Mit entsprechenden Techniken kann man die Bisulfit-Sequenzierung auch auf einzelne Zellen anwenden. Diese Analyse sei allerdings „herausfordernd”, sagte Peter Laird vom Van Andel Research Institute (USA) in einem Technology Feature von Nature Methods (20: 634-38). Laird muss es wissen, er forscht seit fast dreißig Jahren an der DNA-Methylierung. Die harschen Reaktionsbedingungen vernichten so viel des eh schon geringen Ausgangsmaterials, dass man Daten von bestenfalls zwanzig Prozent des Genoms einer einzelnen Zelle erhält – meist sind es noch weniger. Aber es kündigt sich eine Lösung des Problems an. Jedenfalls berichtet Laird, sein Labor habe die Methode so weit verbessert, dass man auf fünfzig Prozent Abdeckung pro Zelle käme.

Unterschiedliche Muster

Im Januar publizierte eine israelische Gruppe zusammen mit der US-amerikanischen Krebsdiagnostik-Firma GRAIL sowie weiteren Forschern aus Schweden, Kanada und den USA erstmals einen „DNA-Methylierungsatlas normaler menschlicher Zelltypen” (Nature 613: 355-64). Die Überschrift des Artikels ist bewusst gewählt, denn die Methylierungsmuster unterscheiden sich je nach Zelltyp, Alter, Geschlecht und physiologischem Zustand. Das internationale Team analysierte die DNA von 39 Zelltypen, die es per FACS-Zellsortierung aus 205 gesunden Gewebeproben isoliert hatte.

Ein Ergebnis der gewaltigen Anstrengung sind Zelltyp-spezifische Methylierungs-Marker beziehungsweise ganze Methylierungs-Blöcke. Es stellte sich heraus, dass Gene in diesen Regionen oft zelltypische Funktionen übernehmen. In überwiegend hypomethylierten Abschnitten fanden die Forscher und Forscherinnen Enhancer und Bindestellen für Transkriptionsfaktoren.

„Leider eignet sich die Bisulfit-Methode nicht für lange Reads, die man mit den neuesten Third-Generation-Sequencing-Technologien erzielt, etwa mit der Nanoporen- oder der SMRT-Sequenzierung”, sagt Markus Müller, Experte für epigenetische Sequenzierverfahren in Thomas Carells Arbeitsgruppe an der Ludwig-Maximilians-Universität München. Die Bisulfit-Sequenzierung geht nicht gerade sanft mit der DNA um – einer Untersuchung zufolge werden 15 kB lange Fragmente dabei auf durchschnittlich 800 bp gestutzt. Die langen Reads hätte man aber gerne, um beispielsweise das aktuelle Methylierungsmuster einer einzelnen Zelle zu einem bestimmten Zeitpunkt bestimmen zu können. Außerdem lassen sich lange Reads den Genom-Abschnitten genauer zuordnen. Bei kurzen Sequenzen gestaltet sich das schwieriger, weil durch die Konversion fast alle Cytosine aus der Sequenz verschwinden.

„Inzwischen existieren aber verschiedene enzymatische und chemische Verfahren, die mit weniger drastischen Versuchsbedingungen funktionieren”, erklärt Müller. Das Enzym A3A (Apolipoprotein-B-mRNA-Editing-Enzym, APOBEC3A) wandelt zum Beispiel Cytosin in nur einem Reaktionsschritt zu Uracil um. Wie bei der Bisulfit-Sequenzierung werden die Cytosine nach der PCR als Thymine gelesen. Eine TET-Oxidase oxidiert methyliertes Cytosin zu 5-carboxy-Cytosin (5caC), das A3A nicht zu Uracil konvertieren kann – in diesem Fall werden also die nicht-modifizierten Cytosine als Thymin gelesen. Diese auf Enzymen basierende Vorgehensweise nennt sich Enzymatische Methyl-Sequenzierung (EMseq). Alternativ kann man 5caC-Moleküle mit Pyridinboran zu Uracil deaminieren und nach einer PCR als Thymin lesen – dann heißt das Verfahren TET-assistierte Pyridinboran-Sequenzierung (TAPS). Die genannten Methoden können jedoch 5mC nicht von 5-Hydroxymethyl-Cytosin (5hmC) unterscheiden. Dazu ist eine Glykosyltransferase nötig, die nur 5hmC verzuckert und die Base hierdurch vor der Oxidation mit TET oder der Reaktion mit Pyridinboran schützt.

Die Konversion von Cytosin ist aber nicht immer nötig, auch mit selektiven Derivatisierungen lassen sich Varianten erkennen. Per Klick-Chemie kann man zum Beispiel 5mC und 5hmC mit Ferrocen- oder Adamantyl-Anhängseln ausstatten, die im Vergleich zu den Basen riesig sind. Über einen Umweg lässt sich damit auch 5hmC selektiv chemisch markieren. Den enzymatischen Weg dafür eröffnet die Beta-Glykosyltransferase, die nur 5hmC glykosyliert. Diese ­Methoden sind auch für lange Reads geeignet, denn die modifizierten Nukleotide generieren eindeutig identifizierbare Signale – bei der Nanoporen-Sequenzierung ändert sich der Ionenfluss, beim SMRT-Verfahren die Geschwindigkeit der Polymerase. Auch Formyl- und Carboxyl-Varianten des Cytosins lassen sich damit direkt detektieren.

Eine Technik, mit der man in einem einzigen Experiment sowohl die modifizierten als auch die mutierten Cytosine (SNPs) identifizieren kann, stellten ein Team der Firma Biomodal (vormals Epigenetix) aus Cambridge sowie Forscher der dortigen Universität vor (Nature Biotech. doi.org/kb42). „Das Konzept ist wirklich superschlau”, findet Müller. „Statt die DNA zweimal zu sequenzieren, kann man damit genetische und epigenetische Basen in einem Sequenzier-Durchgang lesen. Theoretisch sind bis zu 16 verschiedene Signale identifizierbar.” Im Routine-Labor ist man da allerdings noch nicht angekommen: in der Publikation ist von maximal sechs Nukleotiden die Rede, nämlich A, C, G, T, 5mC und 5hmC.

Alles in einem Aufwasch

Was ist so superschlau an dem Verfahren? Ausgangspunkt ist ein Einzelstrang-Fragment, das an einem Ende einen Hairpin-Linker enthält. Davon ausgehend synthetisiert man den zweiten, komplementären Strang. Da in dem Reaktionsmix kein 5mC enthalten ist, werden in diesem nur nicht-methylierte Cytosine eingebaut. Danach schützt man die methylierten Cytosine auf dem Original-Strang enzymatisch und deaminiert alle übrigen Cytosine zu Uracilen. Der Doppelstrang enthält hierdurch falsch gepaarte Basen: Die Uracile paaren sich mit Guaninen statt wie vorher mit den nicht-methylierten Cytosinen. Anschließend denaturiert man den Doppelstrang und sequenziert von beiden Enden bis zum Hairpin. Uracil wird wie Thymin gelesen. Aus den G-T- beziehungsweise T-G-Mismatches ergibt sich eindeutig, wo nicht-methylierte Cytosine waren – nämlich an den als Guanin identifizierten Positionen. Auf ähnliche Weise kann man spezifisch 5hmC identifizieren. „Der Ansatz ist exakt, erfordert einen geringen DNA-Input, hat einen simplen Arbeitsablauf und eine einfache Analysepipeline”, schreiben die Autoren der Studie.

Die Arbeitsgruppe Carell arbeitet an der Detektion von 5-Formyl-Cytosin, der dritten Oxidationsstufe der Methyl-Cytosine. „Das funktioniert prinzipiell schon“, sagt Müller, „wir optimieren aktuell die chemische Modifikationsmethode, und trainieren unsere Algorithmen.” Publiziert hat Carells Team die Technik aber noch nicht.

Sehr spannend findet der Biologe die vielen Modifikationen von RNA-Molekülen – in Mäusen und Menschen tauchten bisher über 150 verschiedene auf. „Wir würden die epigenetischen Sequenziermethoden gerne auf RNA übertragen. Aber leider geht das in vielen Fällen noch nicht”, bedauert Müller. Die Modifikationen hinterlassen entweder kein eindeutiges Signal an den für das Sequenzieren verwendeten Polymerasen, oder die Enzyme kommen damit überhaupt nicht klar und können den Strang nicht kopieren. Erfolgreich war in dieser Hinsicht bisher nur die Nanoporen-Sequenzierung. „Nanoporen können die RNA direkt auslesen. Das Problem ist aber, die Algorithmen zu trainieren, da es sehr schwer ist, Kalibrations-Standards beziehungsweise Trainingssets bereitzustellen”, erklärt Müller und hofft darauf, dass „an dieser Stelle die Chemiker helfen können.”

In Eukaryoten sind die Ribonukleoside an der Wobble-Position (34) der tRNA-Anticodon-Schleife  besonders häufig modifiziert.
In Eukaryoten sind die Ribonukleoside an der Wobble-Position (34) der tRNA-Anticodon-Schleife besonders häufig modifiziert. Markus Müller interessiert insbesondere die Funktion des sehr seltenen Nukleosids Queuosin. Illustr.: Frank Lyko

Rätselhaftes RNA-Nukleosid

Ein Molekül, das Müller besonders fasziniert, ist das nicht-kanonische RNA-Nukleosid Queuosin. Es kommt an Position 34 in der Anticodon-Schleife von tRNAs vor, die für Tyr, His, Asn oder Asp codieren – also an der Wobble-Position. Menschen können Queuosin nicht bilden, es wird von Mikroorganismen im Darm synthetisiert. Das seltene Nukleosid könnte an der Entstehung von degenerativen Erkrankungen beteiligt sein, bisher weiß man aber nur, dass es in die Translationseffizienz eingreift. Mit der epigenetischen RNA-Sequenzierung könnte man seine Funktion besser analysieren.

Offensichtlich existiert auch ein Zusammenhang zwischen der DNA-Methylierung und post-translationalen Modifikationen (PTMs) an Histonen. „Diese Mechanismen kommunizieren miteinander, es gibt Überschneidungen”, betont Laird in dem Nature-Methods-Feature. Um sie zu entschlüsseln, müssen allerdings auch Histon-Experten und Methylierungs-Fachleute, die bisher wenig miteinander zu tun hatten, gemeinsam über diese Mechanismen sprechen. Zu entdecken gäbe es in der Welt der epigenetischen Modifikationen für Wissenschaftler beider Disziplinen sicher genug.