Gut vorbereitet in den Sequenzierer zahlt sich aus
Produktübersicht: RNA-seq-Kits

RNA-seq-Kits im Überblickpdficon

Editorial

(08.09.2023) Für die RNA-Sequenzierung ist eine tadellose Sequenzier-Bibliothek Voraussetzung. Den passenden RNA-Seq-Kit zu finden, ist aber gar nicht so einfach.

Immer leistungsstärkere und kostengünstigere Next-Generation-Sequencing (NGS)-Verfahren haben in den vergangenen Jahren die Analyse des Transkriptoms revolutioniert. Ältere Semester erinnern sich vielleicht noch an die im wahrsten Sinne des Wortes dunklen Zeiten, als sie noch im Rotlicht der Dunkelkammer herumgetapst sind, um radioaktiv markierte mRNAs in Northern Blots auf Röntgenfilmen sichtbar zu machen. Von der Extraktion der mimosenhaften mRNA über Elektrophorese und Northern Blot bis zur Entwicklung des Röntgenfilms ein Riesenaufwand – und danach versuchte man anhand von mehr oder weniger schwarz schattierten Banden auf die Expressionsstärke der untersuchten mRNAs zu schließen.

Diese ziemlich finsteren Zeiten in Dunkelkammern und Heißlaboren sind dank NGS inzwischen vorbei: Wer einen Schnappschuss der Genexpression in einer Zelle aufnehmen, alternatives Spleißen analysieren oder die Funktion nichtcodierender RNAs untersuchen will, sequenziert dazu die jeweils relevanten RNA-Moleküle mit einer der gängigen NGS-Techniken.

Lupe über Sequenz-Heatmap
Illustr.: NIH

Editorial

Ganz ohne Nasschemie und Pipette geht es aber auch bei der RNA-Sequenzierung (RNA-Seq) noch nicht. Einer der entscheidenden Schritte, der die Güte der Sequenzier-Ergebnisse maßgeblich beeinflusst, ist die Aufbereitung der extrahierten RNA zu einer auf das jeweilige Sequenzierverfahren zugeschnittenen RNA-Bibliothek. Zahlreiche Firmen bieten dazu RNA-Seq-Kits an, die dem Experimentator die Arbeit erleichtern sollen. Den für den individuellen Zweck geeignetsten auszuwählen, dürfte bei der Vielfalt der offerierten Kits inzwischen komplizierter sein, als die in den Vials und Fläschchen enthaltenen Enzyme und Waschlösungen zum richtigen Zeitpunkt in die Reaktionsansätze zu pipettieren.

Beschleunigtes Protokoll

Zu den Urvätern unter den RNA-Seq-Kits zählt der vor gut zehn Jahren eingeführte TruSeq-Kit, der die bis dahin aufwendige Präparation von RNA-Bibliotheken für die Short-Read-Sequenzierung erheblich beschleunigte. Ausgangsmaterial ist Gesamt-RNA, aus der polyadenylierte (poly-A-) mRNAs mit Desoxythymidin (dT)-Oligonukleotiden herausgefischt und danach enzymatisch in kurze mRNA-Fragmente zerlegt werden.

An die Fragmente binden im nächsten Schritt Zufallsprimer, die durch eine Reverse Transkriptase zu cDNA-Einzelsträngen verlängert werden. Die synthetisierten cDNA-Stränge dienen danach als Vorlage für die Synthese des zweiten, komplementären cDNA-Strangs mit DNA-Polymerase I. Noch kurz die überhängenden Enden der cDNAs „reparieren” sowie ein einzelnes Adenin an die 3'-Enden anhängen und schon können entsprechende Adapter-Sequenzen an die Enden ligiert werden. Die Adapter sorgen für die Verankerung der Fragmente an der Flowcell des Sequenzier-Geräts, enthalten eine Bindestelle für die Sequenzier-Primer und sind zudem mit kurzen Barcodes versehen, mit denen die Proben identifiziert werden können.

Kaum war der TruSeq-Kit auf dem Markt, kam auch schon Marie-Laure Yaspos Gruppe am Max-Planck-Institut für molekulare Genetik in Berlin mit einem Strang-spezifischen TruSeq-Protokoll um die Ecke, mit dem die Information beziehungsweise Orientierung der ursprünglichen mRNA-Template erhalten bleibt. Dazu muss man lediglich der DNA-Polymerase I bei der Synthese des zweiten cDNA-Strangs Desoxyuridintriphosphat (dUTP) statt dTTP unterjubeln und danach den synthetisierten Strang nach der Ligation der Adapter mit einer Uracil-DNA-Glycosylase abbauen.

Kurzer Templatewechsel

Die Konkurrenz blieb aber nicht untätig und entwickelte unter anderem RNA-Seq-Kits, die ohne die anfängliche Fragmentierung der mRNA auskommen. Zu diesen zählen zum Beispiel auf der SMART-Technik (Switching Mechanism at the 5'-end of RNA Template) basierende Kits, die die Template-Switching-Aktivität der Reversen Transkriptase aus dem Murinen Leukämievirus (MMLV-RT) ausnutzen.

SMARTer-Protokolle starten mit dem Binden eines Poly-dT-Primers an den Poly-A-Schwanz der mRNA. Die MMLV-RT verlängert den dT-Primer, der eine zusätzliche Bindestelle für einen PCR-Primer enthält, und synthetisiert den ersten Strang der cDNA mit der mRNA als Template. An das 3'-Ende des cDNA-Strangs hängt sie einige zusätzliche Nukleotide an, vor allem Cytosine (C). Letztere hybridisieren im nächsten Schritt mit einem komplementären Template-Switching-Oligo (TSO), das am 5'-Ende mit einem PCR-Adapter sowie einem Barcode (Unique Molecular Identifier, UMI) versehen ist. Die MMLV-RT benutzt das TSO als neues Template und ergänzt den PCR-Adapter sowie die UMI am 3'-Ende des cDNA-Strangs. Auf diese Weise bleibt das ursprüngliche 5'-Ende der mRNA-Template erhalten. Gleichzeitig kann der cDNA-Strang mit einer PCR zu einer doppelsträngigen cDNA amplifiziert werden, die sich anhand der UMIs identifizieren lässt. Erst nach der Amplifikation wird die erzeugte cDNA mit einer Tagmentase in kurze für die Short-Read-Sequenzierung geeignete Bruchstücke zerlegt, an die nur noch die nötigen Sequenzier-Adapter angehängt werden müssen.

Fixiertes Oligo

Nicht weniger ausgeklügelt ist die TeloPrime-Strategie, die die Guanosin-­Kappe (7-Methylguanosin, m7G) am 5'-Ende eukaryotischer mRNAs für das Umschreiben zu cDNA ausnutzt. Auch hier verlängert zunächst eine Reverse Transkriptase ein Poly-dT-Oligo, das an den Poly-A-Schwanz der mRNA bindet und synthetisiert hierdurch den ersten cDNA-Strang. Anschließend inkubiert man den cDNA-Strang mit einem doppelsträngigen Adapter-Oligo, das ein überhängendes Cytosin an einem der 5'-Enden beherbergt. Das einzelne Cytosin hybridisiert mit dem m7-Guanosin der Kappe, wodurch das Oligo an einem Ende des mRNA-cDNA-Duplexes positioniert wird. Eine Doppelstrang-spezifische Ligase verknüpft danach Oligo und mRNA-cDNA-Hybrid. Das gelingt ihr aber nur, wenn die 5'-Kappe auf der mRNA tatsächlich vorhanden ist und die cDNA in voller Länge vorliegt. Damit scheiden RNAs aus den weiteren Aufarbeitungsschritten aus, die man nicht gebrauchen kann, etwa angeknabberte mRNAs ohne 5'-Kappe oder unvollständig von der Reversen Transkriptase synthetisierte cDNAs. Mit einigen wenigen PCR-Zyklen sowie Adapter-spezifischen Primern erzeugt man danach eine doppelsträngige cDNA, die schließlich mit Sequenzier-spezifischen Primern in einer weiteren PCR amplifiziert wird.

TruSeq, SMARTer oder TeloPrime wurden ursprünglich für die Vorbereitung von RNAs für die Short-Read-Sequenzierung auf Illumina-Maschinen konzipiert. Für Long-Read-Sequenzierungen sind sie nur mit Abstrichen geeignet. Problematisch sind insbesondere „Geister”-cDNAs, die etwa bei der SMARTer-Technik entstehen können, wenn die Reverse Transkriptase neben der korrekten cDNA einige unechte cDNAs produziert. Bei der Sequenzierung können diese zum Beispiel zu Fehlinterpretationen von Spleißstellen (splice junctions) führen. Zudem ist nie garantiert, dass die sequenzierte cDNA tatsächlich die mRNA vom 5'- bis zum 3'-Ende vollständig abbildet. Häufig fehlen in den cDNAs zum Beispiel am 5'-Ende von mRNAs liegende Transkriptions-Startstellen.

Roderic Guigós Team am Barcelona Institute of Science and Technology hat sich zusammen mit Forschenden aus Italien und Japan das CapTrap-Seq-Protokoll ausgedacht, das weitgehend intakte und vollständige cDNAs für die Long-Read-Sequenzierung liefert (bioRxiv, doi.org/kqdf). Die Technik erinnert an die TeloPrime-Methode, weicht aber in einigen entscheidenden Punkten von dieser ab. Das CapTrap-Verfahren startet wie gehabt mit einem Poly-dT-Oligo, das an das polyadenylierte Ende der mRNA bindet, sowie der Synthese des ersten cDNA-Strangs durch eine Reverse Transkriptase. Danach wird die 5'-Kappe der mRNA jedoch mit Biotin modifiziert, um vollständige mRNA-cDNA-Hybride mit intakter 5'-Kappe mit Streptavidin-Beads aus dem Ansatz herausfischen zu können. Durch kurzes Erhitzen auf 95 Grad Celsius in Gegenwart von RNase wird die cDNA von dem mRNA-Template gelöst. Im Gegensatz zur TeloPrime-Technik wird sie anschließend an 5'- und 3'-Ende mit zwei verschiedenen doppelsträngigen Oligo-Linkern versehen. Einer der Linker dient als Primer für eine Polymerase, die den zweiten cDNA-Strang synthetisiert, danach wird die doppelsträngige cDNA mit einer PCR amplifiziert.

Nach den Angaben des Teams erhält man mit der CapTrap-Technik deutlich konsistentere und genauere Ergebnisse bei der Long-Read-Sequenzierung als mit SMARTer-, TeloPrime- sowie Direkt-Sequenzierungs-Kits. Ein etwas differenzierteres Bild zeichnet eine brandaktuelle Studie eines internationalen Konsortiums, das die Auswirkungen von RNA-Aufbereitung sowie Datenanalyse auf die Ergebnisse von Long-Read-Sequenzierungen ausgiebig analysierte (bioRxiv, doi.org/kqdg).

Die Experimentatoren präparierten RNA-Seq-Bibliotheken für die Long-Read-Sequenzierung mit den Geräten von PacBio und Oxford Nanopore Technologies (ONT) mit CapTrap, einem neuen Kit von ONT, dem ENCODE-Standard für PacBio sowie der R2C2-Technik.

CapTrap produzierte zwar zusammen mit der Nanoporen-Sequenzierung mehr Reads als die anderen Kombinationen. Die Sequenzierung von (ENCODE) cDNA auf PacBio-Geräten oder R2C2-cDNA mit Nanoporen-Sequenzierern lieferte jedoch deutlich längere und genauere Reads. Das Konsortium empfiehlt daher diese Arrangements für die Identifikation neuer Transkripte. Die Verbindung von cDNA und Nanoporen-Sequenzierung sei dagegen für RNA-Seq-Quantifizierungen besonders geeignet – insbesondere wenn ein annotiertes Referenz-Genom bekannt ist.

RNA-seq-Kits im Überblickpdficon


(Erstveröffentlichung: H. Zähringer, Laborjournal 09/2023, Stand: August 2023, alle Angaben ohne Gewähr)



Letzte Änderungen: 14.06.2023