Editorial

Werkzeuge für die CRISPR-Werkstatt
Software-Tools für das Genome Editing mit CRISPR

Andrea Pitzschke


203a.jpg
Foto: NIH/Wikimedia Commons

Eine optimal auf die Zielsequenz ausgerichtete single guide RNA (sgRNA) ist das A und O bei jedem CRISPR-Experiment. Unzählige Online-Tools, Web-Plattformen und Programme für das sgRNA-Design versprechen, die richtigen Sequenzen im Handumdrehen zu finden.

Seit Emmanuelle Charpentier und Jenifer Doudna vor sechs Jahren die CRISPR/Cas­Welle lostraten, wird in biowissenschaftlichen Laboren rund um den Globus gecrispert was das Zeug hält. Inzwischen kennen die Forscher die Knackpunkte der CRISPR-Technik recht gut und versuchen, sie zu optimieren. Dazu zählt zum Beispiel das Einschleusen der CRISPR/Cas-Komponenten entweder als „Bauanleitung“ oder Endprodukt sowie das Vermeiden von Off-Target-Effekten. Der kritischste Faktor ist aber das richtige Design der sgRNA. Zahllose bioinformatische CRISPR-Tools sollen dabei helfen, die bestmögliche sgRNA für das jeweilige Gene Editing-Experiment zu finden.

Bevor wir zu diesen kommen, aber zunächst kurz zu den CRISPR-Mechanismen. Am Gene Editing mit CRISPR/Cas sind drei Spieler beteiligt: Die genomische Zielsequenz (Protospacer), die single guide RNA (sgRNA) sowie eine CRISPR-Nuklease. Die Zielsequenz liegt innerhalb des Gens, das man verändern will und muss ein sogenanntes Protospacer Adjacent Motif (PAM) von zwei bis sechs Basenpaaren Länge am 3´-Ende enthalten. Für Cas9, die beliebteste CRISPR-Nuklease, lautet das PAM „NGG“. Die sgRNA ist ein Chimär aus einem zwanzig Nukleotide langen Abschnitt (Spacer), der zur jeweiligen Zielsequenz, dem Protospacer, passt sowie einem konstanten Abschnitt, der in Eigenregie eine Stem-loop-Formation einnimmt. Der dritte Akteur ist die Nuklease Cas, die an die Stem-Loop-Struktur der sgRNA bindet.

Macht sich die sgRNA auf den Weg zur komplementären Zielsequenz, schleppt sie die Nuklease Cas automatisch mit. Zwanzig Basenpaare vor dem PAM setzt die Nuklease dann den Schnitt. Den entstandenen Doppelstrangbruch schließt die zelleigene Reparaturmaschinerie anschließend wieder: Entweder durch Neighbourhood End Joining (NHEJ) oder homologe Rekombination (HR). Beim NHEJ gehen einige Basenpaare verloren – der Leserahmen verschiebt sich hierdurch und bringt die Translation zum Erliegen. Bei der HR kann durch Zugabe einer Donor-DNA, deren Enden zur Bruchstellensequenz passen, das Genom um ein Gen(fragment) erweitert werden.

Die Natur weicht von diesem generellen Prinzip zuweilen aber auch ab. So muss zum Beispiel der Spacer nicht ganz exakt zur Zielsequenz passen. Insbesondere 5´-seitige Fehlpaarungen (Mismatches), die jenseits des PAMs liegen, werden toleriert. Das kann von Vorteil sein, wenn man mit derselben sgRNA zwei ähnliche Gene einer Genfamilie erwischen will. Meist ist diese Toleranz jedoch ein Nachteil, da das Off-Target-Risiko steigt. Auch auf ein ausgewogenes ACGT-Verhältnis sollte man achten, polyT-Sequenzen vermeiden und den GC-Gehalt begrenzen – alles Spielregeln, die an das Oligo-Design für die PCR erinnern. Auch ein G unmittelbar vor dem PAM (GNGG) steigert zumindest bei Cas9 die Effizienz.

Die meisten Forscher überlassen das sgRNA-Design dem Computer. Schlaue Köpfe haben Algorithmen entwickelt, die eine möglichst hohe Trefferquote der sgRNAs für ihre Zielsequenz versprechen. Das Design beschränkt sich auf den Zielgen-spezifischen Spacer der sgRNA. Dass man im eigentlichen Experiment an diesen noch den Stem-Loop-bildenden Teil anknüpft, versteht sich von selbst.

Es gibt Dutzende Bioinformatik-Plattformen und Online-Tools für das Genome Editing mit CRISPR/Cas. Einige setzen den Fokus auf wenige Spezies und konkrete Problemstellung, andere sind breiter aufgestellt und bieten zusätzlichen Service und herunterladbare Ergebnisdateien. Viele CRISPR-Werkzeuge sind kostenlos. Nicht alles, was gratis ist, taugt aber auch was und viele verschwinden nach einer Weile wieder.

In Review-Artikeln findet man regelmäßig Bestandsaufnahmen der gebräuchlichsten Tools. Das erleichtert Neueinsteigern oder Umsteigern die Qual der Wahl. Empfehlenswert sind zum Beispiel die Reviews von Wilson et al. (Front. Pharmacol. 9:749) oder Ragothaman et al. (MOJ Proteomics Bioinform 5(4): 00164). Im Review von Brazelton et al. (GM Crops & Food, 6:4, 266-276) finden sich einige interessante zusätzliche Details.

Warum gibt es nicht einfach ein Universal-Werkzeug für alle – so wie Pubmed für die Literaturrecherche? Das hat viele Gründe. Nicht für jeden ist eine Plattform gleich gut geeignet, und Geschmack spielt schließlich auch eine Rolle. Will ich die Ergebnisse als nüchterne Text-Datei, oder als farbiges Schema erhalten? Arbeite ich mit Fliegen, Fröschen oder Früchten? Will ich ein oder gleich mehrere Gene editieren?

Nicht einfach ins Blaue schießen

In jedem Fall muss man das Genom seines Forschungsobjekts kennen, um Zielsequenzen vorhersagen und Off-Target-Effekte vermeiden zu können. Je nach Anbieter werden die Zielsequenz-Daten im GeneID- und/oder im Fasta-Format eingegeben. Letzteres hat den Vorteil, dass auch nicht-veröffentlichte Sequenzen möglich sind, etwa wenn man das in einem Organismus bereits vorliegende künstliche Gen weiter modifizieren möchte.

Praktisch ist auch die Möglichkeit, den Zielbereich einzugrenzen, das heißt sgRNA-Sequenzen für das x-te Exon anzufordern. Was sgRNA-Design-Tools am Ende ausspucken, sind Vorschläge für Spacer-Sequenzen, die zur Zielsequenz perfekt oder mit ein bis zwei Mismatches passen. Viele Tools klären mögliche Off-Targets bei der Kalkulation gleich mit ab und liefern die Vorschläge in Form eines Rankings. Man muss dann selbst abwägen, ob man eine vermeintlich effiziente Sequenz bevorzugt oder die weniger effiziente, die das Program jedoch als spezifischer und mit geringerem Off-Target-Risiko bewertet.

Man sollte auch berücksichtigen, dass die Zielsequenz auf dem passenden Strang liegt. 2018 haben Clarke et al. herausgefunden, dass das Gene Editing wesentlich effizienter abläuft, wenn die sgRNA an den Template-Strang andockt statt an den Anti-Template-Strang (Molecular Cell, 71(1):42-55). Die RNA-Polymerase transkribiert nur diesen Strang und entfernt die Cas-Nuklease, wenn sie am Template-Strang entlang wandert. Je früher die Nuklease nach getaner Arbeit von dem Template verschwindet, desto schneller und effektiver verläuft das Gene Editing (siehe hierzu auch das LJ-Online Editorial vom 15. August).

Sekundenschnelle Vorhersage

Bei den meisten Tools dauert die Kalkulation nur wenige Sekunden, die Ergebnisse werden direkt auf der Webseite selbst oder als herunterladbare Datei angezeigt und nicht erst an eine E-Mail-Adresse des Nutzers verschickt. Noch praktischer ist es, wenn man die Ergebnisse in Form einer Tabelle mit Angaben zu Position im Zielgen, Strang-Orientierung, Prozent-Match (Homologie), Off-Target-(Un)wahrscheinlichkeit oder GC-Gehalt erhält, die man entsprechend in einer Säule sortieren kann.

Das Tool CGAT (http://cbc.gdcb.iastate.edu/cgat/), das speziell für Pflanzengenome konzipiert ist, zeigt als Output die eingegebene Sequenz und markiert darin Vorschläge farbig. Beim Copy-Paste, etwa in ein Word-Dokument, bleibt die Farbmarkierung erhalten. Dazu liefert das Programm eine Tabelle mit den oben genannten Parametern, die Tabelle selbst ist jedoch statisch und nicht sortierbar. CGAT kennt nur eine Handvoll Organismen: Reis, Soja, Mais, Roggen und Erdnuss. Solange man mit einem davon arbeitet, ist dies eher ein Vorteil, da die Rechnerei entsprechend schneller erfolgt und die Software-Entwickler sich nur für diese „Elite“-Organismen der Pflanzenforschung Optimierungen überlegen müssen.

Über die Tools für das sgRNA-Design freuen sich auch Nicht-Editierer. Längst haben Forscher gelernt, Cas nicht nur für einen DNA-Schnitt, sondern auch als sgRNA-gerichtetes Transportvehikel zu nutzen. So kann zum Beispiel dCas9 nicht schneiden, dafür aber Transkriptions-Aktivatoren oder -repressoren huckepack nehmen und das gewünschte Zielgen aktivieren beziehungsweise stilllegen.

Die schönste Spacer-Sequenz wäre wirkungslos, wenn im Genom auf den Protospacer kein PAM folgt. Cas würde zwar binden, aber nicht schneiden. Natürlich berücksichtigen die sgRNA-Vorhersage-Algorithmen dieses Kriterium. „NGG“ für Cas9 schränkt die Trefferanzahl ein. Die meisten Tools nehmen von vornherein an, dass man mit Cas9 arbeitet, andere wie zum Beispiel CCtop vom Heidelberger Centre for Organismal Studies bieten mehrere PAMs zur Auswahl, lassen aber keine selbstdefinierten Motive zu.

Fixiert auf Cas9

Diese Flexibilität wäre jedoch hilfreich, denn neben Cas9 gibt es viele weitere Cas-Proteine und dementsprechend viele PAMs. Außerdem werden immer mehr Kristallstrukturen von Cas9-DNA-sgRNA-Komplexen gelöst, die Forschern dabei helfen, Cas so zu manipulieren, dass es alternative PAMs akzeptiert.

Dass meist Cas9 für CRISPR verwendet wird und nur selten andere Nukleasen auftauchen, dürfte daran liegen, dass Cas9 ein einfaches Protein ist, das als Monomer arbeitet. Cas9 aus Staphylococcus aureus funktioniert wie das originale Cas9 aus Streptococcus pyogenes, benötigt aber für die Kodierung 1.000 Basenpaare weniger.

Tatsächlich kommen CRISPR/Cas-Systeme in einer Vielzahl von Archaea und Bakterien vor. Die ausgeklügelte Immunabwehr gegen Virusbefall ist keine einmalige Erfindung von Streptococcus pyogenes, dem Cas9-Pionier. Aber nebenbei bemerkt: Auch den Erfindergeist von Viren sollte man nicht unterschätzen. Offensichtlich existieren auch anti-CRISPR-Proteine, die die bakterielle Immunabwehr lahmlegen (Cell,174(4):917-25)

CRISPRdisco

US-amerikanische Forscher haben systematisch alle bekannten Bakteriengenome nach homologen Sequenzen zu bekannten CRISPR-Arrays und Cas-kodierenden Sequenzen abgetastet. Dabei fanden sie nicht nur Spezies, die komplette oder unvollständige ­CRISRP/Cas-Systeme kodieren. Sie entwickelten gleichzeitig auch das Online-Tool CRISPRdisco zur Analyse unbekannter Genomsequenzen (The CRISPR Journal, 10.1089/crispr.2017.0022).

Um Ordnung in bekannte und zukünftig entdeckte Systeme zu bringen, schlagen die Autoren eine einheitliche Nomenklatur vor. Cas-Proteine lassen sich in sechs Typen unterteilen, und diese wiederum in insgesamt 23 Subtypen mit unterschiedlich langen CRISPR-Repeats. Jede Cas hat andere Fähigkeiten. Während Cas9 (Typ II) doppelsträngige DNA glatt schneidet, ist zum Beispiel Cas3 ­(Typ I) eine ssDNA-Exonuklease und Cas10 (Type III) eine ssDNA- oder RNA-Nickase. Cas12 (alias Cpf1; Typ V) schneidet dsDNA versetzt und Cas13 (Typ VI) zerschreddert RNA.

Wer heute ein frisch isoliertes unbekanntes Bakterium sequenziert, erfährt dank CRISPRdisco, ob ein CRISPR/Cas-System drinsteckt. Die Chancen dafür stehen nicht schlecht, denn unter den bisher bekannten Genomen finden sich bereits knapp 2.800 Treffer. 60 Prozent der Archaea und 20 Prozent der Bakterien haben ein komplettes CRISPR/Cas-System mit vollständigem CRISPR-Lokus und Cas-codierendem Gen.

Es scheint einen Zusammenhang zwischen taxonomischer Zugehörigkeit und bevorzugtem Vertreter der sechs Cas-Typen zu geben. Aber genau wie das 60-zu-20-Prozent-Verhältnis ist diese Angabe mit Vorsicht zu genießen. Schließlich wurden viele Archaea und Bakterien-Spezies nicht per Zufall für die Genomsequenzierung ausgewählt – die meisten repräsentieren Pathogene und Modellorganismen.

Cas9-Alternativen haben mitunter höhere Spezifitäten und reduzieren das Off-Target-Risiko. Nickasen wie Cas10 schneiden im Gegensatz zu Cas9 nur auf einem Strang doppelsträngiger DNA. Auch Cas9 kann man durch Austausch weniger Aminosäuren entsprechend frisieren, das Enzym heißt dann Cas9n. Für das Genome Editing mit Nickase kann man daher zwei verschiedene sgRNAs verwenden, die je ein Molekül des Proteins zu einer unterschiedlichen Stelle (Protospacer) in der Zielsequenz führen.

Editieren mit Nickasen

Nur wenn beide Protospacer vorkommen, kommt es zu Schnitten auf beiden DNA-Strängen. Bei einem Off-Target, das nur zu einem der zwei Protospacer homolog ist, bleibt ein Strang intakt. Der Einzelstrangbruch schließt sich damit spurlos und führt nicht zu Mutationen. In humanen Zellen ließ sich mit dieser „Paired Nicking“-Strategie die Off-Target-Häufigkeit um den Faktor 50 bis 1.500 reduzieren (Cell, 154(6):1380-9). Eine gute Übersicht über Cas-Varianten für spezielle Fragestellungen inklusive Referenzen zu erfolgreichen Einsätzen in Tier-, Pflanzen- und Bakterienzellen liefert der Review-Artikel von Khatodia et al. (Front Plant Sci., 7: 506.). Darin werden auch Strategien diskutiert, die Genomveränderung örtlich und zeitlich festzulegen, zum Beispiel mit licht-induzierbaren Cas9-Varianten.

Es existieren auch schon Tools zum Design komplexer sgRNAs, die das Editieren mehrerer Gene gleichzeitig ermöglichen, wie zum Beispiel der CRISPR-MultiTargeter (http://multicrispr.net/), den die Gruppe des kanadischen Krebsforschers Jason Berman insbesondere für die Arbeit mit Zebrafischen entwickelte (PLOS ONE 10 (9): e0138634).

Im MultiTargeter versteckt sich ein ganzer Werkzeugkasten, der für einfache und komplexe sgRNA-Design-Aufgaben Lösungen anbietet. Er ist visuell ansprechend und nutzerfreundlich. Am besten geht man die vier Programmteile der Plattform, die von der einfachen sgRNA-Zielsequenz-Suche bis zur Suche nach speziellen Zielsequenzen zunehmend komplexer werden, sukzessive durch. Hilfreich sind hierbei auch Demo-Läufe, die man abrufen kann.

Im simpelsten Fall benötigt man für das sgRNA-Design mit dem ersten Unterprogramm des MultiTargeter nur eine Sequenz im ­Fasta-Format oder eine Gen-Bezeichnung, die in die Maske eingegeben wird. Der Nutzer kann die Länge der Zielsequenz vorgeben und eine PAM-Sequenz definieren. Als Ergebnis erhält er in einem kopierbaren Textfeld farblich markierte Vorschläge, die nach Template- und Nicht-Template-Strang getrennt sind. Eine Tabelle mit Detailinformationen ist ebenfalls separat für beide Stränge abrufbar.

Etwas komplizierter wird es beim zweiten Tool des MultiTargeters, mit dem man mehrere Zielsequenzen gleichzeitig abtasten kann. Das Programm spuckt neben einem Alignment sgRNA-Vorschläge aus, die für die Zielsequenzen Eins, Zwei, Drei et cetera einmalig sind oder in mehreren Sequenzen auftreten. Das ist ganz praktisch, wenn man zum Beispiel die erstellte sgRNA zum Editieren homologer Gene in mehreren Organismen verwenden möchte.

Ganz ähnlich funktioniert auch das dritte Werkzeug des MultiTargeters, das gemeinsame und einzigartige sgRNA-Ziele in einer Gruppe ähnlicher Sequenzen aufspürt. Wer mit Genfamilien arbeitet und nicht weiß, welches Mitglied – allein oder in Kooperation mit einem weiteren – für eine Krankheit, Blütengröße oder ähnliches verantwortlich ist, erhält von dem Tool Vorschläge für alle möglichen Kombinationen.

Der vierte Programmteil der Plattform erkennt schließlich sgRNA-Zielsequenzen in mehreren Transkripten desselben Gens, also in Splice-Varianten.

Qual der Wahl

Aus der Vielzahl der angebotenen CRISPR-Tools das passende herauszufinden, ist sicher nicht ganz einfach – und oftmals wird man nicht drum herumkommen, verschiedene Programme, Webtools oder Plattformen auszuprobieren. Dabei sollte man eher Programmen vertrauen, die ordentlich beschrieben sind und deren Ablauf auch für Nicht-Bioinformatiker einigermaßen nachvollziehbar ist. Auch eine ansprechende Visualisierung und flexible Eingabemasken erleichtern den Nutzern das Leben. Ob man sich nach Beliebtheits-Rankings für CRISPR-Tools richten sollte, die man zum Beispiel auf der Seite des Bioinformatik-Anbieters OMIC-Tools (https://omicTools.com/blog/your-top-crispr-Tools) findet, sei dahingestellt – wenn neun von zehn Forschern mit Mäusen arbeiten, werden die Vorzüge von Tools für Pflanzenforscher und Mikrobiologen hier kaum widergespiegelt. Da dürfte es ratsamer sein, sich bei den Kollegen danach umzuhören, auf was sie vertrauen.




Das ist nur eine kleine Auswahl beliebter CRISPR-Design-Tools. Eine nahezu vollständige Liste mit Linkszu den Webadressen finden Sie in MOJ Proteomics Bioinform 2017, 5(4): 00164.

ZiFit Webserver http://zifit.partners.org/ZiFiT
CRISPR designWebserverhttp://crispr.mit.edu
CHOPCHOP Webserverhttp://chopchop.cbu.uib.no
CRISPR MultiTargeterWebserver http://www.multicrispr.net
CCTop Webserver http://crispr.cos.uni-heidelberg.de/
E-CRISPR Webserverhttp://www.e-crisp.org/E-CRISP
sgRNA Designer Webserverhttp://broadinstitute.org/rnai/public/analysis-tools/sgrna-design
sgRNA Scorer Webserverhttps://crispr.med.harvard.edu/sgRNAScorer
BenchlingWebserverhttp://benchling.com
CRISPRscanWebserverhttp://crisprscan.org
Deskgen Eigenständige Software http://deskgen.com
CRISPR-ERAWebserverhttp://crispr-era.stanford.edu/InitAction.action



Letzte Änderungen: 10.10.2018