mn-Seqeuncing-by-Synthesis - 100-Dollar-Genom mit rotierender Scheibe

Mario Rembold


Editorial

(07.10.2022) Sequenzierkosten von einem Dollar pro Gigabase – das verspricht das im Juni aus dem Tarn-Modus aufgetauchte Start-up Ultima Genomics. Die Kommunikation des kalifornischen Unternehmens ist aber noch ausbaufähig.

Entwickler neuer Sequenziermethoden erfinden das Rad in der Regel nicht neu, wobei „Rad“ im Fall von Ultima Genomics ganz passend ist. Denn bei der Technik des Start-ups findet die Sequenzierung auf einer rotierenden Scheibe statt. Der Firma geht es aber weniger um eine neue Methode – im Vordergrund steht der stark reduzierte Preis der Sequenzierung. Selbst das 100-Dollar-Genom sei nicht das Ziel, sondern nur der Beginn, verkündet sie auf ihrer Website (ultimagenomics.com).

Auf Letzterer stehen neben vielen Schlagworten und Slogans auch Verweise auf aktuelle Publikationen. Details zu der neuen Sequenzierplattform findet man in einem Manuskript, das Forscher von Ultima Genomics zusammen mit Kollegen vom Broad Institute of MIT and Harvard erstmals im Mai auf bioRxiv veröffentlichten und zuletzt im August aktualisierten (bioRxiv DOI: 10.1101/2022.05.29.493900).

Im ersten Schritt der Technik werden kurze DNA-Fragmente auf Beads amplifiziert. Jedes Bead startet mit einem Nukleinsäure-Fragment, das via PCR vermehrt wird. Ein einzelnes Kügelchen enthält also nur eine Sequenz in vielfacher Ausführung. Soweit nichts Besonderes, denn die Amplifikation ist eine Grundvoraussetzung für alle Next-Generation-Sequencing (NGS)-Techniken – abgesehen von einigen Einzelmolekülverfahren, die aber bislang nicht für die schnelle kostengünstige Sequenzierung kompletter Genome geeignet sind.

272a
In den Instrumenten von Ultima Genomics erfolgt die Sequenzierung auf der Oberfläche eines rotierenden Silizium-Wafers mit einem Durchmesser von 200 Millimetern. Foto: Sumco

Editorial
Mit oder ohne Kettenabbruch

Bei den üblichen NGS-Verfahren wird das Fragment anschließend mit der Sequencing-by-Synthesis (SBS)-Technik sequenziert, von der zwei Varianten existieren.

Die gängigste ist die Kettenabbruch-Methode, die sowohl bei der guten alten Sanger-Sequenzierung als auch auf modernen NGS-Geräten eingesetzt wird – bei letzteren aber reversibel ist. Auf jedem Strang kann pro Schritt nur eine Base angefügt werden, die in der Regel durch ein Fluoreszenz-Signal detektiert wird. In einem Reaktions- und Waschschritt wird die terminale Gruppe von der Base entfernt, worauf die nächste Base an der Reihe ist. In NGS-Instrumenten sind diese Prozesse automatisiert und finden im Hochdurchsatz statt.

Etwas schneller ist die Variante ohne vorübergehenden Kettenabbruch. Pro Schritt wird jeweils nur eine der vier Basen in den Reaktions-Mix zugegeben. Mit chemischen oder optischen Reportern misst man dann, wie viele Moleküle der Base angefügt wurden: Gar keines, eines oder mehrere hintereinander. Die Technik ist ungenau, wenn mehrere gleiche Basen aufeinanderfolgen – längere Homopolymere mit mehr als zehn Basen lassen sich nicht mehr exakt bestimmen.

In der Einleitung ihres bioRxiv-Manuskripts gehen die Forscher von Ultima Genomics auf SBS-Verfahren mit unmodifizierten Basen ein, die etwa bei der Pyrosequenzierung etabliert sind. Sie weisen darauf hin, dass entscheidende Parameter, wie zum Beispiel pH-Wert-Schwankungen oder die Photonenemission, mitunter rauschanfällig seien. Würde man die kontinuierliche Synthese ohne Kettenabbruch hingegen mit Basen durchführen, die mit Fluorophoren markiert sind, könne es bei einer Abfolge mehrerer gleicher Basen zum Quenching kommen – also dem gegenseitigen Unterdrücken der Fluoreszenz zwischen den Fluorophoren. Die Stärke des Fluoreszenzsignals korreliert dann nicht mehr zuverlässig mit der Länge des eingebauten Homopolymers.

Nur jede fünfte Base mit Fluorophor

Die Sequenziertechnik von Ultima Genomics basiert dennoch auf der nicht-terminierenden SBS mit Fluoreszenz-markierten Basen. Um das Quenchen zu vermeiden, ist die Mehrheit der Basen im Reaktions-Mix jedoch nicht-modifiziert – nur weniger als zwanzig Prozent tragen ein Fluorophor. Pro Zyklus gelangt eine der vier Basen inklusive der Fluoreszenz-modifizierten Variante in die Lösung. Der jeweils zweite Strang der einzelnen (identischen) DNA-Fragmente auf einem Bead wird verlängert, wenn die Base komplementär zum Gegenstück des Einzelstrangs ist. Ist das mehrmals hintereinander der Fall, wird sie mehrfach angefügt. Da die meisten Basen nicht modifiziert sind, kommt es nur selten vor, dass Fluorophore in direkter Nachbarschaft zueinander liegen. Störeffekte sind somit vernachlässigbar. Nach einem Waschschritt wird ein Bild aufgezeichnet, und die nächste Runde kann beginnen. Ultima Genomics nennt das Verfahren „mostly natural Sequencing-by-Synthesis“ oder kurz mnSBS.

Weniger ist mehr

Der zweite Knackpunkt bei der Sequenzierung ist der sparsame Umgang mit den Reagenzien. Bei den gängigen Sequenzierern bewegen sich Reaktionspuffer und Basen über die Oberfläche einer sogenannten Flow Cell. Tiefe Kanälchen auf der Flow Cell begünstigen den effizienten Durchfluss und Austausch, während flache mit weniger Reagenzien auskommen, den Fluss aber erschweren.

Im Sequenzierer von Ultima Genomics findet die Reaktion in einem dünnen Flüssigkeitsfilm auf einer Silizium-Scheibe (Silizium-Wafer) statt. Der runde Wafer hat einen Durchmesser von etwa zwanzig Zentimetern, die Beads haften elektrostatisch auf der Oberfläche. In der Mitte der rotierenden Scheibe sprühen feine Düsen die Reagenzien auf die Oberfläche, von der Zentrifugalkraft werden sie gleichmäßig darauf verteilt.

Die Entwickler von Ultima Genomics nennen das Wafer-System Open Flow Cell. Nach ihrer Ansicht hat es mehrere Vorteile: „Erstens“, heißt es im bioRxiv-Manuskript, „ist der 200-Millimeter-Wafer ein preisgünstiges Standardsubstrat aus der Halbleiterindustrie. Zweitens erlaubt die große Substrat-Oberfläche die Aufnahme von mehr als zehn Milliarden Beads, mit erheblichem Spielraum, um diese Dichte in der Zukunft zu erhöhen. Drittens verringert das Spin-Dispense-System das Totvolumen und ermöglicht eine effiziente Reagenzien-Abgabe, wodurch die Kosten für Reagenzien gesenkt werden. Viertens verkürzt die schnelle Zufuhr von Reagenzien sowie das optische Scannen die benötigte Zeit für das Sequenzieren. Zudem lässt der ‚air gap‘ zwischen den Reagenzien-spezifischen Flüssigkeitskomponenten nur wenig Spielraum für Kreuzkontaminationen.“

Kachelbilder von Wafer

Beim Scannen generiert der Computer pro Zyklus ein Bild mit vielen Kacheln, die sich nicht überlappen: Aus der Farbe und ihrer Intensität kann man pro Bead auf die eingebaute Base sowie die Länge des jeweiligen Homopolymers schließen. Eine Darstellung des verkachelten Wafers ist im Hintergrundbild auf der Website des Unternehmens zu sehen. Bis zu zwölf gleiche Basen hintereinander sollen so darstellbar sein – das System sei auch noch mit acht bis zehn Homopolymeren sehr zuverlässig. Um das rohe Bildsignal auswerten zu können, entwarfen die Programmierer des Start-ups einen Algorithmus für das sogenannte Base-Calling, der auf einem gefalteten neuronalen Netzwerk (Convolutional Neural Network, CNN) basiert.

Gern hätte Laborjournal erfahren, wo die mnSBS-Sequenzierer von Ultima Genomics schon eingesetzt werden oder zumindest im Probebetrieb sind. Uns hätte auch interessiert, ob die Deep-Learning-Verfahren beim Erfassen der Sequenzfolge keine zusätzliche Fehlerquelle darstellen – beim Alignment der Fragmente ist man ja schon zur Genüge auf künstliche Intelligenz zum Ausgleich von Fehlern oder Ungenauigkeiten angewiesen. Wie auf einer offenen, rotierenden Scheibe weniger Kontaminationen stattfinden als in gängigen Flow Cells, ist dem Laborjournal-Reporter auch nicht ganz klar. Und natürlich wüsste er gerne, wie realistisch die 100 Dollar pro Genom sind und wie tief der Preis pro Gigabase nach Meinung von Ultima Genomics fallen könnte.

Offene Fragen

Der LJ-Reporter wollte diese Fragen dem korrespondierenden Autor des bioRxiv-Manuskripts und CSO von Ultima Genomics, Doron Lipson, sowie dem CEO, Gilad Almogy, stellen und schickte eine Interview-Anfrage an die Kontaktadresse der Firma. Die Antwort darauf kam von einem PR-Unternehmen, mit dem Ultima Genomics offensichtlich zusammenarbeitet. In der E-Mail der Agentur heißt es knapp: „At this time, they have to politely decline the opportunity to deliver a comment for your story.”

Werfen wir daher noch einmal einen Blick in das bioRxiv-Manuskript: Das Team sequenzierte einige Referenzgenome und spürte auch verschiedene Einzelnukleotid-Polymorphismen mit einer Zuverlässigkeit von mehr als 99 Prozent auf. Die mnSBS-Technik erzielt Leselängen von knapp 300 Basenpaaren mit einer hohen Qualität – die Forscher geben einen Quality-Score von 30 an, was eine falsche Base pro 1.000 Basen bedeuten würde. Die Kosten liegen nach ihren Angaben bei einem Dollar pro Gigabase – das klingt fast zu gut, um wahr zu sein. Für einen vollen Sequenzierlauf benötigt der mnSBS-Sequenzierer zwanzig Stunden.

Sollten jedoch auch andere Gruppen diese Ergebnisse reproduzieren, dürften die Geräte von Ultima Genomics schon bald in den weltweiten Sequenzier-Facilities Einzug halten. Wir sind gespannt.