Editorial

Special Einzelzell-Genomik und -Proteomik

Seltene Zellen und detaillierte Profile
von Mario Rembold, Laborjournal 09/2018


2018_09_02a
Neue Mikrofluidik-Systeme verpacken dissoziierte Zellen in hohem Durchsatz in einzelne wässrige Tröpfchen, sodass Forscher die Transkripte einzelner Zellen rekonstruieren können. (Die dargestellte Illustration ist ein Symbolbild.) Illustr.: Juliet Merz

Die Gruppe von Barbara Treutlein forscht am Max-Planck-Institut für evolutionäre Anthropologie in Leipzig mit Organoiden. Im Hochdurchsatz versuchen die Entwicklungsbiologen, mRNA möglichst komplett zu erfassen – und zwar aus einzelnen Zellen. Damit lassen sich detaillierte Zellprofile erstellen und neue Subtypen von Zellen oder Zellstadien charakterisieren.

Wir alle starten unser Leben mit nur einer Zelle. Damit sich daraus schließlich ein mehrzelliger Organismus mit ausdifferenzierten Organen und Geweben entwickelt, müssen fortlaufend molekulare Weichen gestellt werden. Doch in welche Richtung eine Weiche springt, kann im Embryo selbst bei nah beieinander liegenden Zellen vollkommen anders sein.

Ein Beispiel ist die laterale Inhibition im Delta-Notch-Signalweg: Der Ligand Delta bindet an den Rezeptor Notch und hemmt dadurch Nachbarzellen, ein neuronales Schicksal einzuschlagen. Doch irgendwo in solch einem proneuralen Cluster gibt es immer die eine Zelle, die zufällig ein bisschen mehr Delta in ihrer Membran präsentiert und sich gegen die Nachbarn durchsetzt. Sie macht das Rennen und wird zum Neuroblasten. Ab jetzt verändert sich das Expressionsmuster dieser einen Zelle.

Auch andere klassische Entwicklungsgene steuern Prozesse, in denen scharfe Grenzen in zunächst scheinbar einheitlichen Zellverbänden definiert werden. Darüber hinaus gibt es aber tausende Gene, deren Expres­sionsdynamik bislang nicht im Detail erforscht ist, und die möglicherweise Zellschicksale auf sehr viel subtilere Weise mitbestimmen. Somit ist klar, warum auch Entwicklungsbiologen zunehmend auf die Transkriptome einzelner Zellen schauen. Denn genau diese feinen Unterschiede gehen schnell im Sequenzrauschen unter, wenn man einen ganzen Verband, einen „Bulk“ von Zellen auf die enthaltene mRNA hin untersucht. Die eine Zelle, die ein fundamental wichtiges Entwicklungsgen hochreguliert hat, übersieht man dann womöglich.

Kortex im Petrischälchen

Ein Forscherteam am Max-Planck-Institut für evolutionäre Anthropologie in Leipzig schaut sich daher Transkriptionsprofile auf Einzelzell-Ebene an, um Differenzierungsprozesse möglichst scharf aufzulösen. Sie rekonstruieren so Entwicklungspfade einzelner Zellen oder stoßen auf bislang unbekannte Zelltypen und Subpopulationen. „Im Speziellen sind wir an der menschlichen Entwicklung interessiert“, verrät Barbara Treutlein, Leiterin der Arbeitsgruppe. Und weil man menschlichen Embryonen nicht wie Zebrafisch oder Taufliege im Labor zuschauen darf, forscht das Team um die Biophysikerin an Organoiden. Die wachsen aus induzierten pluripotenten Stammzellen heran und gelten daher als ethisch unproblematisch. „Da können wir dann auch ganz gezielt Gene ausschalten oder Mutationen einfügen, zum Beispiel über CRISPR/Cas9“, so Treutlein. Obwohl die Organoide nur ein Modellsystem sind, wachsen sie wie der Embryo in drei Dimensionen und bringen mitunter recht komplexe Strukturen hervor.

Bei der Frage, ob und wie zuverlässig ein bestimmtes Modellsystem ist, kann die Einzelzell-Transkriptomik helfen. Zum Beispiel lässt sich die Genexpression zwischen Organoid und echtem Embryo vergleichen, um Gemeinsamkeiten und Unterschiede zu dokumentieren. Die Hirnentwicklung etwa spiegele sich sehr gut in den Organoiden wider, berichtet Treutlein: „Dort sieht man sogar unterschiedliche Regionen wie das dorsale und ventrale Vorderhirn oder das Mittelhirn; die Abläufe stimmen sehr gut mit den Vorgängen in primären Geweben des Embryos überein.“

Genau das hatte Treutlein nämlich 2015 zusammen mit Kollegen aus Frankreich, England, Österreich und Deutschland untersucht. Die Autoren resümieren in ihrem Paper, dass die kortikalen Zellen im Organoid Genexpressionsprogramme nutzen, die denen im fetalen Gewebe „bemerkenswert ähnlich“ seien (PNAS 112: 15672-7).

Für den Vergleich der Transkriptome standen den Forschern auch Daten aus menschlichen Embryonen zur Verfügung. „Wenn eine Frau sich zu einem Schwangerschaftsabbruch entschließt, kann sie das Abortmaterial der wissenschaftlichen Forschung zur Verfügung stellen“, klärt Treutlein über die Herkunft der Embryonen auf, betont aber gleichzeitig: „Wir wollen mit unseren Organoiden natürlich gerade vermeiden, dass man auf primäres menschliches Material zurückgreifen muss.“

Treutleins Team wollte außerdem wissen, wie aussagekräftig Leber-Organoide als Modellsystem sind. Die seien nämlich nicht nur sehr viel kleiner als im echten Embryo, sondern entwickeln sich auch weniger weit. „Wenn wir die einfach nur in der Petrischale wachsen lassen, dann werden sie nicht vaskularisiert – selbst wenn wir dort zusätzlich Endothelzellen einbringen“, führt die Leipzigerin aus.

Trotzdem scheinen auch im Leber-Organoid wesentliche Prozesse abzulaufen, die der Leberentwicklung entsprechen, schlussfolgern Treutlein und ihre Kollegen aus experimentellen Daten. So kann man die in vitro erzeugten Leberdivertikel Mäusen implantieren. „Die Leberdivertikel werden dann vaskularisiert und von Mausblut durchblutet“, erklärt Treutlein. Bei Tieren mit eingeschränkter Leberfunktion kann das implantierte Organoid sogar ein Stück weit Ausfälle kompensieren (Nature 546(7659): 533-8).

Genen misstrauen

Ein Vergleich der Einzelzell-Transkriptomprofile zeigte außerdem: Die Organoide ähneln mehr den Leberzellen aus Embryonen als den Leberzellen erwachsener Menschen; sie eignen sich also durchaus als Modell für die Embryonalentwicklung. „Die Leber entsteht so früh in der Entwicklung, dass wir den Prozess bisher für die menschliche Leber kaum beleuchten konnten“, blickt Treutlein auf die Vergangenheit zurück und freut sich über die aktuellen Ergebnisse.

Nun ist Transkriptomik an sich nicht neu: mRNA lässt sich in biologischen Proben anhand der Poly-A-Schwänze identifizieren und mit passenden Primern und Reverser Transkriptase in cDNA umschreiben. In der Regel wird man diese cDNA zunächst per PCR amplifizieren, damit die Signale bei der Sequenzierreaktion stark genug sind. Beim Sequenzieren von mRNA aus einzelnen Zellen passiert im Grunde das Gleiche. Nur, dass vorher eben die Zellverbände aufgelöst werden müssen – ein entscheidender Schritt für die Qualität der Ergebnisse.

„Das Kritischste ist, dass man eine gute Einzelzell-Suspension herstellt“, mahnt Treutlein und zählt Fehlerquellen auf, die die Sequenzdaten verzerren: „Wenn Zellen aneinanderkleben, erzeugt das Artefakte; außerdem sollten bei der Behandlung möglichst keine Zellen beschädigt werden – sonst schwimmt mRNA frei herum oder es kleben fremde Zelltrümmer an Ihrer Einzelzelle.“

2018_09_02b
Biophysikerin Barbara Treutlein phänotypisiert mit ihrem Team tausende Zellen auf einmal. Foto: Ronny Baar

Außerdem habe die Vereinzelung der noch lebenden Zellen Auswirkungen auf die Genexpression. „Die Zellen durchlaufen ganz schön stressige Prozesse, weshalb man nicht jedem Gen trauen kann, das am Ende detektiert wird.“ Leider könne man die Auswirkungen des Suspendierens auf die Transkription nicht einfach so herausrechnen. „Obwohl alle Zellen den gleichen Prozess durchlaufen, heißt das nicht, dass alle Zelltypen darauf in gleicher Weise reagieren“, begründet Treutlein.

Hinzu kommt, dass man durch dass Dissoziieren der Zellverbände in vielen Fällen ungewollt eine Vorauswahl trifft. So überstehen im Hirngewebe Astrozyten und neurale Vorläuferzellen die Prozedur recht gut, während sensiblere Zelltypen unterrepräsentiert sind. „Der größte Teil der von uns detektierten Gene beschreibt jedoch den wirklichen Zustand im Gewebe“, berichtet die Biophysikerin aus ihrer Erfahrung mit der Einzelzell-RNA-Sequenzierung, kurz: scRNA-Seq.

Die Tücken und Möglichkeiten der Einzelzell-Transkriptomik an Organoiden hat Treutlein zusammen mit Gray Camp (ebenfalls ein Arbeitsgruppenleiter am selben Institut) in einem frei zugänglichen Review zusammengefasst (Development 144: 1584-7). Im Paper gehen die beiden auch auf unterschiedliche Methoden der scRNA-Seq ein. Diese unterscheiden sich vor allem darin, wie die Zellen dissoziiert und vereinzelt werden, und ob anschließend RNA-Sequenzen komplett erfasst oder nur ansequenziert werden. Um Zellen vorzuselektieren, kann auch ein FACS dazwischengeschaltet werden.

„Es kommt ja immer auf die Fragestellung an“, entgegnet Treutlein auf die Frage nach der besten Methode. „Wenn Sie komplette Sequenzen erfassen, können Sie sich alternatives Splicing anschauen oder nach Einzel-Nukleotid-Mutationen suchen.“ Ist solch ein Blick ins Detail nicht nötig, kann man Zeit sparen. „Die Methoden, die nur das Ende der Transkripte sequenzieren, können mit viel höherem Durchsatz betrieben werden.“

Begeistert berichtet Treutlein von einem Trend der letzten drei Jahre: Mikrofluidik-­Systeme, bei denen dissoziierte Zellen in einzelnen Tropfen landen. „Mit diesen Methoden können wir tausende von Zellen auf einmal phänotypisieren und ganze Gewebe erfassen“, schwärmt Treutlein, „so entdecken wir sogar seltene Subpopulationen von Zellen, was viel schwerer wäre, wenn wir pro Organoid nur einhundert Zellen anschauen könnten.“

2018_09_02c
Der Fokus des Treutlein-Teams liegt auf der menschlichen Entwicklung – deswegen verwenden die Leipziger Organoide, denn an humanen Embryonen dürfen sie kaum forschen. Foto: Treutlein Lab

Während Zellen durch ältere Vereinzelungsverfahren in kleine Kammern sortiert wurden, gelangt bei der Tropfenmikrofluidik jede Zelle in einen individuellen Wassertropfen. „Solche wässrigen Tropfen in Öl kann man in hohem Durchsatz herstellen und damit die Zellen einfangen“, beschreibt Treutlein das Grundprinzip. Anschließend bindet jeder Zelltropfen einen Bead, der die Primer für die reverse Transkription enthält. Mehr noch: Jedes Bead hat einen individuellen Barcode in die Primer integriert. „So können wir alle späteren Reaktionen in einem einzigen Volumen durchführen und trotzdem die Transkripte einzelner Zellen rekonstruieren.“

Barcode-Sequenzen lassen sich für die scRNA-Seq auf vielfältige Weise nutzen. Zum Beispiel beim Quantifizieren von Transkripten. Amplifiziert man cDNA, so kann man rein theo­retisch zwar anhand der Zyklenzahl auf die Kopienzahl in der Zelle zurückrechnen. Im echten Laboralltag hingegen passen Primer mal besser, mal schlechter. Beim exponentiellen Kopieren der Sequenzen können sich schon durch kleine Abweichungen erhebliche Ungenauigkeiten einschleichen. Zwar gibt es Verfahren, über die sich cDNA mehr oder weniger linear amplifiziert, trotzdem bleiben Unsicherheiten. Man kann jedoch vor dem Umschreiben der mRNA jedes einzelne Primer-Molekül individuell markieren. Dafür kommen zufällig generierte Sequenzen zum Einsatz. Unique Molecular Identifier, kurz UMI, heißt solch eine Signatur. „Damit es möglichst unwahrscheinlich ist, das zwei Transkripte denselben UMI bekommen, müssen die UMIs lang genug sein und eine ausreichend hohe Diversität haben“, erklärt Treutlein. Ist dies der Fall, gehen alle Transkripte mit demselben UMI auf ein einzelnes Molekül zurück. Kopienzahlen in der Zelle können so besser abgeschätzt und verglichen werden.

War die scRNA-Seq noch vor wenigen Jahren eine kniffelige Angelegenheit, so könne heute jeder die Transkription einzelner Zellen unter die Lupe nehmen, ist Treutlein sicher. „Einige Methoden sind heute kommerziell erhältlich, die experimentellen Schritte sind nicht mehr wirklich kompliziert“. Als Beispiele nennt sie „C1“ von Fluidigm oder die „Chromium Single Cell 3’ Solution“ von 10XGenomics. Demnach kann jeder Biologe im eigenen Labor die eine Zelle finden, die aus der Reihe tanzt und in einer Bulk-Sequenzierung nicht aufgefallen wäre.

Zurück ins Gewebe

Doch was genau nützt einem Entwicklungsbiologen dieses Wissen? Letztendlich spuckt der Computer lediglich einen Haufen Sequenzdaten aus. Daraus lassen sich zwar Transkriptionsprofile rekonstruieren, die zu individuellen Zellen gehören. Doch wie genau sieht solch eine einzelne Zelle in vivo aus? Wo im Organoid oder Embryo befindet sie sich? Welche Transkriptionsprofile im Datenpool repräsentieren ihre Nachbarzellen?

Genau diese Fragen interessieren den Entwicklungsbiologen, doch eine bloße scRNA-Seq liefert darauf keine Antwort. Im Gegenteil: Der Experimentator zerstört beim Auseinanderlösen und Vereinzeln der Zellen jede räumliche Information. Wäre es da nicht sinnvoller, einzelne Zellen mit GFP oder anderen Reportern zu markieren und deren Schicksal zu verfolgen? Oder gezielt durch In-situ-Hybridisierung zu sehen, wo im Organoid ein bestimmtes Gen hochreguliert ist?

„Die scRNA-Seq ist ein unglaublich starkes Werkzeug, um Zellen unvoreingenommen zu phänotypisieren – man ist nicht limitiert auf irgendwelche bereits bekannten Kandidatengene“, erläutert Treutlein die wesentliche Stärke der Methode. Eine Zellpopula­tion, die mit gängigen Markern als einheitlich gilt, kann sich nach der scRNA-Seq als sehr viel komplexer entpuppen: Plötzlich erlauben neu charakterisierte Transkripte nämlich, Subpopulationen zu beschreiben und auch seltenen Zelltypen auf die Schliche zu kommen. Oder man entdeckt in den Datensätzen Gene, die man für diesen Entwicklungsprozess gar nicht auf dem Schirm hatte. „Wir detektieren etwa zehn bis vierzig Prozent des Transkriptoms“, schätzt Treutlein. „Das mag nach wenig klingen, liefert uns aber wahnsinnig viel Information.“

Die Leipzigerin betont dabei: „Die ­scRNA-Seq verstehen wir immer nur als den ersten Schritt.“ Denn nachdem man neue Zelltypen identifiziert hat, die bislang kaum beachtete Gene hochregulieren, geht die Arbeit erst los. „Dann können Sie mit Ihrem neuen Wissen in das Organoid zurückgehen und die Zellen dort im Gewebe verfolgen.“ Klassische In-situ-Hybridisierung oder genetische Reporter machen jetzt neu entdeckte Zellpopulationen vor Ort sichtbar und verfolgen sie.

Pseudozeit und Zellpfade

Doch sogar die scRNA-Seq-Daten eines Gewebes, Organs oder Organoids lassen schon Rückschlüsse auf das Schicksal einzelner Zellen zu. Dann nämlich, wenn sich in der Probe Zellen unterschiedlicher Differenzierungsgrade befinden. Treutlein nennt ein Beispiel: „Wenn Sie in einem Gehirn-Organoid Vorläuferzellen haben, die sich noch nicht teilen, zusammen mit solchen, die bereits proliferieren, und dazu vielleicht einige ausdifferenzierte Neuronen, dann gibt es viele Zwischenzustände.“ In den Sequenzdaten kann der Computer nun ähnliche Zellen in Clustern gruppieren. Überlappen sich zwei Cluster, dann ist es wahrscheinlich, dass beide Cluster zwei aufeinanderfolgende Stadien einer Zelldifferenzierung repräsentieren. So kann man sich mit bioinformatischen Methoden an einer zeitlichen Entwicklung entlang hangeln.

Natürlich ist es kein wirklicher zeitlicher Verlauf, denn die sequenzierte RNA stammt aus einer Probe, in der alle Zellen zum selben Zeitpunkt lysiert worden sind – sie ist also nur ein Schnappschuss zu einem Zeitpunkt. „Trotzdem können Sie auf diesem Weg Entwicklungspfade finden“, so Treutlein. Um klarzumachen, dass man es nur mit einem möglichen Zellschicksal zu tun hat, spricht man nicht von einer Zeitachse, sondern von einer Pseudotimeline.

Auch hier gilt es, die Ergebnisse wieder am intakten Organoid zu verifizieren. Es gibt nämlich einige Fehlerquellen, die einen im wahrsten Sinne des Wortes auf falsche Pfade führen. „Der Zellzyklus ist ein gradueller Übergang, den man wieder rekonstruieren kann“, nennt Treutlein ein Beispiel. Es kann also passieren, dass man scheinbar die Entwicklung von Zelltyp A zu Zelltyp B „rekonstruiert“, obwohl A und B gar nichts miteinander zu tun haben. In Wirklichkeit repräsentieren die Daten vielleicht einfach eine Mitose.

Webtool für Neurotranskriptome

„Solche Variablen muss man versuchen, herauszurechnen“, so Treutlein. „Entweder indem man nur gleiche Zellzyklusstadien betrachtet, oder die Zellzyklusgene bei der Rekonstruktion einfach ausklammert“. Auch dann ist unklar, ob andere Gene ebenfalls vom Zellzyklus beeinflusst sind. „Das variiert je nach Zelltyp, deshalb ist es manchmal schwer, den Zellzyklus herauszurechnen“, gibt Treutlein zu.

Nun fallen in der Einzelzell-Transkriptomik jede Menge Daten an, deren Auswertung und Interpretation nicht trivial sind. „Das sind riesige Matrizen, die können Sie nicht einfach in Excel anschauen“, bringt es Treutlein auf den Punkt. Damit nicht jeder Wissenschaftler, der sich für Expressionsprofile interessiert, das Rad neu erfinden muss, entstand in Treutleins Arbeitsgruppe ein Tool namens „ShinyCortex“ (Front Neurosci. 12: 315). Anlass war, dass die Leipziger immer wieder von Kollegen kontaktiert wurden, die ebenfalls mit Hirn­organoiden arbeiten, erzählt Treutlein. „Andere Wissenschaftler haben uns gefragt, ob sie mal in unsere Single-Cell-Daten schauen können, wie dieses oder jenes Gen exprimiert ist, und mit welchen Genen die Expression korreliert.“ Also suchten die Forscher des Treutlein-Labs nach jeder Anfrage in den Daten und erstellten Plots, die sie dann an die Kollegen zurückmailten. „Irgendwann dachten wir, es wäre doch besser, wenn es einfach eine Webseite gibt.“ Und genau die steht nun öffentlich zur Verfügung, programmiert von Jorge Kagayama (https://bioinf.eva.mpg.de/shiny/sample-apps/ShinyCortex/).

In ShinyCortex sind die Datensätze zur Kortexentwicklung gesammelt, die aus Publikationen des Treutlein-Labs stammen. Der Besucher der Webseite kann einzelne Gene auswählen und sich die Daten plotten lassen. Mit diesem Wissen können Fachkollegen gezielt Experimente planen und müssen nicht erst unter hohem Zeitaufwand eigene Organoide erzeugen, nur um Transkriptionsprofile der Zellen zu erfassen. „Das ist für Forscher gedacht, die nicht so viel mit Datenanalyse zu tun haben, die aber trotzdem gern diese Daten nutzen möchten“, so Treutlein.

Ob ShinyCortex weitergepflegt wird, kann Treutlein derzeit nicht versprechen. „Da gibt es ja viel größere Bewegungen wie den Human Cell Atlas (siehe S. 52), wo es auch solche Web-Tools geben wird, die ShinyCortex irgendwann wahrscheinlich ablösen werden.“

Auch und gerade in der Einzelzell-Transkriptomik zeigt sich also wieder: Es ist relativ leicht, große Datensätze zu erzeugen; die eigentliche Herausforderung besteht darin, damit etwas Sinnvolles anzufangen. Da heutige Massensequenzier-Experimente mehr Daten liefern als eine Arbeitsgruppe allein je auswerten kann, wäre es in der Tat erfreulich, wenn diese Daten der Fachwelt möglichst einfach zugänglich sind.

Last Changed: 09.09.2018