Editorial

„Wir haben uns durch die Genomik ein ­falsches Bild von biologischen Abläufen und Krankheiten angewöhnt“

Im Gespräch mit Ruedi Aebersold, Zürich


(15.07.2022) Der Schweizer Zellbiologe Ruedi Aebersold kann auch als Professor emeritus am Institut für Molekulare Systembiologie der ETH Zürich nicht von der Massenspektrometrie lassen. Mit ungebremstem Elan macht er sich für ihre Bedeutung in der personalisierten Medizin stark. Laborjournal sprach mit ihm über die gegenwärtigen Konzepte, Grenzen und Möglichkeiten der Proteomik – nicht nur im Rahmen der Schweizer Tumor Profiler Study.

Laborjournal: Als Pionier der Massenspektrometrie legten Sie Grundsteine für eine personalisierte Medizin. War das stets Ihr Ziel?

Ruedi Aebersold » Natürlich war daran nicht nur unsere Arbeitsgruppe beteiligt, sondern eine Handvoll Forschungsstandorte. Im Gegensatz zu anderen versuchten wir aber tatsächlich nie, die höchste Auflösung oder die maximale Sensitivität als Selbstzweck zu erreichen. Unser Ziel war es immer, Methoden für die biomedizinische Anwendung zu entwickeln – also eine ausreichend hohe Sensitivität mit komplexen biologischen Proben zu verwirklichen.

Was waren für Sie die Meilensteine in Ihrer Methodenentwicklung für die Proteomik?

Aebersold » Die erste Errungenschaft war eine zuverlässige Quantifizierung von Proteinen und ihren Modifikationen. Denn in der biomedizinischen Forschung reicht es ja nicht nur, zu wissen, welche Moleküle in einer Probe vorhanden sind, sondern auch wie sie sich quantitativ unterscheiden, zum Beispiel zwischen krankem und gesundem Gewebe. Die zweite Errungenschaft war Reproduzierbarkeit. Wenn man von Biomarkern auf Krankheitstypen schließen will, braucht man große Patientenkohorten und reproduzierbare Daten. Ansonsten stellt man Assoziationen zu Batch-Effekten oder Hintergrundrauschen her.

bild

Einer weitflächigen klinischen Anwendung massenspektrometrischer Methoden steht also nichts mehr im Weg?

Aebersold » Biomoleküle können wir tatsächlich seit langem reproduzierbar quantifizieren, und zwar mittels Methoden des Selected Reaction Monitoring (SRM). Das ist quasi das massenspektrometrische Äquivalent zum Western Blot. Proben werden mit Trypsin verdaut, flüssigchromatographisch aufgetrennt, ins Tandem-Massenspektrometer injiziert und einzelne Peptid-Ionen dann sequenziell isoliert, fragmentiert und ihre Fragment-Ionen analysiert. Allerdings funktioniert das nur mit bis zu circa einhundert Peptiden pro Injektion. Menschliche Zellen exprimieren aber über zehntausend verschiedene Proteine. Bei einem solchen extrem komplexen Gemisch hat die SRM-Methode Schwierigkeiten, jedes Peptid-Ion sequenziell zu isolieren und zu fragmentieren.

Aus Gründen der Auflösung und spektralen Überlappung von Peptid-Signalen?

Aebersold » Vor allem aus Zeitgründen. Jeder Analysezyklus dauert zwar nur Millisekunden, bei einer riesigen Anzahl an Peptiden ist aber auch eine Stunde schnell vorbei und die Probe aufgebraucht. Erst Methoden der Data-Independent-Acquisition (DIA), bei denen alle Peptid-Ionen eines bestimmten Masse-Ladungs-Bereichs parallel analysiert werden, erzeugen die hohe Reproduzierbarkeit für zehntausende von Peptiden, die für die klinische Anwendung notwendig ist.

Diese Parallelisierung in der Massenspektrometrie erinnert an die Methodenentwicklung in der Genomik …

Aebersold » Genau. Auch dort wurden gereinigte und isolierte DNA-Segmente ursprünglich nacheinander sequenziert. Erst die Illumina-Methoden, die hunderte Millionen DNA-Segmente immobilisieren und parallel sequenzieren, erhöhten den Durchsatz massiv. Mittels Barcoding werden heute ja sogar multiple Genome parallel sequenziert. In der Massenspektrometrie erreichten wir diese Parallelisierung vor etwa zehn Jahren mit einer Technik namens Sequential Windowed Acquisition of All Theoretical Fragment Ion Mass Spectra (SWATH).

Wie funktioniert SWATH-MS?

Aebersold » Die von einer Chromatographie-Säule eluierten Peptide kann man anhand ihrer charakteristischen Retention und Masse in einer zweidimensionalen Grafik darstellen. Dieses 2D-Bild brechen wir in Einzelbereiche herunter und fragmentieren die zahlreichen Peptide jeder dieser Positionen auf einen Schlag. Die entscheidende Frage dabei ist natürlich: Wie identifizieren wir aus überlagerten Fragmentationsspektren vieler Peptide deren Sequenzen? Unsere Lösungsidee besteht aus einer Datenbank aus Referenzspektren aller denkbaren Einzelpeptide, die wir über Monate aufgebaut haben und nach den Fragment-Ionen-Spektren überlagerter Peptidsignale absuchen können. Die Referenzspektren dienen also als Fingerabdrücke, anhand derer wir unbekannte Peptide identifizieren können.

Wie gut funktioniert das, wenn Proteine – vielleicht auch auf unbekannte Weise – posttranslational modifiziert sind?

Aebersold » Ursprünglich konnten wir tatsächlich nur bekannte Peptide identifizieren. Dann trat aber ein, was überall eintritt, wenn man viele Daten hat: Wir lernten aus ihnen! Und zwar die Regeln, wie ein modifiziertes Peptid im Massenspektrometer fragmentiert. Aus Millionen solcher Korrelationen sagen maschinelle Lernalgorithmen mittlerweile ziemlich gut die Fragmentationsspektren unbekannter Substanzen voraus. Die Gruppen von Bernhard Küster an der Technischen Universität München und meinem früheren Postdoc Alexey Nesvizhskii an der University of Michigan Medical School sind federführend darin, Datensätze unbekannter Zusammensetzung mit vorausgesagten Fragmentationsspektren abzusuchen.

Gilt das auch, wenn unterschiedliche Proteoformen eines Proteins in der gleichen Probe vorliegen? Lassen sie sich voneinander unterscheiden?

Aebersold » Modifizierte Proteininstanzen des gleichen Gens sind sicher die nächste große Herausforderung. Noch ist die Proteomik meist auf die Aussage beschränkt, dass Translationsprodukte eines Genlokus in bestimmten Mengen in einer Zelle aktiv sind. Sie kann aber nicht sagen, wie viel welcher Proteoformen exprimiert wird. Das gilt für posttranslationale Modifikationen genauso wie für Spliceformen. Wir wissen nicht einmal, wie viele Proteoformen der menschliche Körper überhaupt generiert – vielleicht hunderte Millionen, vielleicht Milliarden?

Haben wir aber eine Kohorte kranker Zellen und eine Referenzkohorte, kann SWATH-MS leicht abfragen, welches Exon im Krankheitsfall exprimiert ist oder ob Proteine unterschiedlich modifiziert sind. Die genaue Zuordnung eines modifizierten Aminosäurerests ist zwar manchmal schwierig, wenn zum Beispiel im Fall von Phosphorylierungen mehrere Serine und Threonine aufeinanderfolgen. Aber wir können sagen, mit wie vielen Phosphatgruppen ein Peptid modifiziert ist – auch wenn wir noch keine Aussage darüber treffen können, ob sich die modifizierten Aminosäurereste im identischen Protein befinden.

Welche MS-Strategien könnten es in Zukunft erlauben, Proteoformen zu unterscheiden?

Aebersold » Es gibt viele Möglichkeiten, funktionell relevante Information aus Proteinen und ihren Komplexen herauszulesen. Zum Beispiel identifiziert die Arbeitsgruppe von Paola Picotti, meiner Nachfolgerin am Institut für Molekulare Systembiologie der ETH Zürich, mittels limitierter Verdauung diejenigen Peptide, die sich in ihrer Strukturkonformation je nach physikochemischem Umfeld unterscheiden. Eine komplementäre Methode ist das von der Arbeitsgruppe um Mikhail Savitski am EMBL Heidelberg entwickelte Thermal Proteome Profiling, bei dem man Proteine graduell aufheizt und ihre Stabilität massenspektrometrisch analysiert. Beide Methoden erfassen nicht nur die Struktur, sondern auch die Dynamik von Polypeptiden und erlauben somit Rückschlüsse auf unterschiedliche Proteoformen.

Der reinste Ansatz ist natürlich die Top-down-Proteomik, bei der intakte Proteine ohne vorherigen Trypsin-Verdau oder biophysikalische Manipulation ionisiert und analysiert werden. Die Proteine als molekulare Ionen in ein Massenspektrometer einzubringen und dort zu fragmentieren, ist wegen ihrer extrem diversen Löslichkeit, Größe und Stabilität aber in der Praxis häufig schwierig. Denn oft bleiben denaturierte Proteine nicht in Lösung und können nicht flüssigchromatographisch aufgetrennt und ins Tandem-MS eingespritzt werden.

Aber charakterisieren Arbeitsgruppen wie die um Carol Robinson an der University of Oxford nicht selbst schon hydrophobe Membranproteine massenspektrometrisch?

Aebersold » Sicher ist sie dort eine der führenden Forscherinnen – nicht nur für einzelne Membranproteine, sondern ganze Proteinkomplexe. Aber jedes ihrer Projekte ist ein Kunstwerk, das auf einer Menge Vorarbeiten beruht, um die richtige Detergenzmischung für jeden Analyten zu finden. Von einer generellen Methodik, jegliches Protein oder ganze Proteome in die Gasphase zu überführen und dort durch Top-down-Methoden zu messen, sind wir weit entfernt.

Auf welchem Teilgebiet der Proteomik wird Massenspektrometrie für eine personalisierte Medizin den größten Wissensgewinn ermöglichen?

Aebersold » Generell denke ich, dass wir uns durch die Genomik ein falsches Bild von biologischen Abläufen und Krankheiten angewöhnt haben. Wir wurden hierdurch geprägt zu sagen, ausschließlich die genetische Information determiniere, was passiert. Aber Zellen sind Bioreaktoren, in denen tausende Akteure – meist Proteine – gleichzeitig aktiv sind. Und gerade in der Klinik dreht sich alles um Krankheitsphänotypen als Ausprägung fehlgeleiteter biochemischer Reaktionen. Wie keine andere Technik erlaubt es die Massenspektrometrie, zelluläre Phänomene auf ihre biochemischen Ursachen zurückzuverfolgen, also näher an den funktionellen Zustand von Zellen heranzugehen. Denn Proteomik kann nicht nur sagen, ob ein Genprodukt präsent ist, sondern auch, ob es im richtigen Komplex in der richtigen Struktur im richtigen Aktivierungszustand vorliegt und mit welchen Interaktionspartnern es wechselwirkt.

Hans Lehrach, einer der Pioniere des Humangenomprojekts, erklärt auf Seite 66 von LJ 7-8/2022 (Link), dass wir von einer echten Personalisierung der Medizin im klinischen Alltag weit entfernt sind – zumindest in der Genomik. Inwieweit wird die Proteomik in Ihrer Erfahrung schon am Patientenbett eingesetzt?

Aebersold » Eine Sequenzierung von Gen-Panels wird für klinische Entscheidungswege schon verwendet. Vollständige Genom-Sequenzierungen sind dagegen noch ein Patienten-nahes Forschungsgebiet, auf dem Methoden gegenwärtig zertifiziert werden. Ihr Einsatz in der Klinik ist eher ein technisches und regulatorisches Problem. Die entscheidendere, konzeptionelle Frage lautet: Inwieweit reichen genomische Daten für klinische Voraussagen aus? Ich glaube, sie reichen nicht. Am weitesten fortgeschritten in der Anwendung genomischer Analysen ist die Onkologie. Dort existieren riesige Datenschätze von Gen- und Transkript-Sequenzen ganzer Tumoren bis hin zu Einzelzellen, die eines klarmachen: Die Situation ist unglaublich komplex. Erstens ist die Genom-Sequenz jedes Patienten verschieden. Zweitens verfügen unterschiedliche Tumorzellen über individuelle Mutationen. Daraus eine Krankheits- und Behandlungsprognose abzuleiten, ist oft kompliziert.

Für präzise klinische Aussagen braucht es also zusätzliche Information …

Aebersold » Da sich Krankheiten in verschiedenen Patienten auf verschiedenen Ebenen manifestieren – also genomisch, transkriptomisch, proteomisch und metabolomisch – müssen wir für jeden Einzelfall die für ihn zutreffenden molekularen und zellulären Konstellationen in Erfahrung bringen. Wir sollten zum Beispiel bestimmen, ob Tumorzellen im Gewebe von aktiven Immunzellen angegriffen werden, wie Tumorzellen auf Pharmaka reagieren, wie sich therapeutische Antikörper in Neutralisierungs-Komplexen verhalten und so weiter. Sicher ist Proteomik keine klinische Allerweltslösung, aber erst die Gesamtheit aller Datenebenen einer Gewebeprobe wird uns die Therapierbarkeit von Tumoren effizient einschätzen lassen können.

Damit beziehen Sie sich wahrscheinlich auf die Tumor Profiler Study, also ein dreijähriges Pilotprojekt der ETH Zürich. Welchen Stellenwert hat die Proteomik darin?

Aebersold » Für Erstpatienten ist die Genomik am aussagekräftigsten, weil definierte Initialmutationen, zum Beispiel in p53, eine Krankheit auslösen und die Therapie vorgeben. Über die Zeit werden Patienten aber häufig resistent gegen eine Frontline-Chemotherapie, weil die Fähigkeit zur DNA-Reparatur in Tumoren oft beeinträchtigt ist und ihre erhöhte Mutationsrate sie schnell verändert. Die genomische Situation von Rezidivpatienten ist dann häufig so kompliziert, dass eindeutige Therapieentscheidungen schwierig sind und jede zusätzliche Information hilft. Proteomik und funktionelle, zelluläre Parameter gewinnen an Gewicht.

Welche Informationen werden in der Tumor Profiler Study erhoben und wie?

Aebersold » Biopsie-Gewebe wird enzymatisch in ein Gemisch aus Tumorzellen, Stromazellen und Leukozyten zerlegt und verschiedenen Einzelzelltechniken von DNA- und RNA-Next-Generation-Sequencing bis hin zum Proteotyping per Massenspektrometrie unterzogen. Außerdem wird für jeden Zelltyp bestimmt, wie er auf welche Therapeutika reagiert. Zusätzlich werden Gewebeschnitte mit Imaging Mass Cytometry (IMC) analysiert. Dafür wird Gewebe gleichzeitig mit bis zu 40 Isotopen-gekoppelten Antikörpern gegen spezifische Oberflächenproteine versetzt und die Antikörper massenspektrometrisch ausgewertet. Aus der Gesamtheit der Daten können wir dann ableiten, ob eine Zelle zum Beispiel ein Lymphozyt ist, ob sie aktiv oder inaktiv ist und – da die Gewebeinformation erhalten bleibt – ob sie sich in unmittelbarer Nähe zu einer Tumorzelle befindet. Das würde darauf hindeuten, dass eine Immuntherapie funktioniert.

Reichen denn 40 Biomarker für eine fundierte Tumorcharakteristik aus?

Aebersold » Sicher nicht, aber dabei handelt es sich um Oberflächenmarker, die aus der Literatur bekannt sind und gegen die Antikörper existieren. Für Blutzellen zum Beispiel sind genug Antikörper gegen CD-Moleküle vorhanden. Für Tumorzellen ist es dagegen schwieriger, spezifische Antikörper zu finden. Die Frage ist, was biotechnologisch möglich ist. Übrigens bewegt sich auch die Bottom-Up-Proteomik, insbesondere Data Independent Acquisition (DIA), schnell in Richtung Einzelzellmessungen. Von größeren Einzelzellen, also zum Beispiel HeLa-Zellen, können schon jetzt circa 2.000 Proteine identifiziert werden.

Was konnten Sie in den zurückliegenden drei Jahren Tumor Profiler Study lernen?

Aebersold » Entscheidend war, dass wir unser Hauptziel erreicht haben: Wir konnten zeigen, dass binnen zwei Wochen Gewebe entnommen, Daten erhoben und Schussfolgerungen in die Klinik zurückgeführt werden können, und zwar im klinischen Alltag. Unsere größte Lektion war es zu sehen, wie schwierig es ist, neue Erkenntnisse in die Klinik zu bringen, die über den Mutationsstand einzelner Gene hinausgehen. Denn 99 Prozent der molekularen, zellulären und phänotypischen Patientendaten – also etwa ein halbes Terabyte an Information pro Patient – können wir gar nicht von der Grundlagenforschung in die Onkologie vermitteln. Clustergraphen, Hauptkomponentenanalysen und ähnliche Darstellungen sind viel zu komplex, als dass wir sie dem Klinikpersonal routinemäßig binnen einer halben Stunde erklären könnten. Das ist zur Zeit nicht „actionable“.

Was wäre „actionable“?

Aebersold » Wenn sich die genomischen und proteomischen Biomarker der Patientendaten durch klare Assoziationen einem Therapieansatz zuordnen lassen. Das erreichen wir bisher nur mit einem Prozent der erhobenen Daten. Finden wir mittels einer Multilayer-Analyse eine neue Subgruppe an Patienten, die sich in gewissen molekularen oder zellulären Markern von anderen Betroffenen unterscheidet, muss die praktische Bedeutung ihrer Markerkonstellation für eine Therapieform erst in einer klinischen Studie ermittelt werden. Das kostet Zeit.

Die Schwierigkeit besteht also darin, konkrete Schlussfolgerungen aus der Datenmenge zu ziehen?

Aebersold » Genau, und zwar Schlussfolgerungen, die über eine reine Beschreibung einer Beobachtung hinausgehen. Dort stoppen ja die meisten Publikationen – also bevor es für behandelnde Mediziner interessant wird. Entsprechend wird normalerweise bisher nur in die Klinik kommuniziert, wie viel von einem bestimmten Protein zum Beispiel im Blutplasma vorhanden ist. Panels von Markern und deren Gewichtung sind eine große klinische Herausforderung.

Die bioinformatische Auswertung der restlichen 99 Prozent aller Patientendaten ist also gegenwärtig der größte Flaschenhals?

Aebersold » Absolut. Eigentlich ist es ja eine Errungenschaft analytischer Techniken, wenn die Datenakquisition nur zwei bis drei Wochen dauert, ihre Validierung und Auswertung aber Monate bis Jahre in Anspruch nimmt. Der größte Nachholbedarf besteht momentan darin, wie wir bestmöglich fundierte Schlüsse ziehen können – nicht nur in der klinischen Anwendung massenspektrometrischer Analysen, sondern auch in der Grundlagenwissenschaft.

Existieren überhaupt genug Proteomik-Experten, um konkrete Voraussagen in den Klinikalltag zu kommunizieren?

Aebersold » Um aus Massenspektrometern in den kommenden Jahren routineanalytische Geräte zu machen, müssen reproduzierbare Marker-Panels unter akkreditierten Bedingungen gemessen und auf ihre klinische Relevanz getestet werden. Die High-Performance-Instrumente der Forschungslabore müssen für den klinischen Alltag robust gemacht werden. Und viele Zulassungsbehörden müssen von der klinischen Relevanz und Zuverlässigkeit Proteomik-basierter Methoden überzeugt werden. All das braucht Spezialisten, die nicht forschungsorientiert sind. Entsprechend werden Studenten bis Postdocs aus Proteomik-Laboren sicher keine Schwierigkeiten bei der Stellensuche haben. Massenspektrometrie ist in der klinischen Anwendung aufregendes Neuland.

Interview: Henrik Müller



Zur Person

bild
Ruedi Aebersold legte mit seinen Arbeiten die Grundlagen für die Massenspektrometrie-basierte Proteomik und ihren Einsatz in der personalisierten Medizin. Er erhielt für seine Forschung zahlreiche Preise, zuletzt 2020 den Schweizer Wissenschaftspreis Marcel Benoist. Seit 2020 ist Aebersold Professor emeritus am Institut für Molekulare Systembiologie der ETH Zürich und leitet bis Ende 2023 die Schweizer Tumor Profiler Study.