Aus der zweiten Reihe ins Rampenlicht - short Open Reading Frames und Mikroproteine

Mihaela Bozukova


Editorial

(15.05.2023) Lange Zeit ging man davon aus, dass kurze Offene Leserahmen (sORF) nur in nicht-codierende RNA transkribiert werden. Dank neuer Detektions-Methoden weiß man inzwischen, dass viele sORFs funktionale Mikroproteine codieren, die in unterschiedlichen zellulären Prozessen wichtige Rollen spielen.

Viele Forscher und Forscherinnen träumen davon, ein neues Protein im Menschen zu finden. Für die meisten wird dieser Traum jedoch nicht in Erfüllung gehen: Seit der Veröffentlichung der menschlichen Genomsequenz durch das Human Genome Sequencing Consortium im Jahr 2003 hat sich die Zahl der annotierten, Protein-codierenden Gene nicht wesentlich verändert (Nature 431: 931-45). Aktuell geht man von 19.750 Proteinen aus, tatsächlich nachgewiesen sind 18.407 (J. Proteome Res. 22 (4): 1024-42).

Doch es wird zunehmend klarer, dass eine Protein-Klasse bisher übersehen wurde: Proteine, die von kleinen Offenen Leserahmen (small Open Reading Frames, sORFs) im Genom codiert werden und kürzer als einhundert Aminosäuren sind. Diese sogenannten Mikroproteine sind „small at birth“, werden also nicht wie andere kleine Proteine nach der Synthese in kleinere Peptide prozessiert, sondern bereits „klein geboren“.

Da Start- und Stopp-Codons zufällig im gleichen Reading Frame auftreten können, existieren im menschlichen Genom abertausende sORFs. Rein statistisch betrachtet ist es wahrscheinlicher, diese in einem kürzeren Abstand zu finden als in einem längeren. Wie kommt es dann, dass sORFs und ihre Produkte, die Mikroproteine, bisher übersehen wurden?

Mikroproteine
Mikroproteine erfüllen verschiedene Aufgaben in der Zelle und regeln unter anderem auch den Metabolismus in Fettgeweben. llustr.: Salk Institute

Editorial
Überholte Definition

Die historische Definition eines Protein-codierenden Gens forderte eine ORF-Länge von mindestens einhundert Codons. Man nahm an, dass kleinere ORFs keine funktionellen Proteine produzieren würden. Dabei hätte man es eigentlich besser wissen müssen: Proteinkomplexe wie die ATP-Synthase oder RNA-Polymerase, die schon vor Jahrzehnten charakterisiert wurden, enthalten Protein-Untereinheiten, die kleiner als einhundert Aminosäuren sind.

Zu Beginn des 21. Jahrhunderts stellten Forscher und Forscherinnen zum ersten Mal in Frage, dass kleine Proteine nur nach der Prozessierung von größeren Vorläufern entstehen. 2007 untersuchte Yuji Kageyamas Team am Okazaki Institute for Integrated Bioscience, Japan, das Drosophila-Gen polished rice (pri), Juan Pablo Cousos Gruppe nahm sich an der University of Sussex das Drosophila-Gen tarsal-less (tal) vor. Beide Gene waren bis dahin als nicht-codierende RNAs im Genom annotiert (Nat. Cell Biol. 9: 660-65; PLoS Biol 5(5): e106). Die Forschenden stellten jedoch fest, dass die zwei Gene in Wirklichkeit in funktionale Peptide translatiert werden, die entscheidend an der Entwicklung der Fruchtfliege beteiligt sind. Die zwei Studien belegten zum ersten Mal, dass sORFs kleine, funktionsfähige Proteine produzieren können.

Mikroproteine können verschiedenste Funktionen in der Zelle ausüben. Sie regulieren zum Beispiel den Stoffwechsel, das Zellwachstum, spezifische Prozesse wie den mRNA-Abbau oder die mitochondriale Translation. „Die Erkenntnis, dass diese bisher unerforschten kleinen Proteine in unserem Genom codiert sind, war für mich bahnbrechend und sehr aufregend“, erzählt Thomas Martinez, Assistant Professor an der University of California, Irvine.

Mithilfe neu entwickelter Methoden suchen Martinez und andere Forscher und Forscherinnen systematisch nach Mikroproteinen. Eine der entscheidenen Technologien ist das Ribosome Profiling (Ribo-seq), bei dem ausschließlich mRNA-Fragmente sequenziert werden, die aktiv von einem Ribosom translatiert werden. Als Ergebnis erhält man eine Momentaufnahme aller translatierten Regionen im Genom. „Die Ribo-seq-Daten brachten eine entscheidende Erkenntnis: Das Ribosom sitzt nicht nur auf dem sogenannten main ORF, sondern auch auf den kleineren ORFs, vor oder hinter dem main ORF“, erläutert Simon Elsässer, der als Gruppenleiter am Karolinska Institutet in Schweden an Mikroproteinen forscht. Dieser Aha-Moment löste eine „Goldgräberstimmung“ aus, erinnert sich Elsässer, in deren Verlauf sich immer mehr Labore auf die Suche nach sORFs und Mikroproteinen machten.

Thomas Martinez (r.)
Thomas Martinez (r.) untersuchte in Alan Saghatelians Labor am Salk Institute for Biological Studies in La Jolla, USA, die Funktion von Mikroproteinen beim Fettstoffwechsel von Mäusen Foto: Salk Institute

Tausende translatierte sORFs

Um die gefundenen Protein-codierenden sORFs zu katalogisieren, schlossen sich Forschergruppen aus zwanzig internationalen Institutionen zusammen. Unterstützt wurden sie von großen Organisationen wie Ensembl/GENCODE, dem HUGO Gene Nomenclature Committee (HGNC), UniProtKB, der Human Proteome Organization (HUPO) sowie dem PeptideAtlas Project. Das Forschungskonsortium hat insgesamt sieben verschiedene Ribo-seq-Datensätze aus menschlichen Zellen und Geweben konsolidiert. Herausgekommen ist ein standardisierter Satz von mehr als 7.200 translatierten sORFs (Nat. Biotechnol. 40: 994-99).

Simon Elsässer
Simon Elsässer entwickelte mit seiner Gruppe am Karolinska Institutet in Schweden eine Klick-Chemie-basierte Methode zur Fluoreszenzmarkierung von Mikroproteinen Foto: Karolinska Institutet

Ensembl-GENCODE hat den ORF-Katalog bereits in seine Datenbank integriert, weitere Datenbanken wie UniProt oder HGNC wollen folgen. Dieses erweiterte „Vokabular“ des menschlichen Genoms kann Forschern und Forscherinnen als Basis dienen, um die Funktionen von Mikroproteinen genauer zu untersuchen. „Ich erwarte aber nicht, dass alle sORFs funktionelle Proteine produzieren,“ bremst Martinez allzu große Euphorie. „Lediglich ein Bruchteil wird eine Funktion haben. Wie groß er ist, bleibt noch abzuwarten.“ Wenn ein sORF in eine Peptidsequenz translatiert wird, bedeutet das nicht automatisch, dass das entsprechende Mikroprotein eine Funktion in der Zelle ausübt. Die sORF-Translation könnte auch andere, nahe gelegene ORFs regulieren – indem sie zum Beispiel das Ribosom „beschäftigt“, um es von anderen Regionen fernzuhalten.

Es bestehe auch die Möglichkeit, dass sORFs eine wichtige Rolle bei der Evolution neuer Proteine spielen, erklärt Elsässer: „Ein Organismus könnte sORFs als Sequenz-Pool nutzen, der unter bestimmten Bedingungen evolutionär vorteilhaft sein könnte.“ Von den knapp 7.200 katalogisierten sORFs sind neunzig Prozent evolutionär noch sehr jung, die meisten lassen sich nur bis zu Primaten zurückverfolgen, falls dies überhaupt möglich ist (Mol. Cell 83: 994-1011). „Ich weiß nicht, wie sich der Mensch evolutionär entwickeln wird, aber in einer späteren Entwicklungsstufe könnten solche Mikroproteine eine Funktion haben,“ spekuliert Martinez.

Forschende suchen häufig mit heuristischen Methoden nach der Funktion von Mikroproteinen. Sie untersuchen zum Beispiel, ob und wie das Protein auf transkriptioneller oder translationeller Ebene reguliert wird – eine aktive Regulation deutet meist auf eine Funktion hin. Auch die Lokalisation innerhalb der Zelle oder eine vorhergesagte Struktur können Hinweise liefern. So ist etwa eine stabile Struktur häufig auch mit einer Funktion verbunden. „Eine stabile Struktur entsteht evolutionär betrachtet nicht einfach so“, ist sich Elsässer sicher.

Für größere Proteine lässt sich die Struktur anhand der Sequenz mithilfe künstlicher Intelligenz vorhersagen. Die Strukturen, die Vorhersageprogramme wie AlphaFold für manche Mikroproteine berechnen, beschreibt Martinez jedoch als „Spaghetti“ – sie sind nicht mehr als eine Ansammlung ungeordneter Stränge. Die Aminosäure-Zusammensetzung von Mikroproteinen ist nämlich anders als bei ihren größeren Verwandten: Sie enthalten mehr Alanin, Glycin, Prolin und weniger saure Aminosäuren wie Aspartat und Glutamat. Sie erinnern damit an ungeordnete Proteine (Intrinsically Disordered Proteins). „Daher denken wir, dass Mikroproteine wahrscheinlich auch von Natur aus ungeordnet sind. Das bedeutet aber nicht, dass sie keine Struktur annehmen können, sobald sie an ein anderes Protein binden“, sagt Martinez. Aber das sei nicht leicht vorherzusagen.

Direkter Nachweis mit der Massenspektrometrie

Der ultimative Beleg für ein funktionales Mikroprotein ist alles andere als trivial, gelingt aber in vielen Fällen mit der Massenspektrometrie: „Die Massenspektrometrie ist sehr wichtig, um Mikroproteine zu erforschen“, erklärt Martinez, „weil man das Protein damit direkt nachweisen kann. Interessant ist, dass es eine große Lücke gibt zwischen dem, was wir mit Ribo-seq finden, und dem, was wir mit der Massenspektrometrie erfassen.“ Dabei formt er mit seinen Händen ein Venn-Diagramm aus zwei Kreisen, die sich nur wenig überschneiden.

Bei der Massenspektrometrie wird ein Protein mithilfe eines Enzyms in einzelne Peptidbausteine zerlegt. Häufig wird dazu Trypsin verwendet, das nach den basischen Aminosäure-Resten Lysin und Arginin spaltet. Die Human Proteome Organization (HUPO) hat in stringenten Regeln festgelegt, was man basierend auf Massenspektrometrie-Daten als Protein bezeichnen darf (Nat. Commun. 11: 5301). So müssen mehrere Peptide eines Proteins und auch mehrere Spektren pro Peptid detektiert werden. Bei Mikroproteinen erhält man aber aufgrund ihrer geringen Größe vielleicht nur ein einzelnes tryptisches Peptid, das im Massenspektrometer nachweisbar ist. Manchmal auch gar keins. Auch kommen Mikroproteine in geringeren Mengen vor. „Es spricht also alles gegen Mikroproteine, wenn man versucht, sie per Massenspektrometrie zu finden“, fasst Martinez die Schwierigkeit der Methode zusammen.

Ausschluss seltener Peptide

In den letzten zwei Jahrzehnten stützte sich die Proteomforschung meist auf die datenabhängige Akquisitionsstrategie (Data Dependent Acquisition, DDA). Bei dieser Form der Tandem-Massenspektrometrie werden die fragmentierten Peptide ionisiert und im ersten Spektrometer (MS1) nach ihrem Masse-Ladungs-Verhältnis (m/z) aufgetrennt. Die häufigsten Vorläufer-Ionen werden ausgewählt, mit einem Kollisionsgas in kleinere Fragment-Ionen aufgespalten und in einem zweiten Massenspektrometer (MS2) erneut aufgetrennt und detektiert. Bei der Detektion von Mikroproteinen hat diese Methode jedoch einen entscheidenden Schwachpunkt: Da nur Peptidionen ausgewählt werden, die einen vordefinierten Schwellenwert zur Analyse im MS2 überschreiten, übersieht man selten vorkommende Peptide.

Die Datenunabhängige Erfassung (Data Independent Acquisition, DIA-MS) umgeht dieses Problem. Hier werden alle Vorläufer-Ionen unabhängig von ihrer Signalstärke im MS2 fragmentiert. Das Ergebnis sind hochkomplexe MS2-Spektren, mit denen man theoretisch alle Peptidionen in einer Probe identifizieren könnte.

Lässt sich ein Mikroprotein sowohl mit Ribo-seq als auch mit der Massenspektrometrie detektieren, spricht alles für ein funktionelles Mikroprotein – der doppelte Nachweis ist allerdings selten. Protein-Tags sind eine weitere Möglichkeit, um festzustellen, ob translatierte Mikroproteine auch eine Funktion ausüben. Dazu werden Zellen mit einem Plasmid transfiziert, das den sORF sowie ein Protein-Tag beherbergt. Anschließend versucht man, das Protein nachzuweisen. „Wenn man das Protein im Western Blot detektieren kann, ist das ein Hinweis dafür, dass es echt, stabil und funktional sein könnte“, erklärt Martinez. „Es besteht jedoch die Gefahr, dass Tags wie das grün fluoreszierende Protein (GFP) die Funktion oder Lokalisation des Mikroproteins innerhalb der Zelle verändern“, gibt Elsässer zu bedenken. GFP ist immerhin dreimal so groß wie ein typisches Mikroprotein.

Inzwischen wurden jedoch verschiedene Ansätze entwickelt, die dem untersuchten Mikroprotein keine so große Last aufbürden. Bei der Split-GFP-Methode wird zum Beispiel nur ein kleiner Teil des GFPs – normalerweise der GFP-11-Strang des beta-Barrels – mit dem Mikroprotein zusammen synthetisiert. Der Rest wird separat in den Zellen exprimiert. Auf diese Weise hält man den Mikroprotein-Tag klein und kann dennoch die erprobten fluoreszenzbasierten Detektionsmethoden verwenden.

Elsässers Team hat sich aber noch eine weitere alternative Technik ausgedacht, mit der es winzige Tags an (Mikro-)Proteine anfügen kann: „Wir haben eine Methode entwickelt, mit der man Proteine mit unnatürlichen Aminosäuren am Ribosom synthetisieren kann. Damit lässt sich eine kleine, bioorthogonale chemische Gruppe spezifisch in ein Protein integrieren, die man anschließend als Reaktionspartner für einen fluoreszenten Farbstoff verwenden kann, ohne das Protein wesentlich zu vergrößern“, beschreibt Elsässer das sogenannte Single-residue Terminal Labeling (STELLA). Es nutzt eines der drei Stopp-Codons als Signal, um eine unnatürliche Aminosäure einzubauen (J. Am. Chem. Soc. 142 (47): 20080-87).

Erfindung der Natur

„Das Stopp-Codon UAG umzucodieren und damit eine zusätzliche Aminosäure in ein Protein einzubauen, ist keine Idee aus dem Labor. Diesen Prozess haben tatsächlich einige Mikroorganismen erfunden“, berichtet Elsässer. Zu diesen gehören zum Beispiel Methan bildende Archaeen und einzelne Bakterienarten, die in salzhaltigen, heißen oder anderen unwirtlichen Umgebungen leben – oder auch im menschlichen Darm. Die Mikroorganismen synthetisieren die unnatürliche Aminosäure Pyrrolysin, die vom Amber-Codon UAG codiert und durch eine entsprechende Aminoacyl-tRNA-Synthetase in das jeweilige Protein integriert wird.

Mithilfe des Pyrrolysin-Analogons führte Elsässers Team eine chemische Gruppe in das Protein ein, die anschließend durch bioorthogonale Markierung mit einem kleinen organischen Fluoreszenzfarbstoff konjugiert wird. So können die C- oder N-Termini beliebiger (Mikro-)Proteine markiert und in lebenden Zellen zum Leuchten gebracht werden.

„Der große Nachteil dieser Methoden ist aber, dass wir sie nicht im Gewebe oder in primären Zellen anwenden können, da wir in diesen Systemen einen Tag nicht einfach genetisch hinzufügen können. Hier benötigen wir einen passenden Antikörper“, merkt Elsässer an. Antikörper sind die Universal-Hilfsmittel für die Charakterisierung von Proteinen. Die kurzen Sequenzen der Mikroproteine machen es Forschern jedoch wesentlich schwieriger, eine gute immunogene Sequenz zu finden und spezifische Antikörper zu generieren – eine weitere Hürde bei der Erforschung von Mikroproteinen.

Arbeitsablauf der Datenunabhängigen Massenspektrometrie zur Identifizierung von Mikroproteinen
Arbeitsablauf der Datenunabhängigen Massenspektrometrie zur Identifizierung von Mikroproteinen. Illustr.: Salk Institute (Bild größer)

Auch an Krankheiten beteiligt

Aufgeben ist für Martinez dennoch keine Option: „Wir erforschen Mikroproteine, um zu verstehen, wie sie unsere Biologie steuern, zum Beispiel bei Krankheiten.“ Inzwischen verdichten sich die Hinweise, dass Mikroproteine auch bei pathologischen Zuständen mit von der Partie sind. „Man hat Mikroproteine gefunden, die bei Brustkrebs, Glioblastomen oder Prostatakrebs eine Rolle spielen“, berichtet Martinez, der seit September 2021 eine Forschungsgruppe mit dem Schwerpunkt „Mikroproteine und Krebs“ leitet. Mit seinen Kollegen versucht er, Mikroproteine zu identifizieren, die das Wachstum der Krebszellen beeinflussen. „Krebs ist eine schreckliche Krankheit, bei deren Bekämpfung wir schon einige Fortschritte erzielt haben. Wenn wir Proteine finden, die das Wachstum und andere Krebs-Phänotypen beeinflussen, könnten diese möglicherweise Ziele für neue Therapien sein. Es geht darum, so viele Ansatzpunkte wie möglich zu finden“, erklärt der Biologe.

Auch an Erkrankungen wie Fettleibigkeit oder Diabetes sind Mikroproteine beteiligt. Als Postdoc im Labor von Alan Saghatelian am Salk Institute in San Diego (USA) untersuchte Martinez die Rolle von Mikroproteinen in primären Adipozyten von Mäusen (Cell Metab. 35: 166-83). Das Fettgewebe ist ein wichtiges endokrines Organ, das viele Faktoren produziert und sezerniert, die die Nahrungsaufnahme und den Energiehaushalt regulieren. „Wir haben viele bisher als nicht-codierend geltende RNAs identifiziert, die für Mikroproteine codieren. Diese könnten für die Regulation des Stoffwechsels von Bedeutung sein“, vermutet Martinez, der Erstautor des oben genannten Papers ist. Die Studie ist eine wichtige Informationsquelle für Forschende, die die physiologische Funktion von Mikroproteinen weiter untersuchen wollen.

Hormone ohne Signalpeptid

„Wir konnten aber auch zum ersten Mal sezernierte Mikroproteine identifizieren“, fährt er fort. Hierfür verwendete das Team das DIA-MS-Verfahren. Ribo-seq ist bei der Detektion zirkulierender Proteine nicht zielführend, da das Serum keine Ribosomen enthält. „Wir haben über dreißig Mikroproteine im Serum gefunden. Das sind potenzielle neue Hormonmoleküle“, erzählt Martinez begeistert. Die neuen Hormon-Kandidaten sind bizarr: „Die meisten hatten keine Signalpeptide,“ berichtet Martinez. Hormone verfügen normalerweise über eine N-terminale Peptidsequenz, die sie als sekretorisch kennzeichnet.

Eines dieser neuartigen sezernierten Mikroproteine ist Gm8773. Das Spannende an diesem Protein: Eine 2021 erschienene Studie hatte gezeigt, dass es den Appetit bei Hühnern reguliert (Front. Physiol. 12: 747473). Da drängt sich natürlich die Frage auf, ob dieses Mikroprotein bei Säugetieren die gleiche Funktion erfüllt. Das kalifornische Forschungsteam konnte sie mit einem eindeutigen „Ja“ beantworten. Mäuse, bei denen das Peptidhormon direkt in die betreffende Gehirnregion injiziert wurde, hatten mehr Appetit und zeigten eine gesteigerte Nahrungsaufnahme. „Das war ein spannendes Ergebnis,“ konstatiert Martinez. „Jetzt kann man weitermachen und die Wirkung des Mikroproteins beim Menschen untersuchen.“

Mikroproteine üben offensichtlich genauso vielfältige Funktionen aus wie ihre größeren Verwandten. Sie zu erforschen, sei unerlässlich, betont Martinez: „Wie sollen wir verstehen, wie unsere Biologie und das Leben auf molekularer, zellulärer und physiologischer Ebene funktioniert, wenn wir nicht einmal wissen, welche Mikroproteine in unserer DNA codiert sind?“