Kein Entkommen für kleine ORFs

(21.03.2018) Programme zum Ribosomen-Profiling messen die Zahl der Translations­vorgänge an den Ribosomen. Viele solcher Ereignisse gingen ihnen jedoch durch die Lappen – bis jetzt.
Editorial
editorial_bild

(21.03.2018) Nicht alles, was an Protein-kodierenden Transkripten in einer Zelle herumschwimmt, wird auch erfolgreich translatiert. Andersherum können seltene Transkripte, die von Ribosomen massiv translatiert werden, beachtliche Mengen an Peptiden beziehungsweise Proteinen hervorbringen. Beim Ribosomen-Profiling (Ribo-seq) fischt man aus Zelllysaten die Ribosom-Transkript-Komplexe heraus, schneidet die überstehenden (nicht vom Ribosom geschützten) mRNA-Regionen weg, und streift die Ribosomen ab. Die übrigbleibenden Transkript-Stücke werden zu cDNA umgeschrieben und sequenziert. Aus der Zuordnung der Positionen und Anzahl der Stücke auf dem Referenzgenom ist zu erkennen, wo offene Leserahmen (Open Reading Frames, ORFs) liegen und wie viel Protein an diesen entsteht.

Editorial
Keine Artefakte

Problemkandidaten bei Ribo-seq-Auswertungen waren bisher kurze ORFs, insbesondere sogenannte upstream und upstream-overlapping ORFs (uORFs, uoORFs). In Transkriptom-Analysen verschwinden diese Schnipsel im Hintergrundrauschen oder werden als Artefakt abgestempelt. Diese kryptischen Genprodukte haben aber häufig wichtige zelluläre Funktionen. Eine verbesserte Ribo-seq-Methode, die ein deutsch-britisches Forscherteam um Lars Dölken vom Institut für Virologie und Immunbiologie der Universität Würzburg entwickelte, bringt auch diese kurzen ORFs ans Licht. Zudem zeigt die Gruppe, dass die entsprechenden Peptide am MHC-I-Komplex beteiligt sind und bei der Immunabwehr eine bisher unbeachtete Rolle spielen.

Das Team um Dölken entwickelte die Analyse-Software, PRICE (PRobabilistic Interference of Codon activities by an EM algorithm), um stochastische Prozesse des Ribosomen-Profilings zu modellieren. Seine Mitarbeiter fütterten das Programm mit Informationen zu annotierten, bekanntermaßen stark-translatierten ORFs und gelangten so zu einem Machine-Learning-Modell, das unter anderem potenzielle Startcodons vorhersagen kann.

Editorial
Her mit dem Computer!

Bioinformatik-Freaks können die mathematischen Details des Programms im Suppemental Data-Teil des Papers nachvollziehen. Für Biowissenschaftler genügt es zu wissen, was PRICE besser kann als andere Profiling-Programme. PRICE entlockt bestehenden Ribo-seq-Daten wertvolle Informationen, indem es das Signal-zu-Hintergrund-Verhältnis substanziell erhöht. Um bisher unbekannte kleine offene Leserahmen (sORF) aufzudecken, braucht man keine frischen Zellextrakte, sondern nur einen stinknormalen Computer.

Die Gruppe verglich PRICE mit den gängigen Ribosomen-Profiling-Programmen. Alle gingen mit demselben Datensatz, nämlich Ribo-seq-Daten von Herpes Simplex Virus 1-infizierten Fibroblasten ins Rennen. Der Anteil an Reads (Ribo-Sequenzen), die Codons zugeordnet werden konnten (coding-sequence-mapped reads), lag bei PRICE bei 94%; und damit fast doppelt so hoch wie bei den anderen Programmen. Während das durchschnittliche Signal-zu-Rauschen-Verhältnis bei den bestehenden Verfahren bei 6.3 lag, schaffte es PRICE auf über 18.

50 Mal schneller

Nur PRICE identifizierte, im Parallelvergleich mit sechs bestehenden Verfahren, uORFs sowie uoORFs. Zudem rechnet die neue Methode dreißig- bis fünfzigmal schneller als die Vorgänger-Programme.

Um die Spezifität der sORF-Identifizierung zu beurteilen, gingen die Forscher folgendermaßen vor: Sie ermittelten mittels Immuno-Affinitätsreinigung und Massenspektrometrie das Peptidom humaner Fibroblasten. Alle aufgedeckten Peptide stellten sie dem Pool der gefundenen ORFs mit den dazugehörigen Translationsraten gegenüber. Bei großen annotierten ORFs war die Anzahl verifizierter Peptide sowohl im gesamten Proteom als auch im MHC-I-spezifischen Proteom proportional zur Translationsrate erhöht. Logisch: Je stärker translatiert wird, umso mehr Translationsprodukt liegt vor. Im MHC-I-Peptidom identifizierte PRICE die sORFs von etwa einem Drittel der validierten Proteine. Das heißt, viele Peptide in MHC-I-Komplexen stammen von sORFs. Bioinformatische Prognosen sagen genau für diese Peptide eine hohe Bindeaffinität zu HLA-Allelotpyen vorher.

Egal ob „normales langes Transkript“ oder sORF, die translatierten Genprodukte folgen offenbar demselben Weg bei ihrem Einbau in MHC-I-Komplexe. Das heißt zugleich, dass viele sORFs bisher zu Unrecht als Artefakt beziehungsweise kryptische Genprodukte verworfen wurden.

Wer PRICE ausprobieren möchte, findet die Software unter: https://github.com/erhard-lab/price

Andrea Pitzschke



Letzte Änderungen: 21.03.2018