Das Dunkle Proteom

von Mario Rembold (Laborjournal-Ausgabe 1, 2016)


Stichwort
Illustr.: chaikovsky2 / Deviant Art

Editorial

Dunkle Materie: So nennen Astrophysiker etwas, von dem wir nur wissen, dass es Masse hat; für unsere Teleskope ist diese geheimnisvolle Materie unsichtbar. Auch Biochemiker sind vom anschaulichen Vokabular der Leschs und Hawkings inspiriert. Zum Beispiel greift Michael Levitt 2009 die Analogie eines „Protein-Universums“ auf. Sequenzen, die keine Ähnlichkeit mit bereits bekannten Domänen-Profilen zeigen, bezeichnet Levitt als „dark matter“ im Kosmos der Eiweiße (PNAS 106: 11079-84).

Es gibt sie, aber wozu?

Heute sprechen Forscher gern vom „Dunklen Proteom“, wenn sie die Gesamtheit jener Sequenzen aus Proteinen meinen, über die wir so gut wie nichts wissen – außer, dass es sie gibt. Biochemiker brachten unterschiedliche Erklärungen ins Spiel, was es mit diesen unerforschten Sequenzen auf sich haben könnte. Forscher der TU München sind der Sache jetzt sys­tematisch nachgegangen. Zusammen mit Kollegen aus Portugal und Australien haben sie unlängst ein Paper in PNAS zu einigen „unexpected features“ des dunklen Proteoms veröffentlicht (Vol 112:15898-903). Für ihre bioinformatischen Analysen nutzten sie eine Proteindatenbank namens Aquaria, die ebenfalls unter bayerischer Mitwirkung entstand und weiterentwickelt wird.

Editorial
Datenbank-Pingpong

„Aquaria mappt Sequenzen auf Proteinstrukturen“, erklärt Koautorin Andrea Schafferhans, Chemikerin an der Fakultät für Informatik der TU München. Das Team hatte Aquaria mit den Daten aus einer anderen Proteindatenbank gefüttert: Swiss-Prot. „In Swiss-Prot sind gut beschriebene Sequenzen gesammelt, von denen man ziemlich sicher weiß, dass sie auch wirklich existieren“, so Schafferhans. Die Autoren wollten in ihrer Analyse nämlich nur Proteine erfassen, die auch tatsächlich synthetisiert werden. Aminosäurefolgen, die lediglich über Genomanalysen vorausgesagt sind, werden beiseite gelassen. Für das Mapping greift Aquarius schließlich auf eine weitere Datenbank zu, die Protein Data Bank (PDB). Darin sucht der Algorithmus dann zu jedem Abschnitt der Swiss-Prot-Proteine nach verwandten Sequenzen, deren räumliche Struktur bekannt ist. „Weil ähnliche Sequenzen ähnliche Strukturen annehmen, kann man modellieren und wahrscheinliche Strukturen errechnen“, begründet Schafferhans.

Manche Proteinregionen sind „grau“

Nun gibt es keine eindeutige Definition, wann eine Aminosäuresequenz Teil des dunklen Proteoms ist. Die Autoren wählen daher eine differenziertere Einteilung. Passt ein Abschnitt aus einem Protein exakt zu einer Sequenz, deren Tertiärstruktur beschrieben ist, sprechen sie von einer „PDB-Region“ – eindeutig nicht Bestandteil des dunklen Proteoms. Als „graue Regio­nen“ bezeichnen sie Sequenzen, zu denen es zwar Treffer in PDB gibt, allerdings mit Unterschieden bei einzelnen Aminosäuren. Gelingt kein Matching, hat man es mit einer „dunklen Region“ zu tun. Besteht ein Protein komplett aus dunklen Regionen, dann ist es ein „dunkles Protein“.

Folge der Unordnung?

Aber warum sind manche Proteine oder Proteinabschnitte dunkel? Mit ihren Analysen wollten die Forscher gängige Erklärungsversuche überprüfen. Zum einen hatte man Transmembrandomänen im Verdacht. Deren Aussehen lässt sich nämlich nicht so leicht bestimmen wie die Tertiärstruktur cytoplasmatischer Abschnitte. Weiterhin glaubt man, dass viele Sequenzen des dunklen Proteoms aus ungeordneten Proteinen stammen. Das sind Proteine, die erst dann ihre Konformation einnehmen, wenn sie auf ihre Partnermoleküle treffen und ihre eigentliche Funktion ausüben. Allein in wässriger Umgebung falten sich diese ungeordneten Proteine aber nicht zu definierten räumlichen Strukturen.

Überraschenderweise konnten die Autoren diese Zusammenhänge nicht bestätigen. Lediglich in Bakterien und Archaeen waren dunkle Abschnitte bei Transmembranproteinen überrepräsentiert, bei Eukaryoten und Viren hingegen nicht. Transmembranregionen erklären das dunkle Proteom also nicht hinreichend. Ebenso ist der größte Teil des dunklen Proteoms nicht ungeordnet. Unter den dunklen Proteinen ist der Anteil ungeordneter Proteine nur unwesentlich höher als bei Proteinen mit bekannter Struktur.

Kaum dunkle Proteine im Cytoplasma

Die Analyse enthüllte dafür andere Zusammenhänge: Dunkle Proteine findet man am häufigsten außerhalb der Zelle; es handelt sich also meist um sekretierte Proteine. Außerdem sind dunkle Proteine im Endoplasmatischen Retikulum überrepräsentiert. Auffällig geringer hingegen ist die Wahrscheinlichkeit, im Cytoplasma auf ein dunkles Protein zu stoßen.

Ob es nun intrinsische Eigenschaften gibt, die ein Protein „dunkel“ machen, könne man anhand der jetzt vorliegenden Daten nicht beantworten, betont Schafferhans. „Wir haben nur wenige dieser typischen Housekeeping-Gene im dunklen Proteom“, stellt sie fest, ist darüber aber wenig überrascht: „Mit denen haben sich die Forscher ja schon viel befasst.“ Die dunklen Sequenzen könnten also vor allem jene Proteine sein, die für die Wissenschaft bislang einfach weniger interessant waren. Dazu passt, dass es zu vielen dunklen Proteinen kaum oder keine Homologe gibt; womöglich sind es also evolutionär junge Moleküle, die eher spezielle Aufgaben erfüllen. Momentan könne man da aber nur spekulieren, so Schafferhans. „Wir wollten mit dem Paper in erster Linie Fragen aufwerfen und den Forschern Richtungen zeigen, in denen es noch Sachen zu entdecken gibt.“ Wahrscheinlich bringen künftige Arbeiten mehr Licht ins Dunkel.



Letzte Änderungen: 28.01.2016

Editorial

Editorial