Editorial

Dunkle Proteine

(8.2.16) „Dunkles Proteom“ lautet das Stichwort des Monats im aktuellen Heft. Die Chemikerin Andrea Schafferhans versucht, mit Statistik und Bioinformatik Licht ins Dunkel zu bringen.
editorial_bild

Über die Struktur vieler Proteine und Proteinabschnitte weiß man nichts. Die Gesamtheit dieser unerforschten Sequenzen bezeichnen Forscher auch als dark proteome, analog zur „Dunklen Materie“ der Astrophysiker. Im neuen Stichwort-Artikel stellen wir ein aktuelles PNAS-Paper vor, an dem auch Andrea Schafferhans mitgeschrieben hat (PNAS 112: 15898-903). Schafferhans arbeitet an der TU München in der Gruppe von Burkhard Rost.

Laborjournal: Wie können denn Proteinsequenzen so geheimnisvoll sein? Über Genomanalysen kann man doch proteinkodierende Abschnitte ermitteln und kennt dann die Aminosäurefolge. Außerdem weiß man, dass bestimmte Aminosäuren typische Strukturen bilden, wie Beta-Faltblatt oder irgendwelche Helices. Wie kann es sein, dass trotzdem so vieles „im Dunkeln“ liegt?

Andrea Schafferhans: Naja, es gibt zwar Methoden, um Proteinstrukturen vorherzusagen. Bei dem, was Sie jetzt meinen, bekommt man aber nur Sekundärstrukturen. Das bringt uns nicht viel weiter. Denn selbst wenn man diese Sekundärstruktur kennt, will man ja auch etwas über die dreidimensionale Anordnung wissen. Es gibt zwar sogenannte ab-initio-Methoden, die direkt aus der Aminosäurefolge eine 3D-Struktur errechnen. Die werden auch immer besser und haben in einzelnen Fällen erstaunliche Erfolge. Trotzdem sind diese Verfahren noch lange nicht so weit, dass man sich wirklich auf sie verlassen kann.

Editorial

Das bedeutet, wir können das räumliche Aussehen eines Proteins nur dann kennen, wenn wir es z.B. röntgenkristallografisch oder elektronenmikroskopisch untersucht haben. Wie groß ist denn diese „Dunkle Materie“ im Proteom? Können Sie das irgendwie abschätzen?

Schafferhans: Zu etwa fünf Prozent der bekannten Proteinsequenzen ist experimentell eine Struktur bestimmt worden. Es gibt eine große Sequenzdatenbank für Proteine, die heißt UniProt. Innerhalb von UniProt gibt es eine deutlich kleinere Datenbank namens Swiss-Prot. Und darin enthalten sind die gut beschriebenen Sequenzen, die ich meine. Bei denen kann man ziemlich sicher sein, dass sie auch wirklich existieren.

Also enthält Swiss-Prot nur Proteine, die man auch experimentell irgendwann einmal untersucht hat und bei denen man davon ausgehen kann, dass sie auch wirklich von Zellen synthetisiert werden.

Schafferhans: Ja, genau. Wenn man die ganze UniProt-Datenbank nimmt, dann ist der Anteil der wirklich bestimmten und strukturell bekannten Proteinsequenzen noch sehr viel kleiner. Aber wir konzentrieren uns erst mal nur auf die SwissProt-Sequenzen. Mit dieser Datenbank haben wir auch in unserem Paper gearbeitet. Und da können wir eben sagen: Für fünf Prozent ist irgendwann einmal eine Struktur bestimmt worden. Swiss-Prot sammelt auch zusätzliche Daten über Proteinsequenzen. Zu Thrombin beispielsweise würden wir dann auch finden, wo das aktive Zentrum liegt und wo irgendwelche modifizierten Reste sind. In Swiss-Prot geht es also um Proteine, die auch schon mal in Papern beschrieben worden sind.

Jetzt gibt es noch die Datenbank Aquaria, an deren Aufbau auch die AG Rost aus München mitgewirkt hat. Was hat es damit auf sich?

Schafferhans: Aquaria ordnet Sequenzen bereits bekannten Proteinstrukturen zu ("Mapping"). Weil ähnliche Sequenzen ähnliche Strukturen annehmen, kann man damit modellieren und ausrechnen, welche Strukturen wahrscheinlich sind. Das haben wir jetzt erst mal für sämtliche Swiss-Prot-Sequenzen gemacht.

Das bedeutet, dass Aquaria auf bereits bekannte Strukturen zugreifen und diese vergleichen muss, damit solche Voraussagen möglich sind.

Schafferhans: Dafür gibt es bereits eine andere große Datenbank namens PDB. Die sammelt bekannte Proteinstrukturen. Aquaria kann im Browser darstellen, wie eine Sequenz auf die PDB-Struktur mappt. Das ist kein ganz exaktes Modell, vor allem dann nicht, wenn die Sequenzen relativ unterschiedlich sind. Aber es hilft den Experimentatoren dabei, zumindest eine Abschätzung vorzunehmen, welcher Teil der Proteins zum Beispiel auf der Zelloberfläche sitzen könnte.

Aquaria haben Sie auch in Ihrem Paper über das Dunkle Proteom genutzt.

Schafferhans: Ja. Die ursprüngliche Idee war ja, dass man leicht Strukturinformation finden kann. Als wir die Aquaria-Datenbank mit den Swiss-Prot-Daten fertig hatten, haben wir uns gedacht: Jetzt können wir das ganze doch mal umdrehen und schauen, über welche Proteine wir gar nichts wissen.

Nun sprechen Sie beim Mapping von Wahrscheinlichkeiten. Wann ist eine Sequenz denn nun „dunkel“ und wann nicht?

Schafferhans: In dem Paper sprechen wir dann über dunkle Proteine, wenn wir zu keinem einzigen Rest dieses Proteins eine Übereinstimmung in PDB finden. Das wäre dann zu 100 Prozent dunkel.

Im Paper differenzieren Sie noch weiter. Zum Beispiel kann ein Teil eines Proteins sehr genau in PDB mappen, ein anderer Teil desselben Proteins ist aber vielleicht unbekannt. Und es gibt ein Kontinuum zwischen 100-prozentiger Übereinstimmung und überhaupt keinem Mapping. Also ist das Proteom in Ihrem Paper nicht bloß schwarz-weiß, sondern hat auch Grautöne.

Schafferhans: Dazu haben wir viele Abbildungen in der Publikation, in denen auf einer Achse sozusagen die Dunkelheit aufgetragen ist, und auf der anderen Achse eine andere Eigenschaft, beispielsweise der Anteil an Membranresten. Da haben wir dann nach Korrelationen gesucht.

Es gab ja schon vor Ihrer Arbeit Hypothesen, dass im Dunklen Proteom bestimmte Domänen besonders stark vertreten sind.

Schafferhans: Proteine sind dann dunkel, wenn besonders wenig Wissen über diese Strukturen gesammelt worden ist. Da gibt es so ein paar Standardgründe, die Kristallographen gern anführen. Zum Beispiel sagt man, dass man umso weniger über ein Protein weiß, desto mehr Transmembranreste enthalten sind. Weil Transmembranreste und Membranproteine im Allgemeinen schwerer kristallisieren.

Konnten Sie das in Ihrer Analyse bestätigen?

Schafferhans: Nein. Unser Paper sagt: Solche Erklärungen tragen nur einen gewissen Teil dazu bei, warum es Proteine gibt, über die wir relativ wenig wissen. Aber das erklärt es nicht vollständig. Das gilt auch für ungeordnete Proteine.

Ungeordnete Proteine?

Schafferhans: Ja. Ungeordneten Proteinen hat man erst in den letzten zehn Jahren größere Bedeutung zugeschrieben. Als ich studiert habe, war das noch ziemlich exotisch. Damit sind Proteine gemeint, die normalerweise nicht in einer geordneten 3D-Struktur vorliegen, sondern erst dann eine bestimmte Faltung annehmen, wenn sie ihre Funktion erfüllen.

Da wäre es ja eigentlich naheliegend, dass man über deren Struktur nicht viel weiß und sie zum dunklen Proteom zählen.

Schafferhans: Aber auch da haben wir nicht gesehen, dass diese Unordnung das Dunkle Proteom ausreichend erklären kann. Wir stellen halt einfach fest, dass es Proteine gibt, über die wir nichts wissen. Und wir haben keine Ahnung, warum wir nichts über sie wissen. Waren sie bisher einfach zu uninteressant? Oder entziehen sie sich aus irgendwelchen anderen Gründen der Strukturanalyse? Vielleicht weil sie schwerer zu kristallisieren sind?

Sie haben aber gesehen, dass sekretierte Proteine überdurchschnittlich häufig im Dunklen Proteom repräsentiert sind. Haben Sie dafür Erklärungen.

Schafferhans: Nein, wir haben einfach nur versucht, die Proteine zu klassifizieren und zu schauen, ob wir irgendetwas Typisches finden. Aber es ist schon ein sehr weiter Bereich, über den die dunklen Proteine streuen. Wenn man dann schaut, für welche Proteinfunktionen man mehr Dunkelheit findet, als man es durch Zufall erwarten würde, dann sehen wir ein paar Eigenschaften, die wir im Paper aufgelistet haben. Dabei fallen die sekretierten Proteine besonders auf. Umgekehrt finden wir relativ wenige typische Housekeeping-Gene. Aber das ist auch naheliegend, denn mit denen haben sich Forscher ja schon viel befasst.

Im Dunklen Proteom gibt es viele Proteine zu denen man keine Homologe kennt. Sind also dunkle Sequenzen häufig solche Proteinabschnitte, die evolutionär recht jung sind?

Schafferhans: Möglicherweise. Es wäre auch plausibel, dass man über solche Proteine weniger weiß. Denn vieles in der Wissenschaft läuft über Analogieschlüsse. Wenn es zahlreiche Homologe zu einem Protein gibt, ist es auch wahrscheinlicher, dass man sich die öfter angeschaut und mehr über sie herausgefunden hat.

Gibt es ansonsten Hinweise auf irgendeine intrinsische Eigenschaften, die die meisten dunklen Proteine miteinander teilen?

Schafferhans: Das können wir aufgrund unserer Daten noch nicht beantworten. Wir wollten mit dem Paper in erster Linie Fragen aufwerfen und den Forschern Richtungen zeigen, in denen es noch Sachen zu entdecken gibt.

 

Interview: Mario Rembold

 Foto: A. Schafferhans / privat

 



Letzte Änderungen: 03.03.2016