Editorial

Reste-Ranking optimiert Protein-Labelling

(28.06.2023) Viele wählen die Aminosäure-Reste für das Labeln von Proteinen nach Gefühl oder Trial-and-Error aus. Schneller und besser geht’s mit dem Labelizer.
editorial_bild

Endlich sind die wochenlangen Vorarbeiten geschafft. Respektvoll nähert sich die Forscherin dem Fluoreszenz­mikroskop, legt die Probe ein und hält danach erwartungsvoll den Atem an. Aber sie sieht nur schwarz – im eigentlichen wie im übertragenen Sinn. Entsprechend groß ist der Frust darüber, beim Protein-Labelling wieder einmal auf die falsche Aminosäure gesetzt zu haben. Dabei hatte sie diese doch mit Bedacht ausgewählt.

Die unauffälligste und gängigste Strategie, ein Protein ohne Einbußen der Funktionalität oder Änderungen der Eigenschaften zu markieren, ist das Einführen eines Cystein-Rests. Er ersetzt eine Aminosäure an einer beliebigen Stelle und liefert mit der Sulf­hydryl­gruppe einen Anknüp­fungs­punkt für Malein­imid-Konjugate, die ein gewünschtes Farbstoff­molekül enthalten. Die Effizienz der Markierung kann je nach Position stark variieren, etwa weil dem Fluorophor der Zutritt aus sterischen Gründen verwehrt ist oder das Protein durch die Markierung seine Funktion verliert bzw. instabil wird. Umgekehrt kann auch die Protein­umgebung die Eigenschaften des Fluoreszenz­farbstoffes beeinflussen und zum Beispiel dessen Fluoreszenz­spektrum verschieben (spectral shift).

Editorial

Einfache Daumenregeln

Die meisten Experimentatoren versuchen Wechselwirkungen zwischen markiertem Protein und Fluorophor, die sich negativ auf den geplanten Fluoreszenz-Assay auswirken könnten, mit einfachen Daumenregeln auf ein Minimum zu begrenzen. Thorben Cordes' Team an der Ludwig-Maximilians-Universität München ging das Problem etwas systematischer an und durchforstete dazu zunächst die Literatur nach Papern, in denen erfolgreich gelabelte Proteine beschrieben werden. Publiziert werden ja nur Proteine, bei denen das Labeln geklappt hat, und die müssten doch – so verschieden sie auch sein mögen – etwas haben, was bei den restlichen weniger ausgeprägt ist.

Die Münchner fanden in der Protein­datenbank (PDB) 104 mit Strukturdaten hinterlegte Proteine mit 43.357 Resten, von denen sich 396 als geeignet für Markierungen erwiesen hatten. Aus den Strukturdaten leiteten die Bayern 28 Parameter ab, die einer der vier Kategorien zugeordnet werden können: Konservierung, Wechselwirkungen mit dem Lösungsmittel (solvent exposure), Sekundärstruktur oder Ähnlichkeit des verwendeten Cysteins mit der ursprünglichen Aminosäure. Mit frei verfügbaren Tools wie ConSurf kann man die 28 Parameter für jeden einzelnen Aminosäure-Rest eines Proteins bestimmen. Entscheidend ist die bedingte Wahrscheinlichkeit, dass sich eine bestimmte Position markieren lässt, wenn sie entsprechende Para­meter­werte aufweist.

Kombinierte Parameter

Vereinfacht lässt sich das auf das Chancen­verhältnis herunter­brechen, mit dem ein bestimmter Parameterwert an einer markierten (oder markierbaren) Position gegenüber einer Zufallsposition auftritt. Die Gruppe führte auf Re-sampling basierende Berechnungen durch, als Input dienten die 396 erfolgreich markierten Proteine sowie die 43.357 Reste der in der PDB deponierten Proteine. In erfolgreich markierten Protein­positionen sollten die einzelnen 28 Parameter von einer Gleichverteilung abweichen. Das traf auch auf viele zu. Interes­santer­weise spielte es aber keine Rolle, ob in einem homologen Protein an der gewählten Position ein natürlicher Cystein-Rest auftrat.

Um die Aussage­fähigkeit weiter zu optimieren, spielten die Forscher und Forscherinnen Kombinationen der Parameter durch. Auch hier suchten sie nach einer Konstellation, in der sich die markierten Protein(rest)e möglichst stark von einer Gleichverteilung abhoben. Das war vor allem bei Parametern innerhalb derselben Kategorie der Fall und rechtfertigte damit die Einteilung in die vier Kategorien. Am Ende konnte das Team die 28 Parameter auf vier reduzieren, die jeweils die ganze Kategorie repräsentierten. Diese vier Parameter sind: die mittlere Entfernung von der Oberfläche (mean surface distance), der Grad der Konservierung (conservation score), die Sekundärstruktur des markierten Rests und die Sekundärstruktur der mutierten Aminosäure. Für jede Position ergeben sich hieraus vier Punktwerte (Scores), die in einem Gesamt-Score münden. Je höher der Gesamt-Score, desto geeigneter sollte die betreffende Position für das Labelling sein, und desto besser ist ihr Ranking.

Online-Tool Labelizer

Dass der nüchterne mathematische Zugang der Gruppe treffsichere Markierungs­vorschläge liefert, demonstrierte sie unter anderem an zwanzig Varianten des Maltose-Bindeproteins von E. coli – die experimentell erfolgreichen Labelling-Positionen stimmten hier mit den vorhergesagten überein.

Anwender müssen sich aber nicht lange mit den statistischen Berechnungen der Münchner herumplagen, sondern können direkt zum Tool Labelizer greifen, das Cordes' Team anhand der Labelling-Analyse entwickelte. Auf der Labelizer-Website genügt es, die PDB-Identifi­kations­nummer einzutragen und aus verschiedenen Farbstoffsets (Alexa, Atto, Cy) das gewünschte Fluorophor zu wählen. Mit der Advanced-Option lässt sich die Bedeutung, die man den vier Parametern beimessen will, manuell gewichten und man kann Aminosäuren definieren, die tabu sind.

Nach der Eingabe „Start Analysis“ kann man sich erstmal zurücklehnen (es dauert eine Weile), bis als Output eine interaktive 3D-Darstellung des Proteins sowie ein Datensatz erscheint. Sofort ersichtlich ist der Gesamt-Score an jeder Position des Proteins. Separat als csv-Dateien zum Herunterladen erhält der Nutzer die Scores der vier einzelnen Parameter. Wer will, kann an dem Labelizer-Tool mitarbeiten, um seine Treffsicherheit weiter zu erhöhen. Schließlich ist auch jede fehlgeschlagene Protein-Markierung eine wichtige Information – wenngleich dies in den seltensten Fällen publiziert wird.

Der Labelizer ist auch für FRET-Vorhersagen geeignet. In diesem Fall rechnet das Programm paarweise Konstellationen von Aminosäure-Positionen durch. Der Nutzer gibt die PDB-Nummern von zwei Strukturen ein und definiert die Donor- und Akzeptor­fluorophore.

Andrea Pitzschke

Gebhardt C. et al. (2023): Labelizer: systematic selection of protein residues for covalent fluorophore labeling. bioRxiv, DOI: 10.1101/2023.06.12.544586

Bild: Labelizer-Website




Letzte Änderungen: 28.06.2023