Info

Protein-Labeling mit
künstlicher Intelligenz

(23.03.2022) Die Software Proto verrät, welche Chemie für die Fluoreszenzmarkierung von Proteinen am besten passt. Ihre Entwickler stellen sie vor.
editorial_bild

Info

Wechselwirkungen zwischen Proteinen steuern biologische Prozesse im menschlichen Körper. Genaue Einblicke in diese Vorgänge sind notwendig, um Krankheiten zu verstehen und neue Medikamente entwickeln zu können. Im Labor wird deshalb die Bindungsneigung von Molekülen zu Proteinen gemessen. Für den Nachweis und die Messung dieser Interaktion ist eine Markierung nötig, meist mithilfe eines Farbstoffs. Doch welcher Farbstoff stört die Messung am wenigsten?

Das Münchner Unternehmen NanoTemper Technologies veröffentlichte gemeinsam mit dem Dresdner Start-up PharmAI die KI-basierte Anwendung Proto, die Forschende beim effektiven Markieren von Proteinen unterstützt. Die kostenlose Web-Applikation schlägt Anwendern den für ihre Messung geeigneten Farbstoff vor. So sparen sie Zeit und Kosten.

Info

Komplexe Entscheidung

Die Wahl der am besten geeigneten Fluoreszenz-Labeling-Strategie ist komplex. Sie hängt unter anderem von den verfügbaren und Oberflächen-zugänglichen reaktiven Seitenketten der Aminosäuren ab. Oftmals sollen bestimmte Regionen der Proteinoberfläche von der Markierung unbeeinflusst bleiben, beispielsweise Bindestellen von Liganden oder flexible Abschnitte, die für die Funktion des Proteins wichtig sind. Das ist alles andere als trivial. Der Experimentator muss sich mit der 3D-Struktur des Zielproteins vertraut machen, die Oberfläche auf zugängliche Lysine und Cysteine untersuchen und Regionen ausschließen, die vom Label nicht blockiert werden sollen.

Dieser gesamte Prozess wird mit Proto vollständig abgebildet. Die Web-Anwendung ist einfach zu bedienen und schafft zusätzliches Vertrauen in die Ergebnisse einer Messung. Proto setzt hierfür künstliche Intelligenz und Data-Mining-Technologien ein. Der Wissenschaftler muss im ersten Schritt das Protein angeben, das mit einem Farbstoff markiert werden soll. Es wird durch die UniProt Accession Number eindeutig identifiziert. UniProt, das zentrale Register für Proteine, bietet vielfältige Informationen, zum Beispiel hinsichtlich Nomenklatur oder Funktion von Sequenz-Abschnitten sowie zu Expressionsdaten in Zelltypen und Geweben.

Info

PDB und Alphafold

Im nächsten Schritt überprüft die Logik im Hintergrund, ob und in welcher Qualität 3D-Strukturdaten des Proteins vorliegen. Dazu wird auf zwei Quellen zurückgegriffen. Die bevorzugte Quelle ist die RCSB-Protein-Datenbank (PDB), die im Moment mehr als 180.000 Proteinstrukturen enthält, die hauptsächlich aus experimentellen Methoden zur Strukturbestimmung stammen, wie Röntgenkristallstrukturanalyse, NMR-Spektroskopie und Elektronenmikroskopie. Doch die Zahl der Proteine ist mit 70.000 in der Datenbank immer noch übersichtlich.

Diese Lücke wird durch das Proteinstruktur-Vorhersageprogramm AlphaFold geschlossen. Alphafold ist eine KI-Software des zur Google-Mutter Alphabet gehörenden Londoner Unternehmens DeepMind. Im November 2021 hat DeepMind zusammen mit dem EMBL-EBI die mit AlphaFold vorhergesagten Strukturen öffentlich und gemeinfrei zugänglich gemacht [siehe dazu auch den LJ-Artikel „Aminosäuresequenz rein, Proteinstruktur raus“]. Kurz darauf begann das Team von PharmAI diese Strukturdaten in Proto zu integrieren. Für die Vorhersage einer Proteinstruktur auf Basis der Aminosäuresequenz des Proteins nutzt AlphaFold Deep Learning – also mehrschichtige künstliche neuronale Netze, die von der Verschaltung der Neuronen im menschlichen Gehirn inspiriert sind. Proto greift auf insgesamt über 700.000 Proteinstrukturen zu und ist eine der ersten kommerziellen Anwendungen von AlphaFold.

Drei Auswahlmöglichkeiten

Wurden von Proto im ersten Schritt geeignete Strukturdaten identifiziert, werden dem Nutzer alle gesammelten Informationen bereitgestellt, die er benötigt, um Regionen in dem Protein auszuwählen, die durch das Label unbeeinflusst bleiben sollen. Er kann zwischen drei Möglichkeiten wählen, diese Region zu bestimmen: anhand eines oder mehrerer Liganden, mithilfe der verfügbaren UniProt-Annotationen oder über die Auswahl von Aminosäuren auf Sequenzebene.

Die neuartige Labeling-Vorhersage ist der erste wichtige Schritt, um Experimente mithilfe künstlicher Intelligenz zu optimieren. Die Forschenden sparen Zeit, weil aufwendige Untersuchungen zur Validierung der gewählten Markierung entfallen. Das reduziert Kosten und vor allem auch den Verbrauch von Chemikalien.

Die Lösung bietet zudem Ansätze für neue Ideen, etwa die Entwicklung und Integration moderner KI-gestützter Algorithmen für das Screening geeigneter Wirkstoff-Kandidaten. Die Reduzierung der Anzahl der Kandidaten in Kombination mit der hohen Messgeschwindigkeit moderner Geräte könnte hierbei ein entscheidender Faktor werden. Proto ist als Web-App unter https://proto.nanotempertech.com verfügbar.

Christina Wolf (Data Scientist bei NanoTemper) & Joachim Haupt (Geschäftsführer von PharmAI)

Mit Nanotemper sprachen wir vor gut einem Jahr über Zigarettenfabriken, Temperaturschwankungen und Wissenschafts-gefärbte Namen.

Bild: Pixabay/geralt