Koaleszenztheorie

von Mario Rembold (Laborjournal-Ausgabe 10, 2014)


Editorial
Stichwort
Illustr.: DeToverbal / deviantArt

Wollte man früher verwandtschaftliche Beziehungen zwischen Arten ermitteln und Stammbäume erstellen, waren morphologische Merkmale das Beste, was man hatte. Doch das Aussehen kann täuschen, so etwa bei den damals von Linné beschriebenen heimischen Schmetterlingen Papilio levana und Papilio prorsa. Mittlerweile weiß man: es handelt sich in Wirklichkeit um ein und dieselbe Art, nur dass Frühlings- und Sommergeneration des Landkärtchens vollkommen unterschiedlich gefärbt sind. Dann wiederum gibt es Tiere, die früher in derselben taxonomischen Schublade landeten, da sie augenscheinlich gleich sind. Wie etwa die in den Regenwäldern Afrikas lebenden Halbfinger-Geckos des Hemidactylus fasciatus-Komplexes.

Wer sich heute mit Arten und Stammbäumen befasst, setzt hingegen auf DNA-Analysen. Zusammenhänge, die dem menschlichen Auge entgehen, bringt der Sequenzvergleich zutage. So etwa bei der vermeintlichen Geckoart, die sich kürzlich als Sammelsurium mindestens fünf verschiedener Spezies entpuppte (Bonn zoological Bulletin 63 (1): 1-14).

Editorial

Mittlerweile können Genetiker weltweit auf riesige Datenbanken mit digitalisierten Basenfolgen zugreifen; und wer weniger bekannte Tiere oder Pflanzen studiert, der sequenziert eben selbst – heute geht das schnell und preiswert. „Deswegen kann man sich jetzt auf Methoden stürzen, die vor zehn Jahren nur theoretisch möglich waren“, weiß Philipp Wagner, Erstautor des oben erwähnten Gecko-Papers.

Aus Eins macht Fünf

Damit meint Wagner konkret die bio­informatischen Mittel zur Auswertung des Sequenzsalats. Denn letztlich fußen die modernen Analysetools immer noch auf statistischen Modellen aus dem letzten Jahrtausend. Einer dieser mathematischen Meilensteine zur Errechnung von Stammbäumen ist die Koaleszenztheorie, die auf Arbeiten des britischen Mathematikers John Kingman in den frühen 1980er Jahren zurückgeht (Stoch. Process. Their Appl. 13, 235-48).

Die Populationsgenetiker von damals begannen mit vereinfachenden Annahmen. Denken wir etwa an das Hardy-Weinberg-Gleichgewicht, das viele Leser im Bio-LK kennengelernt haben. Dabei geht man von einer sehr großen Population einer diploiden Spezies aus, in der die Allele eines Gens keinem Selektionsdruck unterliegen und Paarungen zwischen allen Individuen gleich wahrscheinlich sind. Der aufmerksame Schüler erkannte damals einen Term aus der ersten binomischen Formel wieder, mit dem sich der Anteil der Homozygoten und Heterozygoten innerhalb der Population berechnen lässt.

Den Baum zurück klettern

Da Hardy und Weinberg aber von einem ewigen Gleichgewicht ausgingen, kommt es in deren Modell zu keiner Änderung der Allelverteilung – Gendrift und Mutationen existieren nicht. Folglich gibt es auch keinen Stammbaum, in dem plötzlich ein neues Allel auftaucht. Für Taxonomen spannender wird da schon das Wright-Fisher-Modell. Auch hier sind alle Genvarianten neutral und unterliegen keinem Selektionsdruck. Es lässt sich aber berechnen, mit welcher Wahrscheinlichkeit ein Allel in der Folgegeneration in einer bestimmten Häufigkeit auftaucht. Das Ergebnis hängt von der aktuellen Allelfrequenz und der Populationsgröße ab. Die Generationen überlappen sich dabei nicht, sondern die Nachkommen ersetzen ihre Eltern einfach. Im wahren Leben beobachtet man dieses Muster bei einjährigen Pflanzen.

Nun schaut man bei der Stammbaumanalyse aber in die Vergangenheit und möchte sehen, wann zwei Allele zu einem verschmelzen, wenn man die Uhr rückwärts laufen lässt. Eine solche Vereinigung heißt Koaleszenz. Betrachtet man zwei verschiedene Allele eines Gens in zwei verschiedenen Individuen und lässt die Mutationsrate außen vor, so kann man vereinfachend eine Wahrscheinlichkeit errechnen, mit der beide Allele aus ein und demselben elterlichen Allel hervorgegangen sind – dann wären die Individuen Geschwister (oder Halbgeschwister). Diese Wahrscheinlichkeit beträgt Eins zu Zwei mal N (1/(2N)), wobei N die Größe der Population ist und „2N“ die Gesamtanzahl der Genkopien in der Population ausdrückt. Je mehr Generationen rückwärts man diese Formel anwendet, desto größer die Wahrscheinlichkeit für ein Koaleszenzereignis. Auch für mehrere Allele eines Gens kann man sich auf diesem Wege statistisch in die Vergangenheit vortasten.

Damit hat man nun ein mathematisches Instrument für die Arbeit mit genetischem Probenmaterial zur Hand, mit dem sich abschätzen lässt, vor wie vielen Generationen der letzte gemeinsame Vorfahre gelebt hat. Koaleszenzmodelle kann man natürlich weiterentwickeln und beliebig komplex gestalten. So lässt man sinnvollerweise die Mutationsrate mit einfließen, denn es macht ja einen Unterschied, ob sich zwei Allele an einer oder an fünf Basenpositionen unterscheiden. Allen, die in die Mathematik der Koaleszenztheorie einsteigen wollen, ohne gleich auf der ersten Seite von Formeln erschlagen zu werden, sei ein Review von Yun-Xun Fu und Wen-Hsiung Li aus dem Jahre 1999 ans Herz gelegt (Theor. Popul. Biol. 56(1):1-10).

Analyse per Mausklick

Moderne Analysetools berücksichtigen viele weitere Parameter, um unter zahlreichen möglichen Stammbäumen den wahrscheinlichsten auszuwählen. Insbesondere sollen ja nicht bloß Allele eines Gens verglichen werden, sondern im Ideal­fall viele Chromosomenabschnitte unter Berücksichtigung von Rekombinationsereignissen in die Berechnungen miteinfließen.

Dass all dies einmal per Mausklick möglich sein würde, hätten sich die Väter der Koaleszenztheorie damals sicher nicht träumen lassen.


Letzte Änderungen: 02.10.2014