Editorial

Schluss mit der Kleinstaaterei

(29.11.17) Pflanzenforscher und -züchter sammelten die Daten ihrer "Lieblingspflanzen" bisher in einzelnen Datenbanken, die untereinander oft nicht kompatibel waren. Um den Datenaustausch zwischen den Pflanzenforscher-Gemeinden zu erleichtern, entwickelte ein internationales Team die übergreifende Pflanzen-Datenbank Planteome.
editorial_bild

© Planteome Project

"Vertreter aller Pflanzenwissenschaften vereinigt Euch"! Unter diesem Motto hat ein internationales Team von Biologen und Bioinformatikern die einheitliche Datenbank Planteome zusammen gestellt. Ihre "Amtssprache" kennt keine Spezies-Grenzen, sie vereinheitlicht das mitunter vielsprachige Vokabular unterschiedlicher Pflanzenforscher, die zum Beispiel mit Arabidopsis, Mais oder Leguminosen arbeiten. Ein „Kolben“ oder eine „Schote“ ist letztlich auch nur eine „Frucht“; und „Fruchtgröße“ ist meist synonym mit der Länge, dem Durchmesser oder der Breite der Frucht.

Planteome enthält über 21 Millionen Annotationen und integriert die prominentesten Datenquellen, zum Beispiel Ensembl Plants, MaizeGDB, TAIR, Genbank und NASC. Die Datenbank beherbergt Daten zu Pflanzeneigenschaften, Phänotypen, Genfunktionen und Expressionsmustern von derzeit 95 Pflanzenarten. Ziel ist es, den Spezies-übergreifenden Wissensaustausch unter Pflanzenwissenschaftlern zu forcieren - Bioinformatiker sollen das Rad nicht immer wieder neu erfinden und Biologen Fehlinterpretationen vermeiden.

Editorial

„Schlappe“ 50.000 begriffliche Bezugssysteme (Ontologien) sind in miteinander verknüpften Kategorien sortiert. Diverse Ontologie-Typen kategorisieren zum einen Klassiker, wie Gen-Ontologie, Ontologie zur Pflanze (Anatomie und Entwicklungsstufe) oder „Trait Ontology“ (Eigenschaften wie Höhe, Stressanfälligkeit oder Fruchtbarkeit). Planteome enthält aber auch Begriff-Systeme wie PECO (Plant Experimental Conditions Ontology; etwa Stressbehandlung, Anzuchtbedingungen) oder PATO (Phenotypic Qualities Ontology). Die Ontologien beziehen sich auf ein Dutzend biologische Einheiten („Bioentities“), darunter Protein, Germplasm, mRNA, Gen oder QTL (Quantitative Trait Loci). Die „Trait Ontology“ beleuchtet zum Beispiel alle Organisationsstufen: Zelle, Zelltyp, Gewebe, Organ(ismus) und Population.

Planteome hilft Grundlagenforschern bei ihrer Arbeit, kann aber auch Züchtern zugute kommen. So findet zum Beispiel ein mediterraner Mais-Züchter vielversprechende Kandidatengene schneller, wenn er in Planteome sieht, welche Gene in anderen Pflanzen für eine gewünschte Eigenschaft verantwortlich sind. Erhöhen ähnliche Gene in Reis oder Cassava zum Beispiel die Salzresistenz, so tun sie dies vermutlich auch in Mais. Zudem unterstützt Planteome nicht nur „Salz“ als Suchbegriff, sondern auch Synonyme wie „Natrium-Ion“.

Pflanzengene tragen oft mehrere Namen, weil sie meist von verschiedenen Forschern in unterschiedlichen Zusammenhängen entdeckt und häufig nicht vollständig sequenziert wurden. So existieren zum Beispiel für den MYB-Transkriptionsfaktor aus Arabidopsis die Kürzel MYBR1, MYB44 und At5g67300. Momentan kann die Datenbank mit „MYB44“ nichts anfangen, obwohl das Protein unter dieser Bezeichnung schon öfter publiziert wurde. Um derartige Mängel zu beseitigen, rufen die Initiatoren des Planteome-Projekts die Nutzer ausdrücklich dazu auf, an der Perfektionierung der Datenbank mitzuarbeiten. Hierfür gibt es einen „Feedback“-Button. Die Änderungsvorschläge der eifrig mitarbeitenden Pflanzenforscher-Gemeinde wären jedoch leichter zu bearbeiten, wenn der Corpus Delicti (etwa MYBR1 oder At5g67300) automatisch in der Betreffzeile erscheinen würde. Ganz ähnlich einer Ebay-Anfrage an einen Empfänger, der seinen gesamten Haushalt verscherbelt, und zu unterschiedlichen Objekten individuell kontaktiert wird.

Die Datenbank eignet sich zur gezielten, intensiven Suche, aber auch zum kurzen Stöbern in der Mittagspause. Eine Filterfunktion sorgt dafür, dass nur Datensätze gewünschter Pflanzenarten oder Entwicklungsstufen durchforstet werden.

Stellen wir Planteome einfach mal auf die Probe und geben den Suchbegriff „drought“ ein. Hier erscheinen sofort sämtliche Annotationen die etwas mit Trockenheit zu tun haben, zum Beispiel Trockenresistenz-assoziierte Gene oder Datenbankeinträge, die aus Trockenstress-Experimenten stammen. Grenzen wir diese mit „Experimental Evidence“ ein und fokussieren uns beim „Object Type“ ausschließlich auf Proteine - lassen also Gene, mRNAs und QTLs außen vor - verbleiben als Output 35 Einträge. Die meisten stammen aus Arabidopsis und liefern Informationen zum Entwicklungsstand, zu Organen oder Zellkompartimenten. Außerdem verrät die Liste Details zur jeweiligen „Experimental Evidence“: Handelt es sich zum Beispiel um einen Mutantenphänotyp oder einen biochemischen Stress-Assay? Den Link zur Original-Publikation erhält man ebenfalls, wenn es einen gibt. Ganz nebenbei kann man so unter Umständen auf einen geeigneten Stress-Assay für die eigenen Experimente stoßen.

Die circa zehn-spaltigen Tabellen (Pflanzenspezies, Taxon, Evidenz, Referenz etc.) lassen sich nicht direkt Online nach einer gewünschten Spalte sortieren. Vor allem bei längeren Ergebnislisten ist dies etwas unhandlich. Dies sollte aber spätestens nach Öffnen der heruntergeladenen Daten (tab-delimited format) in Word oder Excel möglich sein.

Weniger erfahrene Besucher sollten sich von diversen Fachbegriffen nicht abschrecken lassen. Ein kurzer Maus-Klick, bei dem sich Unterbegriffe öffnen, verschafft meist Klarheit. Auch die graphische Aufbereitung der Daten trägt zur Verständlichkeit bei. So stellt Planteome zum Beispiel Ontologien in hierarchischen Abstufungen dar, ähnlich wie bei Stammbäumen.

Die Planteome-Autoren rufen die Nutzer dazu auf, eigene Daten einzutragen, um die Genauigkeit und Effektivität der Datenbank zu verbessern. Sie denken hier zum Beispiel an Angaben zur geographischen Lage oder zu GIS-Koordinaten, an denen eine bestimme Pflanze entnommen oder ein Samen eingetütet wurde.

Planteome wirkt aufgrund fehlender Fotos oder Bilder recht nüchtern. Bilddaten einzubeziehen steht aber auf der To-Do-Liste der Planteome-Gestalter. Demnächst soll auch eine automatische Erkennung Ontologie-basierter Annotationen von Pflanzenteilen oder Phänotypen möglich sein. Damit ließen sich Hochdurchsatz-Analysen und -dokumentationen effizienter durchführen.

 

Andrea Pitzschke



Letzte Änderungen: 21.12.2017