Editorial

PDF ade, scheiden tut nicht weh!

Hat das klassische Research Paper seine beste Zeit hinter sich - und was kommt danach?
editorial_bild

(19. August 2013) Forschen – Zusammenschreiben – Publizieren: Das ist das Rad, in dem sich Forscher drehen. Wissenschaftler verkünden ihre Ergebnisse heute im Prinzip noch genauso wie vor 100 Jahren. Statt auf totem Holz publiziert man zwar mittlerweile meist digital und Datenbanken wie PubMed haben den Zettelkasten als Werkzeug für die Literatursuche verdrängt. Aber der Artikel in der Fachzeitschrift, das Research Paper, ist dabei nahezu unverändert geblieben, mit altbekannter Struktur aus Einleitung, Methoden, Ergebnisse und Diskussion.

Die Journals sind somit die Treuhänder des Forschungswissens. Nur Resultate, die das Gütesiegel der Gutachter einer Fachzeitschrift haben, können als zitierfähig und vertrauenswürdig gelten.

Die Art der Forschung in den modernen Lebenswissenschaften dagegen, ihre Methoden und Resultate, haben sich in den letzten Jahrzehnten radikal verändert. Ob es uns gefällt oder nicht: Wir stecken in der Ära der „Big Data"; digitale Datenerfassung und automatisierte Workflows, Computermodelle und Software aller Art unterstützen die Wissenschaftler bei ihrer Arbeit und produzieren kaum noch überschaubare Datenberge. Neuere Zweige der Forschung wie Genomik, Bioinformatik und Systembiologie sind sowieso undenkbar ohne Datenbanken, Computermodelle und oft individuell erstellte Software.

Big Data: Zu groß für das traditionelle Paper

Aber nicht nur die „-omics"-Forscher produzieren mehr Daten als in einen Fachartikel passen. Selbst traditionelle Forschungszweige wie die zoologische Systematik integrieren heute datenreiche Methoden (vgl. das Laborjournal-Online-Editorial über CT-Rekonstruktionen von Spinnenfossilien).

Big Data kann ein Autor im Rahmen eines klassischen Papers zwar beschreiben, aber eben nicht direkt an die Leser weitergeben. Bei der Publikation neuer Genomsequenzen beispielsweise hat der Artikel selbst eher Ankündigungscharakter; die wenigen Textseiten und Tabellen, die einen Überblick über die Eigenschaften eines Genoms geben, haben kaum wissenschaftlichen Wert ohne die Datenbank mit der ellenlangen Abfolge aus A,T, C und G und den zugehörigen Annotationen.

Überschaubare Datensätze hängen Autoren zwar oft als Supplemental Material direkt an den Artikel an. Das ist aber keine elegante Lösung, da Vernetzung und „Durchsuchbarkeit" dieser Anhängsel zu wünschen übrig lassen.

Ein weiteres Problem: Von der Gewinnung der Daten bis zur Veröffentlichung des dazugehörigen Papers vergeht oft viel Zeit. Zeit, in der andere Wissenschaftler schon interessante Dinge mit den Daten anstellen könnten, wenn sie denn Zugang hätten. Aber viele Forscher halten ihre Daten geheim, solange die dazugehörige Veröffentlichung nicht bei einem Journal akzeptiert ist.

Nicht reproduzierbar

Erscheint das Paper dann endlich, stellt sich allzu oft heraus, dass die Ergebnisse nicht reproduzierbar sind – nicht weiter schlimm und im Rahmen der statistischen Erwartung, wenn es nur gelegentlich vorkäme. Aber alles weist darauf hin, dass sich die Lebenswissenschaftler mit ihrer derzeitigen Forschungs- und Publikationskultur ein massives Problem eingebrockt haben.

In einer Analyse von John Ioannidis und Kollegen zeigte sich beispielsweise, dass 10 von 18 Veröffentlichungen von Microarray-Daten nicht reproduzierbar waren.

Noch katastrophaler die Lage in der präklinischen Krebsforschung: Von den 53 untersuchten Studienergebnissen liessen sich nur 6 (elf Prozent) unabhängig bestätigen.

Was fehlt: Transparente Kommunikation und Rohdaten

Ein wichtiger Beitrag zu mehr Reproduzierbarkeit wäre eine transparente und vollständige Kommunikation aller Rohdaten – alle Sequenzen, alle Bild- und Videodaten, alle Messwerte - und aller verwendeten bio-informatischen und statistischen Hilfswerkzeuge, also Software, Skripte und dergleichen. Aber auch das ist im Rahmen des üblichen Formats oft nur schwer möglich. Und wieso sollten sich Forscher diese Mühe machen, wenn der enorme Aufwand kaum belohnt wird?

Aus all den obigen Gründen mehren sich die kritischen Stimmen: Das Format des Research Papers ist dringend reformbedürftig. Bei einem Workshop der kürzlich zu Ende gegangenen Konferenz ISMB 2013 in Berlin sprach beispielsweise Scott Edmunds vom Beijing Genomics Institute (BGI) über die „Dekonstruktion des Papers". (Folien hier).

„Dekonstruktion" ist ein Ausdruck, den Liebhaber modischer Sterne-Restaurants auf der Speisekarte finden. Die Idee: Der Koch kredenzt eine altbekanntes Gericht in „auseinander genommener" Form. Die einzelnen Zutaten sollen so an Bedeutung gewinnen. Und genauso ist die Dekonstruktion auch in Bezug auf Forschungsergebnisse gedacht: Eine Datenbank etwa soll eigenständig neben dem deskriptiven Text stehen können, als voll zitierfähige Ressource.

Daten eine Anschrift im Internet geben

Denn gleich ob Sequenz-Datensatz, Software, oder 3D-Modell: Um diese und ähnliche Forschungsbeiträge aufzuwerten, muss man sie zitieren können, beispielsweise über Digital Object Identifiers (DOI). Das ist der Weg, den sich „DataCite" vorgenommen hat, eine Initiative, die auch die Deutsche Fachbibliothek für Technik (TIB) unterstützt. Bisher kennt man DOIs vor allem von Textdokumenten; sie helfen dabei, schnell die offizielle Version eines Dokuments zu finden - Beispiel: DOI: 10.1126/science.1058040 führt zur Beschreibung des Humangenoms im Journal Science. Forscher können aber auch Datensätze, Software und beliebige andere Objekte, Konferenz-Poster etwa, mit DOIs belegen.

Das klingt erst mal nicht revolutionär, sondern recht buchhalterisch-dröge. Die Option, allen möglichen Daten eine unverwechselbare Adresse im Internet zu geben, hat aber weit reichende Konsequenzen: Weiterverwendung durch Dritte, Zitierbarkeit, Vernetzung in übergeordneten Datenbanken – all dies funktioniert reibungsloser, wenn Datensätze eine eindeutige Anschrift haben, die im Idealfall auch Informationen zu Urheber, Entstehungsdatum und Regeln für die Nutzung enthält.

Forscher können mit DOI versehene Daten also unabhängig von einer Journal-Publikation zur Verfügung stellen; und zwar im Prinzip ohne die Gefahr, sich ausgenutzt oder übergangen zu fühlen, wenn andere Wissenschaftler die Daten für eigene Zwecke weiterverwenden. Die Urheberschaft ist durch den zitierfähigen DOI ja zweifelsfrei geklärt.

Die Hoffnung der Daten-Enthusiasten ist, dass auch Drittmittelgeber und Berufungskommissionen die Erstellung von Datensätzen und Software vermehrt als Forschungsleistung anerkennen, auch wenn diese Beiträge sich nicht in der traditionellen Publikationsliste niederschlagen. Soweit die Vision.

Einen offenen Forschungsstil pflegen

Dass ein offener Umgang mit Daten jenseits des klassischen Papers auch in der Praxis funktioniert, hatte ein ad-hoc zusammengestelltes internationales Konsortium schon 2011 gezeigt: beim Ausbruch von ernsthaften Darmerkrankungen durch einen EHEC-Erreger in Deutschland. Bei der eilig angesetzten Sequenzierung, Annotierung und Publikation des bakteriellen Genoms hatten die Forscher einen äusserst offenen Stil gepflegt.

Beteiligt war unter anderem das Universitätsklinikum Hamburg-Eppendorf und Genomiker am chinesischen BGI, aber auch viele kleinere Institutionen und einzelne Forscher aus aller Welt. Ihre jeweiligen Datenpakete und Analysen stellten sie zügig online; teilweise verbreiteten die Wissenschaftler ihre neuesten Daten gar über Twitter, noch bevor sie in der üblichen Datenbank (NCBI) angekommen waren.

So könnte freier Datenaustausch und offene Kollaboration also funktionieren. Neue Kommunikationsformen für Forschungsergebnisse sind aber erst in Umrissen erkennbar. Qualitätssicherung, Peer Review, fachübergreifende Standards der Daten-Veröffentlichung: Das sind Fässer, die ich heute nicht mehr aufmachen will.

Ein Innovationshemmer für alle Ideen „Jenseits des PDF" ist aber sicher die Doppelrolle des Journal-Papers als Instrument der Wissenskommunikation einerseits und als Trumpf im Lebenslauf der Autoren andererseits. Das mit eigenem Namen veröffentlichte Paper im begutachteten Journal ist nach wie vor der Leistungsnachweis für alle Forscher. Und wenn es um die eigene Karriere geht, hört bei vielen Wissenschaftlern die Experimentierfreude auf.

Hans Zauner



Letzte Änderungen: 16.09.2013