Viva, Open Data!

5. Juli 2023 von Laborjournal

Unser Forscher Ernst lernt die Vorzüge des Offenlegens aller Forschungsdaten kennen …

(Gezeichnet von Rafael Florés. Jede Menge weiterer Labor-Abenteuer von „Forscher Ernst“ gibt es hier.)

 

Die Unlust zum Datenteilen

3. August 2022 von Laborjournal

Was treibt den wissenschaftlichen Fortschritt an? Alles Mögliche könnte man hier nennen: Neugier, ein offener Geist, auch harte Arbeit, … Nehmen wir es hier aber mal ganz pragma­tisch: Zumindest in der heutigen modernen Wissenschaft sind es zuerst und vor allem die Daten, die sie immer weiter voranbringen.

Nicht zuletzt deshalb ist eine der größten Forderungen der Open-Science-Bewegung, die Rohdaten aus Experimenten jederzeit für alle frei verfügbar zu machen. Und nicht zuletzt deshalb fordern inzwischen die meisten Journals von den Autoren, die Rohdaten der im Manuskript beschriebenen Resultate der Forschungsgemeinde stets zur freien Verfügung zu halten. Weshalb inzwischen auch die meisten Paper das starke Statement ziert: „Data available on request.“

Doch wie stark ist das Statement in der Praxis? Ist es mit robuster Substanz gefüllt? Oder bleibt es als notgedrungene Absichtserklärung eher eine leere Luftnummer?

Bereits in Laborjournal 3/22 (S. 10) berichteten wir von einer nicht gerade hoffnungsvollen Stichprobe zum Thema. Ein Team hatte bei den Autoren von 53 Veröffentlichungen in der Krebsforschung Rohdaten angefordert – ein Drittel antwortete überhaupt nicht, und nur ein Viertel teilte die Daten vollständig und in brauchbarer Form.    Diesen Beitrag weiterlesen »

Mehr Zitate durch Open Data

18. Juli 2019 von Laborjournal

Wie kann ich mit jedem Artikel 25 Prozent mehr Zitierungen ein­sammeln? Jedenfalls im Schnitt, und ohne allzu großen Mehraufwand…

Hand auf’s Herz — das klingt verlockend, oder? Welcher Forscher checkt heutzutage nicht regel­mäßig sein Zitatekonto — auch wenn es viele nicht wirklich zugeben? Und wenn dann einer ganze 25 Prozent „Rendite“ verspricht…

Das Rezept, wie man sich diese Rendite „ver­dienen“ kann, hat gerade ein englisch-nie­der­lädisches Team unter dem Titel „The citation advantage of linking publications to research data“ in arXiv verkündet (arXiv:1907.02565v1) — und es ist denkbar einfach: Stelle sämtliche Daten, die deinem Paper zugrunde liegen, öffentlich für alle zur Verfügung — und schon wirst du dafür durchschnittlich ein Viertel mehr an Zitierungen einstreichen.

Für ihre Studie nahmen sich die Autoren über eine halbe Million Artikel vor, die zwischen 1997 und 2018 in 350 Open-Access-Zeitschriften der Verlage Public Library of Science (PLoS) und BioMed Central (BMC) erschienen waren. Etwa ein Drittel davon enthielt Data Availability Statements und beinhaltete somit jeweils einen Link zu einem Repositorium, in dem die Autoren sämtliche relevante Originaldaten öffentlich zugänglich hinterlegt hatten. Ganz im Sinne von Open Data also. Und siehe da, dieses Drittel an Papern wurde nachfolgend im Schnitt um 25 Prozent häufiger zitiert als die anderen zwei Drittel, die keine Daten offengelegt hatten.

Schöne Sache, oder? Zumal dadurch die Forscher landauf landab erst recht dazu motiviert werden könnten, ihre Daten für alle offenzulegen. Sicher, man sollte das Konzept von Open Data eigentlich aus ganz anderen Beweggründen beherzigen, als dass ich dadurch ein paar Zitate mehr auf mein Konto hieve — aber hier kann man es vielleicht einfach mal so stehen lassen, dass über nicht ganz saubere Incentives am Ende dennoch das Richtige gepusht wird. Der Zweck heiligt bekanntlich die Mittel.

Zumal die Studie der wahren Bedeutung von Zitierzahlen ja eigentlich kein gutes Zeugnis ausstellt, wenn man nur ein bisschen weiter denkt. Schließlich bleibt das publizierte Paper mit den präsentierten Ergebnissen und Schlussfolgerungen ja punktgenau dasselbe — ob ich nun die zugrundeliegenden Daten dahinter offenlege oder nicht. Dennoch bekomme ich dadurch 25 Prozent mehr Zitierungen. Womöglich nur, weil die Open Data hinter dem Paper etwas mehr Aufmerksamkeit darauf lenken? Wie auch immer, bei derart leicht verursachbaren Schwankungen kann die Zitierzahl eines bestimm­ten Papers wohl kaum ein direktes Maß für die Qualität der darin beschriebenen Ergebnisse sein.

Aber das wissen wir ja eigentlich schon lange — siehe etwa hier, hier und hier.

Ralf Neumann