Kann die Bioforschung Excel wieder nutzen?

1. November 2023 von Laborjournal

Microsoft hat es endlich getan: Seit einigen Wochen kann man in deren Tabellenkalkulationsprogramm Excel Daten eingeben, ohne dass die eingebaute automatische Datenkonvertierung diese notorisch ungewollt verunstaltet – eine Funktion, die  der biomedizinischen Forschung sehr lange durchaus große Schäden zugefügt hat.

Fast schon höhnisch wirkt daher, wie sehr sich Microsoft jetzt für diese „Neuheit“ preist. Auf Microsofts Blog-Seite schreibt etwa die verantwortliche Produktmanagerin namens Chirag Fifadra in dem Beitrag „Control data conversions in Excel for Windows and Mac“:

Ich freue mich, Ihnen mitteilen zu können, dass wir nun aufgrund Ihrer Rückmeldungen die Einstellungen für die automatische Datenkonvertierung verbessert haben. […] Wir wollten die Frustration unserer Kunden über die automatische Konvertierung von Daten in bestimmte Formate durch Excel beseitigen. Daher haben wir Ihnen jetzt die Möglichkeit gegeben, das Standardverhalten von Excel zu ändern und bestimmte Arten der automatischen Datenkonvertierung nach Bedarf zu deaktivieren.

Schön, aber die „Rückmeldungen“ über gewisse „Frustrationen“ mit Excel gibt es inzwischen seit fast zwanzig Jahren – zumindest aus der Life-Science-Forschung. Bereits 2004 erschien in BMC Bioinformatics ein Artikel mit dem Titel „Mistaken Identifiers: Gene name errors can be introduced inadvertently when using Excel in bioinformatics“ (vol. 5, Art. nr.: 80). Darin fassen die Autoren zusammen:

Bei der Verarbeitung von Microarray-Datensätzen stellten wir kürzlich fest, dass einige Gennamen versehentlich in Nicht-Gennamen geändert wurden. Mit etwas Detektivarbeit konnten wir das Problem auf die Standardkonvertierung von Datumsformaten und Fließkommaformaten in dem […] Programmpaket Excel zurückführen. Von den Datumsumwandlungen sind mindestens 30 Gennamen betroffen, von den Fließkomma-Umwandlungen mindestens 2.000 […]. Diese Konvertierungen sind irreversibel; die ursprünglichen Gennamen können nicht wiederhergestellt werden. Für Analysen unter Einbeziehung von Gennamen sollte man sich dieses Problems bewusst sein. Denn immerhin könnten dadurch Gene – auch medizinisch wichtige – aus dem Blickfeld geraten. Ganz abgesehen davon, dass auf diese Weise selbst sorgfältig kuratierte Datenbanken bereits verunreinigt wurden.

Seitdem wartete die Community auf Besserung. Diesen Beitrag weiterlesen »

Oh, die Bioinformatiker manchmal…

26. Februar 2020 von Laborjournal

Meistens amüsieren wir uns über „Forscher Ernst“. Hier aber amüsiert er sich jetzt mal – und zwar über einen Bioinformatiker, der es offenbar nicht für nötig hielt, wenigstens einen kurzen Blick über seinen eigenen Tellerrand hinaus zu werfen…

(Die bioinformatische Schlappe um die Einwanderung von Katzenartigen nach Nordamerika ist ein reales Beispiel und stand seinerzeit sogar in Science. Zusammengefasst wurde die Geschichte beispielsweise hier.)

Jede Menge weiterer Labor-Abenteuer von „Forscher Ernst“ gibt es hier. Zeichnungen von Rafael Florés.

 

Muster ohne Wert

6. Februar 2013 von Laborjournal

“Oh Gott, das war wieder einer der typischen Bioinformatik-Vorträge.” Der kürzlich so aufstöhnte, war ein Biochemiker. Zuletzt musste er in seinem Feld immer mehr von “diesen Bioinformatikern” begegnen. Wie in so vielen anderen Feldern auch.

“Nur reine Waschlisten”, klagte er weiter. “Warum gewisse Muster innerhalb des analysierten Monster-Datensatzes hier überrepräsentiert sind, dagegen dort kaum vorkommen. Dass es darin soundsoviel Prozent von diesem gibt, und soundsoviel von jenem. Und dann zeigt er uns strahlend, dass Proteine, die offenbar an der Transkription beteiligt sind, auffällig viel Glutamin enthalten. Als ob es dazu nicht schon einen Rattenschwanz an biochemische Daten geben würde. Und als ich ihn dann etwas ketzerisch nach einer Erklärung für die Glutamine fragte, hob er nur dumm-grinsend die Schultern.” Diesen Beitrag weiterlesen »

Autoren am Rande des Nervenzusammenbruchs (16)

14. August 2012 von Laborjournal

Schon mal zitiert worden, bevor das Paper überhaupt offiziell veröffentlicht war?

Wie einem dies passieren kann, beschrieb vor kurzem der Bioinformatiker C. Titus Brown in seinem Blog Living in an Ivory Basement. Demnach unternahm er den „unüblichen Schritt“, ein Manuskript über ein neues Software-Tool zur Metagenomik-Analyse nicht nur bei PNAS einzureichen, sondern dieses parallel auf dem Preprint-Server arXiv zu posten, der sich insbesondere unter Physikern und Mathematikern großer Beliebtheit erfreut.

Ein paar Wochen danach erhielt Brown die Anfrage, seinerseits ein bestimmtes Manuskript zu begutachten — unter anderem deswegen, weil die Autoren sein arXiv-Paper bereits zitiert hatten. Diesen Beitrag weiterlesen »

Auf Negativ-Suche

8. November 2011 von Laborjournal

Studien, die sagen, dass etwas nicht funktioniert, haben es schwer publiziert zu werden. Obwohl sie durchaus ihren Sinn haben. Zum Beispiel um Dutzende von Forschern vor Irrwegen zu warnen, wenn „Negativresultate“ plötzlich Erkenntnisse widerlegen, die durch Publikation bereits als zementiert gelten. Wir hatten das Themabereitsöfter.

Noch brisanter wird die ganze Angelegenheit, wenn man sich vor Augen hält, dass nur etwa 6 Prozent aller Industrie-gesponsorten klinischen Krebsstudien publiziert werden. Von diesen 6 Prozent berichten wiederum 75 Prozent über positive Ergebnisse. Was muss man daraus folgern? Dass negative Ergebnisse so gut wie nicht veröffentlicht werden.

Eigentlich herrscht unter den Forschern selbst schon lange große Einigkeit, dass solche „Negativergebnisse“ wichtig und unabdingbar für den Prozess des wissenschaftlichen Erkenntnisgewinns sind — und somit mitgeteilt gehören. Wer dabei aber allzuoft nicht mitspielt, sind die Editoren der betreffenden Zeitschriften, die die entsprechenden Manuskripte meist schlichtweg ablehnen. Diesen Beitrag weiterlesen »

Bringt Bioinformatik was?

21. Juni 2010 von Laborjournal

Die Bioinformatik hat nicht überall den besten Ruf. Man nehme etwa den Beitrag „Do computational biologists care about being right?„, der vor einem knappen Jahr im Blog Adaptive Complexity erschien. Darin heißt es:

You have these clever computer guys, and they don’t give a damn whether their models are actually right. They’ve come up with some clever algorithm or theoretical analysis, and that’s good enough. I’m not saying that computational guys have to test everything themselves, but many of them are not even proactive about getting someone else to test them. They’re just happy to move right along to the next project that will have zero impact on biology.

Hartes Urteil. Aber nicht ganz von der Hand zu weisen, solange Dinge geschehen wie zum Beispiel das, was eine den Lab Times-Lesern wohlbekannte Eule vor einiger Zeit beschrieb. Diesen Beitrag weiterlesen »