Editorial

Der Fehlerbalken im Auge des Forschers

"Der Charité-Skandal" (Folgen 1-13 und 14, Update vom 17. März 2010) -- Es gehen Gerüchte, Forscher an der Charité hätten eine Unzahl von gefälschten Papern veröffentlicht. Höchste Stellen seien verwickelt, der Filz reiche bis nach Hamburg. Selbst Ulrike Beisiegel, Sprecherin des Ombudsman der DFG, Kandidatin für das Präsidentenamt der Göttinger Universität, Ikone der deutschen Wissenschaftsethik, wurde angegriffen.

editorial_bild

Da biegt sich der (Fehler-)Balken

Ein neuer Ermittler schaltet sich ein

 

Bis jetzt hat sich Markus Kühbacher in dieser Geschichte als Einzelkämpfer betätigt. Vor einigen Tagen jedoch meldete sich ein Leser dieser Fortsetzungsgeschichte, der, angeregt von Folge 9, die dort erwähnten Publikationen von Frau Beisiegel studiert hatte. Dem Leser, Herrn Adebar Storch, war in der Publikation Heeren et al. „Recycling of Apolipoprotein E and Lipoprotein Lipase through Endosomal Compartments in Vivo“, The Journal of Biological Chemistry 2001, mit den Autoren Jörg Heeren, Thomas Grewal, Stefan Jäckle und Ulrike Beisiegel (korrespondierender Autor Jörg Heeren) PDF die Kinetik in Figur 6a aufgefallen. Deren Werte seien zu schön um wahr zu sein, meinte Herr Storch, und diese Meinung hatte Gewicht, weil Storch ein ausgewiesener Statistikexperte ist.

 

Der Laborjournal-Reporter sah sich daraufhin die Kinetik in Figur 6a an. Gemäß Legende und Material & Methoden wird folgendes Experiment beschrieben:

 

Die Leber einer lebenden, anaesthetisierten Ratte wird für fünf Minuten perfundiert mit 125I-markierten Proteinen (125I-apoE/125I-LPL-TRL; apoE: ApolipoproteinE, LPL: Lipoprotein Lipase, TRL: Triglycerid reichem Lipoprotein). Um nicht in Hepatozyten internalisiertes Protein zu entfernen, wird danach mit Heparin-haltigem Krebs-Hanseleit Puffer gewaschen bis im Perfundat keine Radioaktivität mehr nachweisbar ist. Ist dies erreicht, also nach 5-10 Minuten, wird mit Krebs-Hanseleit Puffer plus 10% Human Serum perfundiert und alle fünf Minuten die von der Leber abgegebene Radioaktivität gemessen: Das jeweils in 5 Minuten aus der Leber ausgetretene Perfusat (2 ml) wird in einem Röhrchen aufgefangen und in den g-Counter gestellt. Die zu einem jeweiligen Zeitpunkt insgesamt ausgetretene Radioaktivität (beispielsweise zum Zeitpunkt 15 min die Summe der Counts in den Röhrchen 5, 10 und 15 Minuten) wird als „% internalisiert“ angegeben. Was „internalisiert“ bedeutet, wurde dem Laborjournal-Reporter aus Legende und Material & Methoden nicht klar. Er nahm an, daß es sich um die nach dem Waschen mit Krebs-Hanseleit Puffer noch in der Leber sitzende Radioaktivität handelt. Der Laborjournal-Reporter fand auch das Wort „internalisiert“ mißverständlich, da nicht zwischen Adsorption der radioaktiv markierten Proteine an Zell- und Gefäßwände und echter Internalisierung (Endozytose) in Zellen unterschieden wird. Aber sei’s drum: internalisiert wird jedenfalls in das ganze Organ. Gemäß Legende besteht jeder Punkt aus vier unabhängig gewonnenen Meßwerten. Das Experiment wurde also mit vier Rattenlebern durchgeführt.

 

Adebar Storch monierte Folgendes:

 

1. Alle Datenpunkte liegen auf der Funktionskurve, einer mathematischen Hyperbel, und zwar mit einer r = 0.999
2. Alle Standardabweichungen (SD) überlappen mit der Funktionskurve.
3. Die SD der letzten 8 Werte sind identisch (Genauigkeit der Messung bei stark vergrößerter Abbildung plusminus 0,5 mm)
4. Die SD korrelieren linear mit den Mittelwerten (r = 0,995)

 

Auch der Laborjournal-Reporter bestaunte die Exaktheit der Kurve in Figur 6a. Seinen Einwand, daß Herr Heeren - oder wer sonst die Figur erstellte - vielleicht die Kurve per Hand gezogen habe und sie deswegen genau durch die Mitte aller Punkte gehe oder der Figurenersteller ein Programm verwendete, das eben dieses leiste, wollte Storch nicht gelten lassen. Dies könne nicht sein, weil die Punkte auf einer mathematischen Hyperbel lägen. Auch würde das die Korrelation der SD mit den Mittelwerten nicht erklären. Storch beharrte darauf: Diese Daten seien zu gut, um wahr zu sein.

 

Der Laborjournal-Reporter schrieb daraufhin am 4.3.2010 Frau Beisiegel an und bat sie um Stellungnahme. Frau Beisiegel hielt sich gerade in Japan auf, Herr Heeren war in Urlaub. Dennoch erhielt der Laborjournal-Reporter schon am 8.3.2010 die Originaldaten zu Kinetik PDF und Abbau (dem Inset in Fig. 6a) samt Jörg Heerens Erklärung:

 

"anbei die Daten (als Exceldatei in pdf Format), die für die Berechnung der Kinetik in Abbildung 6a im besagten JBC-Paper geführt haben. Grundsätzlich haben Sie das Experiment richtig beschrieben, allerdings wurde als Bezug der Radioaktivität (internalisiert) nicht die Radioaktivität in der Leber nach dem Waschen sondern nach dem Chasen genommen (wenn wir vor dem Chasen die Leber beschädigen, dann würde die Perfusion nicht funktionieren). An dem Experiment waren Herr Prof. Jäckle (hat die Perfusion durchgeführt), der Technische Angestellte Walter Tauscher, Dr. Thomas Grewal und ich beteiligt.


In der Legende steht, dass die Abbildung aus vier Tieren stammt. Die Kinetik ist allerdings nur der Mittelwert aus drei Tieren, da die Lebervene eines Tieres (wie auch in der Tabelle als Kommentar ersichtlich) während des Experimentes verstopfte. Hier ist mir somit ein Fehler beim Schreiben der Legende unterlaufen, der allerdings in keinster Weise die Aussage des Experimentes verändert. Die vor dem Verstopfen der Leber erhobenen Daten passen zu der beschriebenen Kinetik. Die Daten für das Inlet 'degraded versus non-degraded' wurden aus den ersten drei genommenen Proben nach 5, 10 und 15 min und aus allen vier Tieren in der im Manuskript beschriebenen Weise bestimmt (daher drei Werte pro Tier für die Bestimmung 'degraded versus non-degraded').“

 

Der Laborjournal-Reporter schickte Heerens Erklärung und die Daten an Adebar Storch. Nach anderthalb Stunden kam folgendes zurück:

 

„zunächst zur Tabelle: Aus den counts (linke Spalten) wurden die kumulativen counts (mittlere Spalten) und daraus die relative Radioaktivität (rechte Spalten) berechnet, wobei als Referenz für die rechten Spalten die Werte "Gesamt" (unten links) heran gezogen wurden. So weit ist das nachvollziehbar.


Mein Verdacht der Datenfälschung hat sich aber leider bestätigt. Die Daten können keinem realen biologischen Experiment entstammen.

Gründe:

1. Aus den Daten ergibt sich, dass die Streuung (der Variationskoeffizient (CV) = SD geteilt durch Mittelwert) bei den drei verwendeten Ratten laut Angaben von Herrn Heeren jeweils im Bereich 4,5 % bis max. 6,4 % bewegen. Das ist für derartige Versuche zunächst für sich höchst unplausibel, da verschiedene Tiere verwendet wurden, ganz abgesehen von der methodischen Varianz. Also: (tier)individuelle Varianz + methodische Varianz = ca. 5% => SEHR verdächtig!

2. Die Varianzen sind sich extrem ähnlich, Bereich wie gesagt 4,5 - 6,4%. Bei den letzten 5 Werten sogar nur 4.6 % - 4.7 %. SEHR verdächtig!

3. Die Mittelwerte liegen alle auf einer hyperbolischen Funktion: Y=66.21 * Zeit / (9.212 + Zeit). Für 20 Minuten: Y = 45.3

4. Die Regression der "Original"-Daten mit der hyperbolischen Funktion ist extrem gut mit R²=0.9976 und r=0.999. Das kann auch nicht sein.

5. Die Gesamt-Radioaktivität (links unten) ist für die Ratten sehr variabel, von ca. 78,000 bis ca. 420,000. Vorausgesetzt, die Daten stimmen, stellt sich einmal mehr die Frage, warum dann die Daten der Abbildung so extrem gering variabel sind.

6. " ....allerdings wurde als Bezug der Radioaktivität (internalisiert) nicht die Radioaktivität in der Leber nach dem Waschen sondern nach dem Chasen genommen (wenn wir vor dem Chasen die Leber beschädigen, dann würde die Perfusion nicht funktionieren)". Das verstehe ich nun gar nicht. Wenn der Bezugspunkt die *Gesamt*-Radioaktivität ist (s. links unten im pdf), und auf diese Radioaktivität die herausgewaschene bezogen wird, die Gesamtradioaktivität aber erst nach dem Chasen bestimmt wird, ist da ein logischer und methodischer Zirkelschluss.

7. Ganz abgesehen davon stellt sich die Frage, warum in der Leber die Radioaktivität gleichverteilt sein sollte. Die Proben (unter 2% des Gewichts der Lebern) stellen vermutlich keine repräsentative Probe für die Gesamtleber dar.

Zusammenfassung: Die Daten können nicht realen biologischen Experimenten entstammen.“ - sagt Adebar Storch. Hat er Recht?

 

 

Hinweis: Falls Sie Kommentare, Bemerkungen, oder Beobachtungen zu dieser Serie lesen oder gar selber loswerden wollen, können Sie das unter dem gleichnamigen Beitrag in unserem Laborjournal Blog gerne tun.

 

 

von Hubert Rehm

 

Als PDFs zum Download:

 

MS1 v4

MS1 v5

Ms2

Dalla Pu


Was bisher geschah:

Folge 1: Die Kontrahenten

 

Folge 2: Der Krach

 

Folge 3: Die Affäre eskaliert

 

Folge 4: Savaskan weist die Vorwürfe zurück

 

Folge 5: Nachforschungen des LJ-Reporters

 

Folge 6: Vermittlungsversuche

 

Folge 7: Der DFG-Ombudsman wird angerufen

 

Folge 8: Der Ombudsman fordert Unterlagen an

 

Folge 9: Der DFG-Ombudsman gibt an den DFG Ausschuß für Fehlverhalten ab

 

Folge 10: Kühbachers Generaluntersuchung

 

Folge 11: Frau Beisiegels Stellungnahme

 

Folge 12: Noch ein fehlerhaftes Paper: Das Nogo Paper

 

Folge 13: Juristische Nullnummer

 

Folge 14: Ein neuer Ermittler schaltet sich ein

 

Folge 15: Hugo Habicht widerspricht Adebar Storch!

 

Folge 16: Seltsame Endziffern

 

Folge 17: Zusammenfassung und Kommentar

 

Folge 18: Ergänzungen und Bemerkungen

 



Letzte Änderungen: 09.08.2010