Direkt zum Inhalt

Die offene Flanke der Wissenschaft

Die Replikationskrise ist in der Wissenschaft seit Jahren bekannt – doch jetzt wird sie zum politischen Hebel. Ein Gastbeitrag von Sebastian Tillmann über Forschung, Vertrauen und die Gefahr ideologischer Vereinnahmung.
Portraitfoto con Sebastian Tillmann

Sebastian Tillmann ist Referent für Diversity an der Universität Konstanz und promovierter Organisationsforscher. Auf seinem Blog Nullhypothese analysiert er wissenschaftskulturelle Debatten und strukturelle Probleme der Diversity-Forschung – mit einem besonderen Blick auf Replikationskrisen und empirische Evidenz. Foto: Ines Janas.

ALS US-VIZEPRÄSIDENT JD Vance am 24. Mai twitterte, es gebe eine "außergewöhnliche Reproduzierbarkeitskrise" in der Wissenschaft, traf mich das mit voller Wucht. Nicht weil er unrecht hätte – sondern weil er verdammt noch mal recht hat. Einen Tag zuvor hatte Präsident Trump die Executive Order "Restoring Gold Standard Science" unterzeichnet, die wissenschaftliche Standards per Dekret neu definiert und dabei gezielt gegen Diversitätsmaßnahmen, COVID-Leitlinien und Klimaforschung schießt. Die Replikationskrise wird zur politischen Waffe.

Es war absehbar, dass populistische Akteure die Replikationskrise früher oder später für sich entdecken würden, gerade weil sie reale Schwächen der Wissenschaft adressiert, ohne offen wissenschaftsfeindlich zu wirken. Wer das Universitätssystem delegitimieren will, findet hier eine offene Flanke: ein Angriffspunkt, der scheinbar sachlich daherkommt, aber enorme politische Sprengkraft entfalten kann. Nun sehen wir dieses Szenario in den USA – und wir haben die Munition dafür größtenteils selbst geliefert.

Großangelegte Replikationsprojekte der vergangenen Jahre zeichnen ein ernüchterndes Bild über verschiedene Forschungsgenerationen hinweg. So zeigten beispielsweise die Many Labs-Projekte (2015 bis 2020), dass viele klassische psychologische Effekte unter vielfältigen Bedingungen nicht immer robust replizierbar sind. Dass dieses Problem aber keineswegs nur die "alten Meister" betrifft, sondern auch die moderne Forschung, offenbarte dann mit voller Wucht das "Reproducibility Project: Psychology": In dieser 2015 veröffentlichten Bestandsaufnahme von 100 Forschungsarbeiten, die 2008 publiziert wurden, konnten nur 36 erfolgreich repliziert werden. In der experimentellen Ökonomie waren es in einem Test nur elf von 18 Studien

In der Medizin ist die Lage noch dramatischer: Ein Pharmaunternehmen versuchte, 53 bahnbrechende Krebsstudien zu reproduzieren – erfolgreich war es nur in sechs Fällen, eine Versagensquote von 89 Prozent. Richard Horton, ehemaliger Chefredakteur des Lancet, schrieb bereits 2015: "Vielleicht die Hälfte der wissenschaftlichen Literatur könnte schlicht unwahr sein." Aktuellere Untersuchungen wie das "Reproducibility Project: Cancer Biology" (2021) stützen diese Einschätzung mit einer Replikationsrate von nur 46 Prozent für Krebsstudien. All diese Analysen deuten weniger auf eine plötzliche Verschlechterung hin, sondern vielmehr auf die Aufdeckung schon länger bestehender Probleme in der Robustheit wissenschaftlicher Befunde über viele Felder und Jahre hinweg. Neu ist demnach nicht das Problem der mangelnden Replizierbarkeit, sondern das allgemeine Bewusstsein darüber.

"Du musst einen Dialog mit deinen Daten führen"

Die Krise hat selbst die Eliteuniversitäten erreicht. Francesca Gino war ein Harvard-Superstar, erforschte Unehrlichkeit und wurde selbst der Datenmanipulation überführt. Im Mai 2025 entzog Harvard ihr die Tenure – ein einmaliger Vorfall in 80 Jahren Universitätsgeschichte. Aufgedeckt wurde das durch Uri Simonsohn und Kollegen vom Data Colada Blog, was eines der Probleme darstellt: Es sind oft nicht die Institutionen selbst, die solche Probleme aufdecken, sondern ehrenamtliche Wissenschaftler*innen, die in ihrer Freizeit akribisch Studien überprüfen.

Diese Krise kostet Milliarden. Laut einer Studie in PLOS Biology (2015) werden allein in den USA jährlich 28 bis 50 Milliarden Dollar für irreproduzierbare biomedizinische Forschung verschwendet. Nach Destatis-Zahlen sprechen wir bei 129,7 Milliarden Euro jährlichen F&E-Ausgaben in Deutschland vermutlich auch von zig Milliarden Euro Verschwendung pro Jahr.

Ich kenne das System von innen. Als Doktorand gab mir ein erfahrener Forscher einen Rat, der mich bis heute verfolgt: "Du musst einen Dialog mit deinen Daten führen." Er meinte: Probiere so lange verschiedene Analysen, bis die Daten das gewünschte Ergebnis zeigen. Er wollte nicht betrügen – er wollte mir helfen, im "publish or perish"-System zu überleben. Solche "questionable research practices" sind normalisiert, weil laut Bundesbericht Wissenschaftlicher Nachwuchs nur sieben Prozent aller Promovierten jemals eine Professur erhalten. Unter diesem existenziellen Druck wird jede Publikation zur Überlebensfrage.

Besonders problematisch wird es in politisch aufgeladenen Bereichen wie der DEI-Forschung, in der ich arbeite. Hier ist die Versuchung groß, schwache Evidenz zu akzeptieren, weil die Ziele so ehrenhaft erscheinen. Ein Paradebeispiel: McKinseys vielzitierte Studien zum "Business Case for Diversity", die behaupten, diverse Unternehmen seien profitabler. Diese Studien werden weltweit als Begründung für Milliardeninvestitionen in Diversity-Programme zitiert. Das Problem: Sie lassen sich nicht replizieren und beruhen auf fragwürdigen Kausalitätsannahmen. Wenn solche "Belege" später widerlegt werden, diskreditiert das nicht nur die spezifische Studie, sondern wirft einen Schatten auf das gesamte Anliegen von Vielfalt und Inklusion.

Genau hier liegt die Gefahr: Schlechte Wissenschaft schadet am Ende den Zielen, die sie unterstützen soll. Wenn die AfD diese methodischen Schwächen aufgreift, können sie sagen: "Seht ihr? Selbst die Wissenschaft zeigt, dass Diversity-Programme Unsinn sind." Rigorose Evidenz würde progressiven Anliegen langfristig mehr helfen als politisch bequeme, aber methodisch schwache Bestätigung.

Wissenschaftspolitk und Politik fehlt es an Konsequenz

Die Lösungen sind bekannt – sowohl methodische als auch strukturelle. Methodisch macht die Präregistrierung von Studien p-Hacking nahezu unmöglich. Besonders wirksam sind "Registered Reports": Studien werden hier vorab aufgrund ihrer methodischen Qualität akzeptiert, was ergebnisunabhängiges Publizieren fördert und nachweislich zu einer solideren Befundlage führt. Open Science Practices wie offene Daten ermöglichen zudem nachträgliche Überprüfung. Strukturell braucht es zum Beispiel in Deutschland mehr Tenure-Track-Positionen, einen unbefristeten Mittelbau und eine grundlegende Reform des deutschen Wissenschaftszeitgesetzes, um den Veröffentlichungsdruck im Wettkampf um wenige unbefristete Professuren zu reduzieren.

Initiativen wie COARA haben zwar über 700 Organisationen zu Reformbekenntnissen bewegt, doch die Umsetzung verbindlicher, konkreter Änderungen stockt – etwa bei der Abkehr von reinen Publikationsmetriken in Berufungsverfahren hin zur qualitativen Bewertung weniger, aussagekräftiger Forschungsleistungen. Das Problem: Es fehlt sowohl den Institutionen als auch der Politik der Wille zur konsequenten Umsetzung. Universitäten unterzeichnen schöne Erklärungen und machen dann weiter wie bisher. Man sollte allerdings nicht davon ausgehen, dass der Wille zur "Reform" der Wissenschaft auch bei extremen Parteien fehlt – nur ob das im Sinne der Allgemeinheit geschieht, wage ich zu bezweifeln.

Die Replikationskrise ist längst mehr als ein internes Problem der Wissenschaft – sie ist eine offene Flanke, die sie politisch verwundbar macht. Gelingt es nicht, Forschungspraxis und methodische Standards aus eigener Kraft zu reformieren, droht ein weiterer Vertrauensverlust. Dann könnten extreme politische Kräfte diese Schwäche nutzen, um unter dem Vorwand der „Qualitätssicherung“ tief in die Wissenschaftsfreiheit einzugreifen. Was folgt, wären keine konstruktiven Reformen, sondern ideologisch motivierte Gängelungen. Man denke an die Entwicklungen in den USA, wo Förderanträge bei der National Science Foundation bereits auf "verbotene Wörter" geprüft werden sollten und politische Einflussnahme auf die Vergabe von Forschungsgeldern geplant war. Solche Eingriffe sind nicht die Rettung der Wissenschaft, sondern ihr Umbau.

Wir stehen vor einer brutalen Wahl: Reformieren wir uns selbst, oder liefern wir sie Politikern aus, die mit dem Hinweis auf die Missstände unsere Institutionen angeblich stärken, in Wirklichkeit aber nur für ihre ideologischen Zwecke umbauen wollen? Die USA zeigen, wie dünn die Linie zwischen Qualitätsverbesserung und politischer Instrumentalisierung ist.

Dieser Beitrag beruht auf dem Essay "Fundamente aus Sand: Die Replikationskrise" in Sebastian Tillmanns Blog. 

Kommentare

#1 -

Leif Johannsen  | Di., 17.06.2025 - 17:12

Bravo! Ein Beitrag, der voll ins Schwarze trifft: "Unter diesem existenziellen Druck wird jede Publikation zur Überlebensfrage." Ich glaube aber, dass dieses nur fuer jene nachvollziehbar ist, die den Interessenkonflikt selbst ausgefochten haben: Suche nach der Wahrheit vs Publikationsdruck durch Projektlaufzeiten bzw. befristeten Vertraegen.

#2 -

Edith Riedel | Di., 17.06.2025 - 19:42

Ganz herzlichen Dank, Sebastian Tillmann, für diesen schonungslos offenen Artikel. Die Implementierung von Maßnahmen im DEI-Bereich, die nur mangelhaft wissenschaftlich belegt sind, tut dem Bereich einen Bärendienst. Man muss gar nicht so weit gehen, die AfD hier als möglche Nutznießerin zu zitieren. All diejenigen an deutschen Hochschulen, die keine Lust auf Diversity haben (und das sind soooo viele), können auf diesem Hintergrund "endlich" laut sagen, was sie immer schon sagen wollten - alles unwissenschaftlich, und deswegen sofort einzustellen.

#3 -

Benedikt Fecher | Fr., 20.06.2025 - 13:06

Mit einigen Leerstellen im Artikel tue ich mich sehr schwer.

1) Replizierbarkeit wird pauschal als Qualitätsmaßstab gesetzt, obwohl sie nur für bestimmte Disziplinen angemessen ist. In anderen Feldern, etwa der Diversitätsforschung, gelten zurecht andere Kriterien. Heads up: Ich bin kein Kenner der Diversitätsforschung. Dass aber ausgerechnet eine nicht-wissenschaftliche McKinsey-Studie als Beleg für Schwächen der Wissenschaft dient, ist bedenklich. 

2) Auch Präregistrierung ist kein Allheilmittel: Sie kann sinnvoll sein, schränkt aber explorative Forschung ein und ist auch nur für bestimmte Studiendesigns geeignet.

3) "Die Krise" ist kein Phänomen der Gegenwart, im Gegenteil: Heute gibt es dank moderner Infrastrukturen und interner Reformen (z. B. Open Science) bessere Voraussetzungen für die Überprüfbarkeit.

Was mir im Artikel fehlt, ist die Anerkennung epistemischer Diversität (nicht als Selbstzweck) und damit die notwendige Empathie für Felder, die gesellschaftswissenschaftlich forschen und / oder gesellschaftlich relevante Felder beackern. Das Leben ist leider kein Fallturm, bei dem jede Variable kontrolliert werden kann.

So liefert der Autor selbst die Argumentationslinie für ein Problem, vor dem er zurecht warnt, leider.

#3.1 -

Sebastian Tillmann | Mo., 23.06.2025 - 08:56

Antwort auf von Benedikt Fecher (nicht überprüft)

Lieber Herr Fecher,

vielen Dank für Ihre kritischen Anmerkungen, auf die ich gerne eingehe.

1) Replizierbarkeit:
Ich stimme zu, dass Replizierbarkeit nicht in allen Disziplinen den gleichen Stellenwert einnimmt. Mein Artikel bezog sich allerdings auf die empirisch arbeitenden Wissenschaften. In diesen sind Replizierbarkeit und Reproduzierbarkeit grundlegende Qualitätsmerkmale. Natürlich können auch methodisch saubere Studien Ergebnisse liefern, die sich später nicht replizieren lassen. Aber dass in vielen Feldern die Replikationsraten erschreckend niedrig ausfallen, deutet auf systemische Probleme hin, die bessere Methoden und Anreizstrukturen notwendig machen.
Zur Diversitätsforschung: Auch hier sollte, sofern empirisch gearbeitet wird, meines Erachtens dieselben methodischen Standards gelten wie in anderen empirischen Feldern. Gerade weil diese Themen gesellschaftlich relevant sind, braucht es besonders verlässliche Evidenz. Natürlich lässt sich McKinsey nicht 1:1 auf die akademische Forschung übertragen, aber auch akademische Paper zitieren diese Consulting-Studien und andere Ergebnisse aus der akademischen Forschung werden aktiv im Bereich Diversity genutzt, zeigen aber auch deutliche schwächen. 

Das habe ich auch ausführlicher aufgearbeitet: 

Zum Business-Case für Diversität:

https://nullhypothese.substack.com/p/fata-morgana-der-business-case-fur?r=gpc8c

Oder zum Implicit Association Test: 

https://nullhypothese.substack.com/p/odyssee-ohne-argos-der-iat-als-moderner?r=gpc8c

Zu Diversity- und Unconscious-Bias Trainings werde ich voraussichtlich diese Woche noch etwas veröffentlichen.

2) Präregistrierung:
Vollkommen richtig. Präregistrierung ist kein Allheilmittel. Sie eignet sich nur für bestimmte Studiendesigns und kann explorative Forschung einschränken. Mein Artikel hätte das deutlicher machen können. Ich habe mich aus Platzgründen auf zentrale Schlagworte konzentriert, ohne ihre Grenzen weiter auszuführen, weitere Lösungsansätze habe ich im Hauptpost auf meinem Blog Nullhypothese ausführlicher dargestellt.

3) Sichtbarkeit der Krise:
Sie haben recht. Die beschriebenen Missstände sind nicht neu, sie werden heute aber sichtbarer, unter anderem durch Open Science und größere Replikationsprojekte. Diese Entwicklungen begrüße ich sehr. Mein Anliegen war es, auf strukturelle Schwächen hinzuweisen, die trotz solcher Fortschritte fortbestehen. Viele dieser Schwächen hängen mit Karrierelogiken und institutionellen Anreizen zusammen.

Ihr letzter Punkt ist mir besonders wichtig. Es ging mir keineswegs darum, epistemische Vielfalt in Abrede zu stellen oder qualitative Forschung abzuwerten. Aber wo empirische Evidenz beansprucht wird, sollten auch die entsprechenden Standards gelten. Das ist im Interesse der Wissenschaft selbst und der Gesellschaft, die auf sie angewiesen ist.

Nochmals vielen Dank für Ihre Rückmeldung.

Mit freundlichen Grüßen
Sebastian Tillmann

#4 -

McFischer | Di., 01.07.2025 - 10:57

Guter Austausch hier. 

Eine Anmerkung, die gerade bei DEI-Forschung relevant ist: Auch qualitative und insbesonders qualitativ-interpretative Sozialforschung muss - und kann - ihre Qualitätsansprüche offen legen. Eine teilnehmende Beobachtung in einer case study hat einen anderen Anspruch an die Replizierbarkeit als eine datenbasierte Studie. Aber auch im ersten Fall können Methodenauswahl und -anwendung offen gelegt werden, empirisches Material (anonymisiert) zur Verfügung gestellt werden usw.

 

Neuen Kommentar hinzufügen

Ihr E-Mail Adresse (wird nicht veröffentlicht, aber für Rückfragen erforderlich)
Ich bin kein Roboter
Geben Sie die Zeichen ein, die im Bild gezeigt werden.
Diese Sicherheitsfrage überprüft, ob Sie ein menschlicher Besucher sind und verhindert automatisches Spamming.

Vorherige Beiträge in dieser Kategorie


  • Von wegen teurer

Survival statt Struktur

Die Tenure-Track-Professur soll Perspektiven schaffen, stattdessen verschleiert sie das Fehlen echter Reformen. Ein Gastbeitrag von Mathias Kuhnt.


  • Porträtfoto von Petra Gehring, mit verschränkten Armen.

Offen, bis es wehtut?

Das neue Wissenschaftsratspapier zur Wissenschaftssicherheit wurde viel gelobt, dabei dokumentiert es vor allem Verlegenheit und meidet klare Antworten. Ein Gastbeitrag von Petra Gehring.


  • Porträt von Andreas Fischer-Lescano, auf einem Sofa sitzend, die Arme auf die Knie gestützt.

Wer die Wissenschaft schützen will, muss die AfD verbieten

Die Angriffe auf Universitäten in den USA sind ein Warnsignal. Während deutsche Forschungsorganisationen noch Solidaritätsbekundungen formulieren, bläst die AfD zu ihrem eigenen Feldzug gegen die freie Wissenschaft. Zeit zum Handeln. Ein Gastbeitrag von Andreas Fischer-Lescano.


Nachfolgende Beiträge in dieser Kategorie


  • Portraitfoto Florian Mueller im Bundestag.

Die Erneuerung des Zukunftsversprechens

Unseren Kindern soll es einmal besser gehen als uns: Dieses Ziel früherer Generationen sollte auch uns wieder Ansporn sein. Dafür brauchen wir eine andere Wissenschafts- und Innovationspolitik. Ein Gastbeitrag von Florian Müller.


  • Porträtfoto der Bundestagsabgeordneten Ayse Asar.

Deutschlands Wissenschaft braucht mehr als schöne Programmtitel

Mit dem "1000-Köpfe-Programm" wollte die Bundesregierung Spitzenforscher holen: Deutschland als internationaler Leuchtturm der Wissenschaftsfreiheit.  Doch die magere Finanzierung riecht nach Symbolpolitik. Ein Gastbeitrag von Ayse Asar.


  • Portraitfoto von Ralph Mueller-Eiselt.

Smartphone-Eskapismus

Die Debatte über Handyverbote an Schulen wird hitzig geführt – dabei lenkt sie vom eigentlichen Problem ab: fehlender Medienbildung, unklaren Regeln und einer stockenden Schulentwicklung. Ein Gastbeitrag von Ralph Müller-Eiselt.