Direkt zum Inhalt

"Das wäre ein Durchbruch"

Die Bildungsökonomin Kerstin Schneider über den Forschungsdatengesetz-Entwurf, offene Baustellen und neue Chancen für evidenzbasierte Politik.
Portraitfoto Kerstin Schneider.

Kerstin Schneider ist Professorin  für Finanzwissenschaft und Steuerlehre an der Bergischen Universität Wuppertal, leitet das Wuppertaler Institut für bildungsökonomische Forschung und ist Vorsitzende des Rats für Sozial- und Wirtschaftsdaten (RatSWD), der die Politik zum Ausbau der Dateninfrastruktur berät. Foto: Sven Lorenz / RWI.

Frau Schneider, das BMFTR hat seinen Referentenentwurf zum Forschungsdatengesetz vorgelegt. Endlich, muss man sagen, nachdem die Vorgängerregierung nach den Eckpunkten steckengeblieben ist. Bis zum 10. Februar können Verbände wie der Rat für Sozial- und Wirtschaftsdaten (RatSWD) ihre Stellungnahmen einreichen. Was wird in Ihrer stehen?

Sollte dieses Gesetz so oder in ähnlicher Form kommen, wäre das ein Meilenstein für die Wissenschaft. Inhaltlich hat sich gegenüber den Ampel-Eckpunkten nicht wahnsinnig viel geändert. Es gibt also über die Parteigrenzen hinweg ein breites gemeinsames Verständnis dafür, wie wichtig der bessere Zugang zu Daten und deren Verknüpfung für die Wissenschaft sind. Im Sinne einer stärkeren Forschung, aber letztlich auch mit dem Ziel, der Politik eine evidenzbasierte Steuerung zu ermöglichen. Natürlich gibt es Stellen im Referentenentwurf, an denen noch gearbeitet werden muss. Aber die großen Linien stehen.

"Die fehlende Verknüpfbarkeit hat uns bislang von anderen europäischen Ländern unterschieden."

Ist das Begeisterung über den Entwurf, die da aus Ihnen spricht, oder vor allem Erleichterung, dass es überhaupt vorangeht?

Entscheidend ist, dass das Gesetz überhaupt kommt. Daten, die bislang getrennt waren – etwa in der amtlichen Statistik –, sollen miteinander verbunden werden können. Genau diese fehlende Verknüpfbarkeit hat die deutsche Forschungslandschaft bislang stark von anderen europäischen Ländern unterschieden. Sozial-, Bildungs-, Arbeitsmarkt- oder potenziell auch die Gesundheitsdaten – wenn diese Bereiche zusammengeführt und untereinander nutzbar werden, wäre das wirklich ein Durchbruch. Gerade in der Coronakrise ist uns schmerzlich bewusst geworden, wie blank wir in Deutschland waren, als es zum Beispiel um die Zusammenhänge zwischen Bildungsstand, Lebensumständen und Erkrankungsrisiken ging.

Zum Zweck der Verknüpfung soll ein Deutsches Zentrum für Mikrodaten, kurz DZM, beim Statistischen Bundesamt eingerichtet werden.

Auch das ist der richtige Schritt. Das DZM soll die Daten nicht nur als Treuhänder verknüpfen, sondern die daraus entstehenden Datensätze direkt für die Forschung bereitstellen. Entscheidend ist dabei die praktische Zugänglichkeit, etwa bei der Akkreditierung der Forschungseinrichtungen. Vorgesehen ist, dass sich alle Institutionen beim DZM akkreditieren müssen – jeweils für fünf Jahre. Warum nicht wie in Österreich einfach alle öffentlich-rechtlichen Hochschulen sowie öffentlich finanzierte Forschungseinrichtungen automatisch akkreditieren? Das würde viel Bürokratie sparen. Ein weiterer großer Fortschritt des Gesetzes ist der geplante Remote Access: Forschende sollen künftig von außen auf diese sensiblen Daten zugreifen können – natürlich unter hohen Sicherheits- und Datenschutzstandards.

Wie läuft das denn zurzeit?

Man muss tatsächlich, wenn kein Scientific Use File vorhanden ist, zu den jeweiligen Forschungsdatenzentren fahren, um dort mit den Daten zu arbeiten. Das ist nicht nur aufwendig, sondern auch ein Stück weit diskriminierend – für manche Forschende ist es viel leichter, dort zu arbeiten als für andere, die weiter entfernt leben. Daneben gibt es die sogenannte kontrollierte Datenfernverarbeitung. Diese ist noch viel umständlicher: Man schreibt seinen Code, schickt ihn an das Forschungsdatenzentrum, dort wird er ausgeführt und das Ergebnis zurückgeschickt. Das ist mühsam für die Forschenden und die Forschungsdatenzentren und ist zudem kostenintensiv.

"Die Arbeitsmarktdaten sind im Moment eine einzige Leerstelle." 

Als das frühere BMBF in der vergangenen Legislaturperiode die Eckpunkte präsentierte, war die Kritik in Teilen heftig. Rüdiger Bachmann und Regina Riphahn vom Verein für Socialpolitik forderten, dass ein Forschungsdatengesetz die bestehenden Gesetze und Datenschutzregelungen überschreiben müsse. Sonst stünden weiter forschungsfreundliche Datenschutzregelungen etwa zu den Sozialversicherungsdaten neben Regeln zu Bildungs- oder Firmendaten, die Forschung fast unmöglich machten. Im Referentenentwurf ist weder von einem Vorrang des Forschungsdatengesetzes noch von einer Vereinheitlichung die Rede.

Ich bedaure das auch. Doch wir sollten auf das schauen, was erreicht wurde. Und bevor wir uns Gedanken über die Erhebung neuer Daten machen, geht es doch zunächst darum, mit all den Daten zu arbeiten, die bereits routinemäßig erhoben werden. Und hier klaffen mehrere Lücken im Referentenentwurf. So ist der Artikel 3, der den gesamten Bereich des SGB X, also die Arbeitsmarktdaten, regeln soll, im Moment eine einzige Leerstelle. Ohne diese Daten wäre das Forschungsdatengesetz nur halb so viel wert. Hier ist das Bundesarbeitsministerium in der Verantwortung. Wir gehen davon aus, dass allen Beteiligten in der Gesetzgebung klar ist, wie zentral diese Daten sind und noch forschungsfreundliche Formulierungen abgestimmt werden. Und dann ist da das Thema der Gesundheitsdaten. Diese werden nach dem jetzigen Entwurf nicht einbezogen, und das ist schon sehr bedauerlich. Es gibt zwar das Gesundheitsdatennutzungsgesetz, das in Zukunft Daten in einem Forschungsdatenzentrum verfügbar macht. Doch sie wären bislang nicht verknüpfbar. Gerade die Routinedaten der gesetzlichen und auch der privaten Krankenversicherungen sind perspektivisch für die Forschung wichtig. Hier müssen wir dringend nachbessern. 

Was ist mit der Bildung?

Auch für die Bildung wünschen wir uns mehr. Auf das Bildungsverlaufsregister warten wir noch immer, aber das wird ja hoffentlich bald auf den Weg gebracht. Auch diese Bildungsdaten müssen für die Forschung verfügbar und mit anderen Daten verknüpfbar sein. Ein anderes Beispiel ist die Schuleingangsuntersuchung: Da gibt es unglaublich interessante Informationen über die Kompetenzen von Kindern vor der Einschulung – eine verpflichtende Untersuchung, deren Daten bislang nicht systematisch für die Forschung zur Verfügung stehen und meines Wissens auch im jetzigen Entwurf noch nicht abgedeckt sind.

Über das Thema fehlender Gesetzesvorrang sind Sie jetzt sehr schnell hinweggegangen.

Weil wir abwarten müssen, welche Folgen es tatsächlich hat. Mein Eindruck ist, dass der Schaden im ersten Schritt begrenzt sein wird. Es gibt einen reichen Schatz an vorhandenen Daten, die jetzt noch in unverbundenen Silos liegen und mit dem wir durch die Verknüpfung ganz anders werden arbeiten können. Verknüpfungen muss das Gesetz bereichsübergreifend zulassen – auch für den Arbeitsmarkt und für die Gesundheitsdaten. Natürlich wird am Anfang nicht alles reibungslos laufen, und es wird Punkte geben, an denen man nachsteuern muss. Gerade deshalb ist es so wichtig, von Beginn an eine Evaluation mitzudenken: Nach wenigen Jahren sollte überprüft werden, ob die Ziele erreicht wurden und wo es Nachbesserungsbedarf gibt. Aber auch ohne Vorrang signalisiert der Gesetzentwurf schon jetzt eine neue politische Offenheit, Daten tatsächlich für Wissenschaft nutzbar zu machen. Diese politische Offenheit muss auch für die Governance des geplanten Deutschen Zentrums für Mikrodaten gelten.

Was meinen Sie?

Bevor ich antworte, möchte ich den gelungenen Entstehungsprozess des Gesetzes würdigen. Der Text wurde in Abstimmung mit der Wissenschaft erarbeitet – beginnend mit den Stakeholderverfahren, in denen Forschende gezielt danach gefragt wurden, welche Bedarfe und Erwartungen sie haben. Diese Rückmeldungen sind maßgeblich in den Gesetzentwurf eingeflossen. Diese bewährte Praxis sollte nun auch in der Umsetzung fortgeführt werden. Mit dem Start des DZM muss die Wissenschaft weiterhin eng eingebunden bleiben, etwa durch einen wissenschaftlichen Beirat, in dem auch Vertreterinnen und Vertreter der Forschungsdatenzentren vertreten sind. Dort werden die Daten aufbereitet, dort wird täglich enorme Arbeit geleistet, und dort sind die Kompetenzen entstanden, die auch für das DZM unverzichtbar sind.

Die Bundesregierung will zehn Millionen Euro für den Aufbau des DZM ausgeben, der laufende Betrieb wird mit sechs Millionen Euro veranschlagt. Reicht das?

Wir werden sehen. Doch vermutlich wird man leider um gewisse Gebühren für die Forschenden nicht herumkommen. Diese Gebühren dürfen aber Forschung nicht verhindern und sollten durch Fördermöglichkeiten, etwa über die DFG, flankiert sein. Und ganz zentral ist bei jeder Gebührenordnung: Der Datenzugang muss diskriminierungsfrei bleiben. Das heißt nicht nur, dass Nachwuchsforschende ebenso Zugang haben müssen wie etablierte Wissenschaftlerinnen und Wissenschaftler mit großen Budgets. Es heißt auch, dass kleine Einrichtungen nicht benachteiligt werden dürfen gegenüber großen, finanzstarken Forschungsinstitutionen, die sich hohe Gebühren leisten könnten.

"Daten dürfen nicht gelöscht werden – auch Bildungsdaten nicht."

Parallel zum Forschungsdatengesetz kündigt der schwarz-rote Koalitionsvertrag, Sie haben es erwähnt, die Schaffung eines Bildungsverlaufsregisters an. Außerdem wollen Union und SPD die Einführung einer zwischen den Ländern kompatiblen, datenschutzkonformen Schüler-ID unterstützen. Braucht es all das eigentlich noch, wenn das Forschungsdatengesetz ordentlich gemacht ist?

Die Schüler- oder Bildungs-ID ist ein technisches Vehikel, um innerhalb desselben Bildungsdatensatzes Personen über die Zeit hinweg verfolgen zu können – also sogenannte Längsschnitte vorzunehmen. Beim Forschungsdatengesetz sprechen wir zusätzlich von Verknüpfungen über verschiedene Datensätze hinweg. Das heißt: Wir brauchen die Bildungs-ID perspektivisch dringend, wir brauchen aber in der Bildung noch mehr – zum Beispiel keine Löschfristen. Das gilt aber allgemein und nicht nur für Bildungsdaten.

Also die Zeiträume, für die bestimmte Daten aufgehoben werden dürfen?

Das Problem der Löschfristen im Gesetz hat zwei Dimensionen: das Löschen bereits verknüpfter Daten und das Löschen der Daten selbst. Wenn ich zum Beispiel Bildungs- und Arbeitsmarktdaten miteinander verknüpfen will, werden dafür Schlüsseltabellen erstellt, mit denen man unter Wahrung des Persönlichkeitsschutzes die unterschiedlichen Datensätze miteinander koppeln kann. Diese Schlüssel- oder Verknüpfungstabellen dürfen laut Gesetzentwurf nicht dauerhaft gespeichert werden, was absurd ist, denn sie sind der Dreh- und Angelpunkt der ganzen Arbeit. Wenn man sie wieder löscht, verschwindet die mühsam hergestellte Verbindung zwischen den Daten. Zum anderen geht es um das Löschen der Daten an sich. Da sind wir in vielen Bereichen zwar schon weitergekommen, bei den Bildungsdaten jedoch nicht. Positiv ist, dass die Studienverlaufsdaten aus dem Hochschulstatistikgesetz künftig für die Forschung zugänglich werden und auch beispielsweise mit Arbeitsmarktdaten verknüpft werden dürfen. Das ist ein riesiger Fortschritt. Nur leider müssen Daten (Pseudonyme) der Studienverlaufsstatistik laut Referentenentwurf nach 18 Jahren wieder gelöscht werden. Das ist für uns nicht nachvollziehbar.

Weil die Bildungsdaten besonders schutzwürdig sind.

Diesen Schutz kann man durch moderne technische Standards ohne Weiteres gewährleisten. Bislang müssen die Daten in der Studienverlaufsstatistik sogar bereits vier Jahre nach der Promotion gelöscht werden. Das lässt gar keine sinnvolle wissenschaftliche Analyse zu. Insofern sind die 18 Jahren nach Studienabschluss und Abschluss der Promotion im Gesetzentwurf schon deutlich mehr, aber natürlich immer noch unzureichend. Wer mit 25 Jahren sein Studium beendet, dessen Daten sind mit Mitte vierzig wieder gelöscht – also mitten in der beruflichen Karriere. Dann kann man weder langfristige Erwerbsverläufe analysieren noch später Reformen evaluieren. Und perspektivisch ließen sich auch gesundheitliche Entwicklungen nicht mehr nachvollziehen, falls es irgendwann die Verknüpfung mit Gesundheitsdaten gibt. Deshalb unser klares Plädoyer als RatSWD: Daten dürfen nicht gelöscht werden – auch Bildungsdaten nicht. 

Interview: Jan-Martin Wiarda

Neuen Kommentar hinzufügen

Ihr E-Mail Adresse (wird nicht veröffentlicht, aber für Rückfragen erforderlich)
Ich bin kein Roboter
Geben Sie die Zeichen ein, die im Bild gezeigt werden.
Diese Sicherheitsfrage überprüft, ob Sie ein menschlicher Besucher sind und verhindert automatisches Spamming.

Nachfolgende Beiträge in dieser Kategorie


  • Puzzlestücke, die ineinandergreifen.

Roadmaps, Gesetze und Milliarden

Dorothee Bär löst die Bremsen bei der Hightech-Agenda – und steht schon vor den nächsten Herausforderungen.


  • Spielfiguren symbolisieren kreisfoermiges Beratungsgremium.

Wie viel Strategie steckt im Strategiekreis?

Er soll "das höchste technologie- und innovationspolitische Beratungsgremium der Bundesregierung" sein. Aber wie genau soll der neue "Strategiekreis für Technologie und Innovation" eigentlich arbeiten? Was eine parlamentarische Anfrage der Grünen ergab – und wo sich das Kanzleramt um klare Antworten herumdrückt. 


  • Portraitfoto Irene Bertschek.

"Deutschland ist stark – aber zu langsam"

Am Mittwoch erhielt Bundeskanzler Friedrich Merz sein erstes Jahresgutachten der Expertenkommission Forschung und Innovation. Was drinsteht, sagt die EFI-Vorsitzende Irene Bertschek. Ein Interview über Patenterfolge, Transferlücken, Bürokratie und Karrierewege – und was passiert, wenn Wettbewerb auf zu wenig Grundfinanzierung trifft.