Direkt zum Inhalt

Open Models statt OpenAI

KI aus der Hochschule, nicht aus dem Silicon Valley: Wie Hochschulen in nur einem Jahr eigene Chat-Interfaces und offene Sprachmodelle etabliert haben – und warum sie jetzt den nächsten Schritt gehen müssen. Ein Gastbeitrag von Benjamin Paaßen.
Artikelbild: Warum Hochschulen jetzt eigene Sprachmodelle hosten sollten

Benjamin Paaßen ist Juniorprofessor für Wissensrepräsentation und maschinelles Lernen an der Universität Bielefeld und Mitgründer des Netzwerks AIDARE – AI and Digital Autonomy in Research and Education. Zeitgleich mit diesem Blog-Eintrag veröffentlicht das Netzwerk ein Strategiepapier für Hochschulleitungen mit dem Titel "KI-Infrastruktur für Digitale Autonomie in Hochschulen". Foto: Studio Monbijou.

ZUM BEGINN DES JAHRES 2024 habe ich auf diesem Blog Hochschulen vorgeschlagen, selbst offene Sprachmodelle zu hosten, um Abhängigkeiten gegenüber kommerziellen Großanbietern zu vermeiden. Als Forschungsnetzwerk „AI and Digital Autonomy in Research and Education“ (AIDARE) veröffentlichen wir mit diesem Blogeintrag ein Papier, in dem wir das Thema KI-Infrastruktur erneut betrachten. Erfreulicherweise können wir feststellen: Die Hochschulen haben das Ziel von damals weitgehend erreicht. Ein Erfolg, der öffentlich bislang zu wenig wahrgenommen wurde. Wie haben die Hochschulen das geschafft?

Eine Erfolgsgeschichte: Hochschul-eigene Chat-Interfaces und offene Sprachmodelle bei Hochleistungsrechenzentren

Viele Hochschulen haben eigene Chat-Interfaces aufgebaut, das heißt: Web-Seiten wie HAWKI oder KI:connect.nrw, über die Hochschulangehörige mit Sprachmodellen chatten können (ganz ähnlich, wie man es von ChatGPT gewohnt ist). Solche Interfaces haben viele Vorteile. Erstens bieten sie allen Hochschulangehörigen den gleichen kostenfreien Zugang. Zweitens verbleiben die persönlichen Daten der Hochschulangehörigen auf den Servern der Hochschule, und nur die Chat-Nachrichten selbst werden zur Beantwortung an externe Server weiter gereicht, auf denen dann die eigentlichen Sprachmodelle laufen. Drittens erlauben uni-weite Verträge häufig wesentlich geringere Kosten pro Anfrage als Einzel-Accounts für die Hochschulangehörigen.

Aus Sicht der digitalen Autonomie ist aber ein anderer Vorteil noch entscheidender: Durch ein eigenes Chat-Interface sind Hochschulen nicht mehr auf einen Vertrag mit einem bestimmten Sprachmodell-Anbieter angewiesen, sondern können beliebige Sprachmodell-Anbieter anschließen. Diesen Umstand hat insbesondere die GWDG als Hochleistungsrechenzentrum genutzt und Hochschulen die Anbindung an eine breite Palette leistungsfähiger Sprachmodelle angeboten, die lokal auf Servern in Göttingen laufen. Viele Hochschulen (und auch hochschulübergreifende Systeme wie HAWKI) haben dieses Angebot angenommen. Seitdem landen viele Sprachmodell-Anfragen nicht mehr bei kommerziellen Anbietern, sondern in Göttingen. Weitere Anbieter wie OpenSourceKI.nrw werden bald hinzukommen, um der wachsenden Nachfrage an den Hochschulen zu begegnen.

Dank dieser fast geräuschlosen Aktivität von Hochleistungsrechenzentren, Hochschul-internen IT-Beauftragten, Hochschulleitungen und KI-Expert*innen kann ich jetzt als Angehöriger der Universität Bielefeld mit einem Klick entscheiden, mit einem offenen Sprachmodell zu chatten, und bin nicht mehr auf kommerzielle Angebote angewiesen.  Ein großer Gewinn für die digitale Autonomie. Hochschulen, die nicht so weit sind, sollten jetzt dringend nachziehen.

Die nächsten Schritte: KI-Werkzeuge für Lehre und Forschung

Chat-Interfaces sind für den Einsatz im Hochschulkontext allerding nur eine Mindestanforderung. Sie reichen für viele Anwendungen nicht aus.

Lernende sollten sich beispielsweise nicht auf die Antworten der Modelle verlassen müssen. Sie sollten in der Lage sein, die Quellen für die Antworten des Modells unter die Lupe zu nehmen. Lehrenden wiederum sollte es möglich sein, die Systemprompts der Modelle einzusehen und zu beeinflussen oder sogar die Quellen vorzugeben – etwa in Form der Lehr- und Lernmaterialien ihrer Veranstaltungen – allerdings ohne diese in ein proprietäres System laden zu müssen.

All diese Anforderungen lassen sich über so genannte "retrieval augmented generation" (RAG)-Systeme realisieren. Prototypen solcher Systeme für die Hochschulen sind bereits bei der GWDG und bei OpenSourceKI.nrw konstruiert worden und werden absehbar für die Hochschulen zur Verfügung stehen. Um die digitale Autonomie ihrer Lernenden und Lehrenden zu fördern, sollten die Hochschulen sich dafür einsetzen, solche Lösungen in ihre e-Learning-Infrastruktur einzubinden.

Auch in der Forschung entstehen neue Methoden, die auf Sprachmodellen aufbauen, etwa die automatische Annotation und Auswertung großer Textmengen nach vorgegebenen Maßstäben, teil-automatisierte Literaturrecherchen oder virtuelle Gesprächspartner für Interaktionsforschung. Solche neuen Methoden sind weit über die Informatik und Computerlinguistik hinaus bedeutsam, bis hinein in die Natur-, Sozial- und Geisteswissenschaften. Aus Sicht der digitalen Autonomie ist dabei entscheidend, dass Forschende die verantwortlichen Autor*innen der Forschung bleiben und jeden Teilschritt verstehen, erklären und wissenschaftlich verteidigen können. Dafür brauchen Forschende nicht nur Zugriff auf die Sprachmodelle selbst, sondern auch auf deren Parameter, Architektur und Trainingsdaten – mindestens im Sinne einer ausführlichen Dokumentation nach akademischen Maßstäben. Diese Anforderungen beschreiben, was ich offene Sprachmodelle nenne, etwa das zuletzt von Schweizer Institutionen veröffentlichte Apertus-Modell.

Rein technisch wären die Schnittstellen der GWDG bereits in der Lage, Sprachmodell-Anfragen von Forschenden zu beantworten. Allerdings dürfte die jetzige Infrastruktur dem absehbaren Ausmaß von forschungsbezogenen Anfragen nicht standhalten. Deshalb sollten Bund und Länder Hochleistungsrechenzentren so ausstatten (mit Hardware und Personal), dass sie Sprachmodellanfragen in großen Volumina beantworten können, so wie in aktuellen Papieren von KI:edu.nrw, des Stifterverbands und der GWDG gefordert.

Digitale Autonomie in Sachen KI verlangt mehr

Die hier vorgestellten technischen Maßnahmen sind nur Teil eines Pfads zu mehr digitaler Autonomie im Feld KI und Hochschule. Der Aufbau von Kompetenzen bei allen Hochschulangehörigen, ethische und rechtliche Standards, gute wissenschaftliche und pädagogische Praxis in den Einzelfächern gehören dazu und vieles andere mehr. Allerdings bilden offene Sprachmodelle als Technik überhaupt erst die Voraussetzung für digitale Autonomie.

Hochschulen sind große Schritte in diese Richtung gelungen. Nun gilt es, die erreichten Erfolge zu verstetigen und weiterzugehen. Dabei braucht es nicht zwangsläufig gewaltigen Investitionen. Die GWDG geht lediglich von einigen Millionen Euro Mehrkosten in den nächsten Jahren ausdas deutlich umfangreichere  Programm des Stifterverbands allerdings von einer Milliarde Euro. Investitionen seitens Bund und Ländern sind in jedem Fall notwendig, um den verlässlichen, gleichmäßigen und autonomieförderlichen Zugang zu KI-Systemen für die Zukunft zu sichern.

Kommentare

#1 -

Marco Winzker | Di., 23.09.2025 - 15:03

Danke für den Beitrag, den ich komplett unterstütze.

Ich möchte ergänzen, dass Studierende mittlerweile dabei sind, KI als Lernhilfe und Tutor zu nutzen. Also nicht (mehr) "KI, gib mir die Lösung" sondern "KI, erklär mir, wie ich hier vorgehen soll". Das wird sich noch weiterentwickeln und wir Hochschulen werden das didaktisch begleiten und fördern. Es braucht dafür KI-Zugang, wie im Artikel beschrieben.

Die genannten Organisationen zeigen Kompetenz in der Bereitstellung von KI-Infrastruktur und was kann es besseres geben als darauf aufzubauen. 

#2 -

Jörg Wittkewitz | Di., 23.09.2025 - 15:21

Solange nicht alle Quellen (Trainingsdaten) des jeweiligen Modells offen gelegt wurden, wie zB beim einzigen mir bekannten Open Model Apertus (Schweiz), sollte man mindestens im akademischen Umfeld Abstand von der Nutzung von Sprachmodellen nehmen (außer z.B. bei marginalen Routineaufgaben per lokalem SLM), da zumindest für die Modelle der bekannteren Firmen, auch wenn sie kostenlos als open-source etikettiert werden, nicht geklärt ist, ob die Entstehung dieser Modelle auf transparenten, und damit offen gelegten Datenquellen basieren, wenn man mal von den urheberrechtlichen Fragen absehen möchte. 
Ich verstehe durchaus, dass es sinnvoll erscheint, mittels dieser neuesten Idee mehr Datenbanklizenzen durch Sprachmodelle zu verkaufen, wie zuvor bei Archiven, digitaler Kommunikation, Content oder Process Management sowie Enterprise Intelligence, was gern mit Kostenreduktion begründet wird. Und was regelmäßig angesichts neuer Positionen sowie Wartungs- und Lizenzkosten nicht eingelöst wird. Angesichts der bescheidenen Produktivitätsgewinne durch LLM (abgesehen von der Heirat mit Robotik in der Automation) ist die Beschäftigung möglicherweise wieder ein ressourcenfressender Zeitvertreib ohne reale Relevanz, wie weiland bei Blockchain, Metaverse, NFT und ähnlichen "Disruptionen"... erinnert sich noch jemand an die Milliarden die in der europäischen Suchmaschine verschwanden oder in der Digitalisierung der Behörden seit dem Jahr 2000? Wir sollten langsam schlau werden, vor allem die Hochschulen.

Neuen Kommentar hinzufügen

Ihr E-Mail Adresse (wird nicht veröffentlicht, aber für Rückfragen erforderlich)
Ich bin kein Roboter
Geben Sie die Zeichen ein, die im Bild gezeigt werden.
Diese Sicherheitsfrage überprüft, ob Sie ein menschlicher Besucher sind und verhindert automatisches Spamming.

Vorherige Beiträge in dieser Kategorie


  • Portraitfoto von Dominik Fischer

Schöne Titel, harter Test

Mit der "Hightech-Agenda Deutschland" und den "1000-Köpfe-plus" will Forschungsministerin Dorothee Bär durchstarten. Doch ob daraus echter Schub für Wissenschaft und Innovation entsteht, entscheidet sich an Umsetzung, Tempo und Mut zum Risiko. Ein Gastbeitrag von Dominik Fischer.


  • Artikelbild: Wie laut müssen die Signale eigentlich sein?

Mehr gelernt, als die Rankings verraten

Wo Studien Alarm rufen, beweisen Lehrkräfte und Kinder tagtäglich Fortschritt: Warum wir unser Bild von guter Schule revidieren sollten. Ein Gastbeitrag von Markus Warnke.


  • Azubis

Jeder Azubi zählt

Warum die berufliche Bildung im Zentrum einer zukunftsfesten Fachkräftestrategie stehen muss – und weshalb junge Menschen mit Migrationsgeschichte dabei unverzichtbar sind. Ein Gastbeitrag zum Ausbildungsstart 2025 von Anja Reinalter und Theresa Schopper.


Nachfolgende Beiträge in dieser Kategorie


  • Gezeichnete Skizze einer Hand, die ein Pressemikrofon haelt.

Der Wissenschaftsjournalismus muss politischer werden

Warum sich Wissenschaftsjournalismus nicht länger auf Berichte aus Forschung und Labor beschränken darf – und welche politischen Aufgaben er übernehmen muss. Ein Plädoyer von Manfred Ronzheimer.


  • Portraitfoto von Hanna Pfeifer vor dunklem Hintergund.

Die Verantwortung der Wissenschaft

Wissenschaft ist angewiesen auf demokratische Institutionen und Menschenwürde. Wenn diese durch Massengewalt bedroht werden, darf sie sich nicht auf Neutralität zurückziehen. Ein Gastbeitrag von Hanna Pfeifer. 


  • Portraitfoto von Alena Froede.

Die Professur auf Zeit, das System auf Probe

Ohne klare Gesetze und verlässliche Ressourcen bleibt der Tenure-Track ein Risiko für Nachwuchs und Hochschulen. Ein Gastbeitrag von Alena Fröde.