Mit KI lernen fühlt sich gut an, bis die Klausur kommt

Du löst mit ChatGPT auf einmal Matheaufgaben, die vorher unmöglich aussahen. Sauber, zügig, eine nach der anderen. Wochen später sitzt du in der Klausur, kein Chatbot erlaubt, und schneidest schlechter ab als die Mitschüler, die ohne KI geübt haben.

KI-News Modell-Release Meituan baut ein 1,6-Billionen-Modell ganz ohne Nvidia vor 11 Minuten

Genau dieses Muster hat die OECD Anfang 2026 in ihrem großen Bildungsbericht dokumentiert. Mit KI lernen hebt die Leistung im Moment, aber nicht zwangsläufig das, was am Ende im Kopf bleibt. Die Aufgabe zwar gelingt, das Lernen bleibt aber aus.

Inhaltsverzeichnis

Der Riss zwischen Können und Wissen

Die zentrale Beobachtung des OECD Digital Education Outlook 2026 klingt unspektakulär und ist es nicht. Eine Aufgabe mit KI zu lösen heißt nicht, dabei etwas zu lernen. Wer den Chatbot fragt, bekommt ein Ergebnis, das oft besser aussieht als das eigene. Nur entsteht Verstehen nicht beim Lesen einer fertigen Lösung, sondern beim Ringen damit. Und dieses Ringen fällt weg.

Das Tückische ist das Gefühl dabei. Eine schlüssige Antwort vor sich zu haben fühlt sich an wie Verstehen, ist im Kern aber nur Wiedererkennen. Diese Verwechslung von Erkennen und Können trägt einen Namen, die Illusion des Wissens, und sie ist beim Lernen mit KI womöglich das größte Risiko.

Der OECD Digital Education Outlook ist ein internationaler Bildungsbericht der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung. Die Ausgabe vom Januar 2026 wertet erstmals systematisch aus, was generative KI mit dem Lernen macht. Kernbefund: Sie kann die Aufgabenleistung heben, ohne den Lernerfolg zu verbessern.

Das Experiment aus der Türkei mit fast tausend Schülern

Wie groß der Effekt ausfällt, zeigt ein Feldversuch, den Forscher um Hamsa Bastani an einer türkischen Schule durchgeführt und 2025 in den Proceedings of the National Academy of Sciences veröffentlicht haben. Knapp tausend Schüler der neunten bis elften Klasse übten Mathe in vier Sitzungen, aufgeteilt in drei Gruppen. Eine ohne KI, eine mit normalem GPT-4, eine mit einer Tutor-Version, die nicht die Lösung ausspuckt, sondern Schritt für Schritt durch die Aufgabe führt.

Beim Üben zog die KI die Leistung steil nach oben. Gemessen an den korrekt gelösten Übungsaufgaben löste die Gruppe mit dem normalen Chatbot sie 48 Prozent besser als die Gruppe ohne Hilfe, die Tutor-Gruppe sogar 127 Prozent besser. So weit die gute Nachricht.

Schüler, die mit einem ungefilterten Chatbot Mathe übten, schnitten in der anschließenden Prüfung ohne KI 17 Prozent schlechter ab als Schüler, die ganz ohne KI gelernt hatten. Das Werkzeug, das beim Üben so überlegen wirkte, hatte sie unterm Strich schwächer gemacht. Bei der Tutor-Gruppe blieb dieser Einbruch aus, sie lag in der Prüfung gleichauf mit der Kontrollgruppe.

Die drei Gruppen im Türkei-Experiment

	Beim Üben mit KI	In der Prüfung ohne KI
Ohne KI (Kontrolle)	Score 0,28 (Referenz)	Referenzwert
Normaler Chatbot	+48 Prozent	17 Prozent schlechter
KI als Tutor	+127 Prozent	gleichauf mit Kontrolle

Warum mit KI lernen das Gehirn austrickst

Warum arbeitet ausgerechnet die bessere Übungsleistung gegen den Lernerfolg? Die Antwort steckt in dem, was beim Lernen eigentlich passieren müsste und mit KI ausbleibt. Forscher um Yizhou Fan beschreiben in einer 2025 im British Journal of Educational Technology veröffentlichten Studie ein Phänomen, das sie metakognitive Faulheit nennen. Wer eine KI danebenhat, hört auf, das eigene Denken zu überwachen. Die Aufgabe, einzuschätzen, was sitzt und was noch hakt, wandert an die Maschine. Die Essays der Teilnehmer wurden besser, ihr Wissenstransfer auf neue Aufgaben nicht.

Metakognition ist das Nachdenken über das eigene Denken. Beim Lernen heißt das, einzuschätzen, was man schon verstanden hat und woran es noch hakt. Genau diese Selbstkontrolle lässt nach, wenn eine KI die geistige Arbeit übernimmt.

Das deckt sich mit dem, was unter dem Stichwort kognitives Offloading beschrieben wird, dem Auslagern geistiger Arbeit an die Maschine. Bequem im Moment, teuer auf Dauer. Der Effekt reicht sogar über das einzelne Lernen hinaus. Sprachmodelle stauchen auch die Bandbreite dessen zusammen, was Menschen hervorbringen, wie eine Studie zu KI-gestützter Argumentation zeigt.

Warum mit KI lernen trotzdem funktionieren kann

Die Tutor-Gruppe ist der Grund, nicht in Panik zu verfallen. Sie übte mit derselben Technik, nur anders eingestellt. Diese Version gab nie die fertige Lösung, sondern stellte Rückfragen, gab Hinweise, ließ die Schüler selbst rechnen. In der Prüfung lag sie gleichauf mit der Kontrollgruppe. Kein Schaden, bei deutlich besserem Üben.

Der Unterschied steckt nicht im Modell, sondern in der Haltung. Eine KI, die führt statt vorsagt, hält die Denkarbeit beim Lernenden. Genau das macht aus einem Antwortautomaten einen echten Lernmodus. Auch die OECD landet bei diesem Punkt. Speziell für Bildung gebaute KI verbessert das Lernen nachhaltig, ein beliebiger Allzweck-Chatbot eher nicht.

Was das für dein Lernen heißt

Die Lehre aus all dem ist kein Verbot, sondern eine Einstellungssache. Lass dir nicht die Lösung geben, lass dich fragen. Formuliere die Aufgabe an die KI so, dass sie dich durch die Schritte führt und am Ende dich rechnen lässt, nicht sich selbst. Rechne, schreibe, argumentiere zuerst und nutze die KI danach als Prüfinstanz, nicht als Abkürzung. Wer es genauer wissen will, findet sieben Methoden, die das Denken schärfen statt es zu ersetzen.

Die Klausur merkt den Unterschied. Sie ist die einzige Instanz, die nicht beeindruckt davon ist, wie gut sich das Üben angefühlt hat. (lk)