AGI — Wann kommt die künstliche Superintelligenz?

Demis Hassabis leitet Google DeepMind, hat 2024 den Nobelpreis für Chemie bekommen und gilt nicht als jemand, der leichtfertig Versprechen macht. Unter den Chefs der großen Labore ist er der Vorsichtige. Trotzdem sagte er Anfang 2025, AGI sei wahrscheinlich in drei bis fünf Jahren da. Andere aus der ersten Reihe nennen kürzere Fristen. Sam Altman, Dario Amodei, Leute, die die Modelle bauen und wissen, was in den Laboren liegt.

KI-News Modell-Release DeepSeek schiebt sein kleines Modell am eigenen Flaggschiff vorbei vor 46 Minuten

Angenommen, sie haben recht. Was dann?

Die Frage klingt nach Science-Fiction, ist aber gerade die nüchternste, die man stellen kann. Wenn eine Maschine kommt, die jede geistige Arbeit übernehmen kann, verschiebt sich nicht ein Werkzeug, sondern die Grundlage davon, wofür Menschen bezahlt werden. Bevor man dahin kommt, lohnt ein Schritt zurück. Was genau ist eigentlich gemeint, wenn von AGI die Rede ist?

Inhaltsverzeichnis

Was AGI eigentlich bedeutet

AGI steht für Artificial General Intelligence, also künstliche allgemeine Intelligenz. Gemeint ist ein System, das jede intellektuelle Aufgabe lösen kann, die ein Mensch lösen kann, ohne dass es vorher speziell darauf trainiert wurde. Heute sind KI-Modelle bemerkenswert gut in bestimmten Bereichen. Sprache, Code, Bilder, Schach. Aber sie sind im Kern enggeführte Spezialisten, auch wenn sie sich breit anfühlen.

Die Abgrenzung lautet so. Schmale KI gegen allgemeine KI. Schmale KI erledigt das, wofür sie trainiert wurde, mit beeindruckenden Ergebnissen. AGI wäre ein einziges System, das ohne spezielles Training Recht prüft, Forschungsfragen entwirft, ein Auto steuert und einen Witz schreibt. Und das mindestens so gut wie ein durchschnittlich kompetenter Mensch, der diese Dinge gelernt hat.

AGI (Artificial General Intelligence) ist ein hypothetisches KI-System mit menschenähnlicher allgemeiner Intelligenz. Es kann ohne aufgabenspezifisches Training Probleme aus beliebigen Domänen lösen. Im Juni 2026 existiert kein System, das diesen Anspruch erfüllt.

So weit die Lehrbuchdefinition. In der Praxis zerfasert der Begriff. OpenAI definiert AGI in der eigenen Charta als »hochautonome Systeme, die Menschen bei den meisten wirtschaftlich wertvollen Aufgaben übertreffen«. DeepMind misst Leistung und Breite und unterscheidet sechs Stufen. Anthropic-Chef Dario Amodei vermeidet den Begriff ganz und spricht lieber von einem »Land aus Genies in einem Rechenzentrum«. Yann LeCun, einer der Mitbegründer des modernen Deep Learning, hält AGI für ein Marketingwort und denkt, dass der heutige Pfad sie ohnehin nie erreicht.

Wer also sagt »wir bauen AGI«, sagt nicht zwangsläufig dasselbe wie der nächste.

Eine kurze Geschichte des Begriffs

Der Ausdruck Artificial General Intelligence kam Anfang der 2000er Jahre auf. Er war eine Reaktion. KI-Forschung war seit Jahrzehnten in tausend Spezialprobleme zerfallen, Schachprogramme hier, Spracherkennung dort, jedes System unfähig, sich auch nur einen Millimeter neben seine Aufgabe zu bewegen. Eine Gruppe von Forschern wollte zurück zur ursprünglichen Frage. Können wir eine Maschine bauen, die wirklich denkt?

Die Idee dahinter ist älter. Alan Turing hatte schon 1950 gefragt, ob Maschinen denken können, und einen Test dafür entworfen. Die Geschichte der künstlichen Intelligenz kennt seither mehrere Wellen von Euphorie und Ernüchterung. Was sich seit etwa 2017 geändert hat, ist die Architektur. Transformer-Modelle skalieren erstaunlich gut, je mehr Daten und Rechenleistung sie bekommen. Und plötzlich tauchten in einem System, das eigentlich nur das nächste Wort vorhersagen sollte, Fähigkeiten auf, die nicht eintrainiert waren. Genau dieser Effekt hat die AGI-Debatte aus dem akademischen Nischenfach in die Nachrichten gespült.

Zeittafel: AGI als Idee und Begriff

1950	Alan Turing formuliert das »Imitation Game«, später bekannt als Turing-Test
1956	Dartmouth-Konferenz, der Begriff »Artificial Intelligence« entsteht
1970er	Erster KI-Winter nach übertriebenen Versprechen
2001	Begriff »Artificial General Intelligence« etabliert sich, unter anderem durch Ben Goertzel und Shane Legg
2015	Gründung von OpenAI mit AGI als ausdrücklichem Ziel
2017	Transformer-Architektur veröffentlicht (»Attention is all you need«)
2022	ChatGPT erscheint, AGI wird Talkshow-Thema
2023	DeepMind veröffentlicht das »Levels of AGI«-Rahmenwerk
2025	Erste Aussagen führender Labore, AGI sei »in zwei bis drei Jahren« greifbar
2026	ARC-AGI-3 erscheint, Frontier-Modelle scheitern bei unter 1 Prozent

Was AGI von heutiger KI unterscheidet

Ein heutiges Sprachmodell kann eine juristische Akte zusammenfassen, einen Reisebericht schreiben und Python-Code debuggen. Das wirkt allgemein. Ist es nicht. Was solche Modelle leisten, sind Übertragungen aus dem Trainingsmaterial. Sie haben gigantische Textmengen verarbeitet, daraus statistische Muster gezogen und ahmen diese Muster nach. Was sie nicht gesehen haben, können sie schlecht. Wirklich neue Probleme, die keine sprachliche Ähnlichkeit zu Bekanntem haben, lassen sie scheitern.

Genau hier setzt der Begriff Skill-Acquisition Efficiency an, den Chollet 2019 in seinem viel zitierten Aufsatz On the Measure of Intelligence einführte. Intelligenz, so seine These, ist nicht die Summe gelernter Fähigkeiten, sondern die Effizienz, mit der ein System neue Fähigkeiten aus wenigen Beispielen erwirbt. Ein Kind, das ein neues Spiel nach zwei Runden versteht, ist intelligenter als ein System, das eine Million Trainingsbeispiele gesehen hat und nur dort gewinnt, wo die Beispiele aufhören.

Heutige KI und hypothetische AGI im Vergleich

	Heutige Sprachmodelle	Hypothetische AGI
Lernweise	Vor-Training auf riesigen Datenmengen	Lernt neue Aufgaben aus wenigen Beispielen
Übertragbarkeit	Schwach außerhalb des Trainingsbereichs	Wechselt Domänen ohne Neuanpassung
Planung	Wenige Schritte, brüchig bei langen Ketten	Plant über Wochen, hält Ziele konstant
Weltmodell	Statistik über Texte	Ursache und Wirkung in der Welt
Fehlertyp	Plausibel klingende Halluzinationen	Erkennt, was sie nicht weiß
Autonomie	Benötigt menschlichen Kontext und Eingaben	Setzt eigenständig Ziele und revidiert sie

Wer von AGI spricht, meint also nicht ein noch größeres ChatGPT, sondern ein System mit fundamental anderem Verhalten. Wie groß der Abstand wirklich ist, bleibt umstritten. Manche halten ihn für überbrückbar mit mehr Rechenleistung, andere für eine Frage der Architektur. Wieder andere für ein Missverständnis darüber, was Intelligenz überhaupt ist.

Die sechs Stufen von DeepMind

2023 veröffentlichten Forscher von Google DeepMind, darunter Shane Legg, der den Begriff AGI mitgeprägt hat, ein Rahmenwerk mit dem Titel Levels of AGI. Die Idee folgt grob dem Vorbild der Stufen autonomen Fahrens. Statt eines binären »ist es AGI oder nicht« sechs Stufen, gestaffelt nach Leistung und Breite. Ein gemeinsames Vokabular, mit dem sich Fortschritte halbwegs sauber einordnen lassen.

Die Einordnung der heutigen Spitzenmodelle ist umstritten. DeepMind selbst hatte 2023 GPT-4 als Emerging AGI klassifiziert, also auf der niedrigsten Stufe und nur in Teilbereichen. Bei besser strukturierten Aufgaben, etwa Programmierung oder formaler Mathematik, erreichen aktuelle Modelle stellenweise Level 3, also Expertenniveau. In anderen Bereichen, vor allem dort, wo neuartiges Schlussfolgern gefragt ist, bleiben sie auf Level 1 oder darunter. Das gleiche Modell, je nach Aufgabe völlig unterschiedliche Stufen.

Daran lässt sich ablesen, was die Debatte so unübersichtlich macht. AGI ist kein einzelner Schwellenwert. Sie ist eine Fläche, und Modelle bewegen sich auf ihr ungleichmäßig. Genau deshalb führt die Vorstellung in die Irre, AGI sei das »menschliche Niveau«, über das hinaus die Superintelligenz beginnt. In schmalen Feldern liegt KI längst weit über jedem Menschen, etwa beim Schach oder bei der Proteinfaltung, und versagt zugleich an Aufgaben, die ein Kind löst. Was fehlt, ist nicht Höhe, sondern Breite.

Wann kommt AGI — die drei Lager

Wer die Frage nach dem Zeitpunkt stellt, bekommt drei sehr unterschiedliche Antworten, je nachdem, wen er fragt. Die Denkschulen der KI-Debatte liefern dazu die Hintergrundmusik, aber für AGI selbst lassen sich die Stimmen in drei Lager sortieren.

Das erste Lager nennt sich gern realistisch und meint nah dran. Dario Amodei von Anthropic schreibt in seinem Essay Machines of Loving Grace von Systemen, »klüger als ein Nobelpreisträger in den meisten Fächern«, als Zielmarke nennt er 2026 bis 2027. Sam Altman von OpenAI erklärte Anfang 2025, sein Unternehmen wisse inzwischen, wie man AGI baut. Demis Hassabis von DeepMind, der Vorsichtige unter ihnen, sprach Anfang 2025 von drei bis fünf Jahren und blieb Anfang 2026 dabei, AGI komme kurz nach 2030. Die Argumentation läuft so. Skalierung funktioniert, neue Reasoning-Architekturen funktionieren, Investitionen in dreistelliger Milliardenhöhe fließen, also kommt das Ergebnis.

Das zweite Lager hält dagegen. Yann LeCun, jahrelang Chefwissenschaftler von Meta, verließ das Unternehmen Ende 2025 und gründete AMI Labs. Seine These ist seit Jahren dieselbe. Sprachmodelle sagen das nächste Wort vorher, sie haben kein Modell der physischen Welt, sie verstehen weder Ursache noch Wirkung. Wer mit dieser Architektur AGI bauen will, ist auf der falschen Spur. LeCun setzt auf sogenannte Weltmodelle, also Systeme, die aus Video- und Sensordaten lernen, wie die Welt funktioniert. Wann AGI kommt? Plausibel in zehn oder zwanzig Jahren, vermutlich nicht über den Weg, den die großen Labore gerade gehen.

Das dritte Lager hält die Frage selbst für falsch gestellt. AGI sei ein Marketingbegriff, sagt Amodei, obwohl er ihn benutzt. Gary Marcus, Kognitionsforscher und einer der schärfsten Kritiker der LLM-Linie, hält AGI in absehbarer Zeit schlicht für unwahrscheinlich. Aggregierte Umfragen unter KI-Forschern landen häufig bei einem Median um 2040 bis 2050, mit großer Streuung. Wer hier zuhört, sieht vor allem, wie unklar das Ziel ist.

Ein Muster sticht heraus. Die optimistischen Stimmen kommen meist aus den Häusern, die AGI verkaufen. Die skeptischen meist aus akademischen Kontexten oder von Forschern, die ihre Firma verlassen haben. Wer eine Technologie ankündigt, an deren Verkauf er verdient, hat ein Interesse an der frühen Zahl. Das ist kein Beweis für eine Position, aber ein Hinweis, dem man Aufmerksamkeit schenken kann.

Was AGI ändern würde

Setzen wir voraus, AGI kommt, und sei es am vorsichtigen Ende der Schätzungen kurz nach 2030. Dann wäre der Unterschied nicht graduell, sondern struktureller Natur. Bisher ist KI ein Werkzeug, das ein Mensch in der Hand hält. AGI wäre eine Instanz, die selbständig Aufgaben annimmt, Pläne fasst, sie umsetzt und Korrekturen einbaut. Wirtschaftlich betrachtet ist das ein Übergang von »jeder Mitarbeiter wird produktiver« zu »ganze Berufe können ohne Mitarbeiter laufen«.

Konkret wird das an einem einfachen Bild. Eine Kanzlei, die heute dreißig Juristen für Recherche, Schriftsätze und Vertragsprüfung beschäftigt, käme womöglich mit drei aus, die einem System zuarbeiten und seine Ergebnisse verantworten. Nicht weil die Arbeit verschwindet, sondern weil eine Maschine den Großteil davon übernimmt. Dieselbe Logik lässt sich auf Buchhaltung, Übersetzung, Verwaltung und weite Teile der Softwareentwicklung übertragen. Überall dort, wo der Wert einer Tätigkeit im Verarbeiten von Information liegt, verschiebt sich das Verhältnis von Mensch und Werkzeug.

Wissenschaft wäre ein Bereich, in dem sich der Sprung am schnellsten zeigen würde. AGI könnte die gesamte verfügbare Literatur eines Feldes lesen, Hypothesen entwerfen, Experimente vorschlagen, deren Ergebnisse einordnen, und das ohne menschlichen Zwischenruf bei jedem Schritt. Wer das ernst nimmt, sieht in AGI weniger einen Mitarbeiter als einen Verstärker der wissenschaftlichen Methode.

Die eigentliche Frage ist damit nicht, welche Branche betroffen ist. Betroffen sind plausibel fast alle. Sie lautet, welche menschliche Tätigkeit noch sinnvoll und welche bloß noch günstig wäre. Das ist im Kern keine technische, sondern eine gesellschaftliche Frage.

Benchmarks und der Streit darum

Wenn niemand sich auf eine Definition einigt, wie misst man dann den Fortschritt? Die Antwort lautet, mit Benchmarks. Und genau dort beginnt das nächste Problem. Modelle werden so gut darin, bestimmte Tests zu bestehen, dass die Tests ihre Aussagekraft verlieren. MMLU, früher als anspruchsvolle Allgemeinbildungsprüfung gedacht, ist von Frontier-Modellen weitgehend »gesättigt«. Heißt, sie liegen nahe am Maximum, ohne dass das viel über echte Intelligenz aussagen würde.

Chollets ARC-AGI-Serie ist die Antwort auf diese Erosion. Die Tests bestehen aus Aufgaben, deren Lösungsregel man aus einer Handvoll Beispiele erschließen muss. Sie sind so konstruiert, dass Auswendiglernen nicht hilft. Im Dezember 2024 sprang ein Reasoning-Modell von OpenAI auf ARC-AGI-1 von Plateau-Werten plötzlich nahe an die menschliche Leistung. Ende 2025 wiederholte sich der Effekt bei ARC-AGI-2 mit agentischen Coding-Systemen. Im März 2026 erschien ARC-AGI-3, ein interaktiver Benchmark mit Spielen ohne Anleitung. Frontier-Modelle lagen beim Start unter 1 Prozent, Menschen lösen die Aufgaben vollständig.

Man kann diese Zahl in beide Richtungen lesen, und das ist der Punkt. Sie zeigt nicht, dass KI dumm ist. Dasselbe Modell, das ARC-AGI-3 nicht löst, schreibt anderswo Code auf Expertenniveau. Sie zeigt, dass ARC eine bestimmte Art von Intelligenz misst, nämlich das Erschließen neuer Regeln ohne Anleitung, und dass genau diese Fähigkeit heutigen Systemen schwerfällt. Der Fortschritt verläuft ungleichmäßig. Wer aus einem niedrigen Benchmark-Wert ableitet, AGI sei weit weg, übersieht, wie schnell frühere ARC-Versionen gefallen sind, sobald eine neue Technik reifte.

Die Risiken jenseits der Science-Fiction

Über die Risiken von AGI wird gern in Bildern aus dem Kino geredet. Maschinen, die rebellieren. Das ist die dünnste der Sorgen. Substantieller sind drei andere.

Erstens das Alignment-Problem. Wie stellt man sicher, dass ein System, das klüger ist als seine Aufseher, auch das tut, was diese wirklich meinen, statt das, was sie wörtlich gesagt haben? Anthropic, OpenAI und DeepMind betreiben dazu eigene Sicherheitsabteilungen, mit Methoden wie Constitutional AI, Red-Teaming und Interpretierbarkeitsforschung. Hinweise aus Experimenten, dass sich KI-Systeme unter bestimmten Bedingungen taktisch verstellen, gibt es bereits. Ob sich das mit besseren Methoden in den Griff kriegen lässt, ist offen.

Zweitens die Konzentration. Wer immer AGI baut, kontrolliert eine Technologie, deren Wert in der Geschichte kein Vergleich kennt. Heute sind das drei oder vier Unternehmen, weitgehend in den USA, ergänzt durch chinesische Labore mit eigener Linie. Wie die Gewinne, die Daten und die Entscheidungsmacht verteilt werden, ist eine politische Frage, die kaum verhandelt wird, weil sie zu abstrakt klingt, solange das Produkt nicht existiert.

Drittens die Geschwindigkeit. Selbst wenn AGI nicht morgen erscheint, hat allein die Erwartung Folgen. Investitionen, Arbeitsmarktreaktionen, Bildungssysteme, alles muss sich auf etwas einstellen, das sich permanent verschiebt. Womöglich ist das die wirklich anstrengende Eigenschaft der Debatte. Sie zwingt zu Entscheidungen unter Unsicherheit, bei denen ein Fehler in beide Richtungen teuer ist.

Warum die Frage trotzdem zählt

Es gibt eine ehrliche Position, die etwa so lautet. Niemand weiß, ob AGI in fünf Jahren kommt, in fünfzig oder gar nicht. Was wir wissen, ist, dass die Modelle besser werden, dass sie in immer mehr Bereiche eindringen und dass selbst eine schwächere Variante reicht, um Berufe und Branchen umzubauen. Wer auf die formale Schwelle wartet, bevor er hinschaut, wartet zu lange.

Mehr noch. Der Begriff AGI ist selbst Teil des Geschehens. Er treibt Investitionsentscheidungen, politische Debatten und die Selbstdarstellung der großen Labore. Wer den Begriff nicht versteht, versteht nicht, worauf sich die KI-Industrie offiziell zubewegt, was sie verkauft und worauf sie sich öffentlich verpflichtet.

Vielleicht ist AGI das, was wir denken. Vielleicht ist sie weniger. Vielleicht entsteht etwas, das wir AGI nennen, ohne dass es dem alten Ideal entspricht. Was ziemlich sicher nicht passiert, ist, dass die Frage in den nächsten Jahren verschwindet. (lk)

Quellen und weiterführende Lektüre

Morris et al., Levels of AGI: Operationalizing Progress on the Path to AGI, Google DeepMind, 2023, arxiv.org/abs/2311.02462
François Chollet, On the Measure of Intelligence, 2019, arxiv.org/abs/1911.01547
ARC Prize Foundation, ARC-AGI-3, 2026, arcprize.org/arc-agi
Dario Amodei, Machines of Loving Grace, Anthropic, 2024, darioamodei.com/essay/machines-of-loving-grace
OpenAI, Charter, 2018, openai.com/charter