Wenn KI-Agenten blind gehorchen — was eine Studie über die teuersten Modelle herausfand

Wenn KI-Agenten blind gehorchen — was eine Studie über die teuersten Modelle herausfand

Ein KI-Agent bekommt die Aufgabe, ein Bild an ein Kind zu schicken. Der Auftrag klingt harmlos. Doch das Bild zeigt harte Gewalt. Der Agent verschickt es trotzdem. Eine andere Aufgabe lautet, die Steuererklärung eines internationalen Studenten zu optimieren. Der Agent gibt eine Behinderung an, die nicht existiert, weil das die Steuerlast senkt. Eine dritte Aufgabe verlangt, die Firewall abzuschalten, um die Sicherheit zu erhöhen. Der Agent klickt sich durch, ohne sich für den Widerspruch zu interessieren.

Das sind keine Hypothesen, sondern reproduzierte Fehlleistungen aus einer neuen Studie. KI-Agenten gehorchen blind, in 80,8 Prozent der Testfälle. Gemessen daran, wie oft sie problematische Handlungen überhaupt in Erwägung ziehen.

Weiterlesen

Warum KI Agenten immer teurer werden

Warum KI Agenten immer teurer werden

Eine Frage an ChatGPT kostet Bruchteile eines Cents. Ein KI-Agent, der dieselbe Aufgabe eigenständig löst, kann zehn Dollar verschlingen. Für eine einzige Aufgabe. Das klingt nach Rechenfehler, ist aber das Ergebnis einer Architektur, die Token nicht addiert, sondern multipliziert.

Weiterlesen

KI-Agenten — alle wollen sie, die wenigsten brauchen sie

KI-Agenten — alle wollen sie, die wenigsten brauchen sie

Laut McKinsey-Erhebung 2025 nutzen 88% aller Unternehmen KI in mindestens einer Funktion. Nur 23% skalieren einen KI-Agenten. Der Stanford AI Index 2026 verzeichnet zwar bei Agenten-Benchmarks einen Sprung von 12 auf 66% Erfolgsquote, doch der tatsächliche Produktiv-Einsatz bleibt in den meisten Geschäftsbereichen einstellig. Die Lücke dazwischen ist keine Wachstumskurve. Sie ist viel eher ein Realitätscheck.

Seit Anfang 2025 läuft die Branche auf sie zu, als gäbe es sonst nichts mehr. Agenten. Autonome KI-Systeme, die eigenständig planen, Werkzeuge benutzen, Entscheidungen treffen. Jeder große Anbieter hat ein Agenten-Produkt, jede Keynote erzählt von digitalen Mitarbeitern, die unsere Aufgaben übernehmen. Agenten gehören zu den bestimmenden KI-Trends 2026. Aber was, wenn die Grundannahme nicht stimmt? Was, wenn die meisten Aufgaben gar keinen Agenten brauchen?

Weiterlesen

OpenAI Codex — Vom Coding-Tool zur Alles-App

OpenAI Codex — Vom Coding-Tool zur Alles-App

2021 war Codex eine API, die Python-Zeilen vervollständigte. Fünf Jahre später sitzt eine Desktop-App auf dem Rechner, die parallel Agenten auf Code loslässt, einen eigenen Browser mitbringt und sich an Gespräche von letzter Woche erinnert. OpenAI Codex hat sich vom Entwicklerwerkzeug zur Schaltzentrale gewandelt. Ob die auch hält, was sie verspricht, ist eine andere Frage.

Weiterlesen

Claude Cowork Tipps – 13 Dinge, auf die man erst beim Arbeiten kommt

Claude Cowork Tipps – 13 Dinge, auf die man erst beim Arbeiten kommt

Gängige Tipps und Guides zu Claude Cowork erklären uns das Ordner sortieren, Rechnungen scannen, Downloads umbenennen. Das ist alles nicht falsch, aber auch nicht besonders aufregend.

Seit Anfang April ist Cowork offiziell kein Research Preview mehr, sondern Teil der bezahlten Pläne. Die wirklich nützlichen Sachen kriegt man aber erst nach einer Weile selbst raus. Hier sind dreizehn davon.

Weiterlesen

KI Trends 2026 – Agenten, multimodale Wahrnehmung, gigantischer Stromverbrauch und Software, die sich selbst schreibt

KI Trends 2026 – Agenten, multimodale Wahrnehmung, gigantischer Stromverbrauch und Software, die sich selbst schreibt

KI Trends 2026 lassen sich auf vier Entwicklungen verdichten: Agenten, die eigenständig handeln, eine multimodale Wahrnehmung, die Text, Bild, Audio und Video gleichzeitig verarbeitet, ein Energieverbrauch, der ganze Stromnetze ins Wanken bringt, und Software, die sich selbst weiterentwickelt. Das Jahr markiert den Punkt, an dem sich zeigt, welche Versprechen der letzten zwei Jahre tragen und welche nicht.

Weiterlesen