MiniMax M3 schlägt GPT-5.5 beim Programmieren und kostet einen Bruchteil

KI-News: MiniMax M3, 59% SWE-Bench, open weights

MiniMax aus Shanghai hat am Montag sein neues Spitzenmodell M3 veröffentlicht und nennt es das erste Modell mit offenen Gewichten, das drei Dinge gleichzeitig kann: Programmieren auf Spitzenniveau, eine Million Token Kontext und native Verarbeitung von Bild und Video. Bisher war diese Kombination geschlossenen Systemen wie GPT-5.5 und Gemini vorbehalten. Der Haken steht im Kleingedruckten, dazu gleich mehr.

Die Zahlen sind ansehnlich. Auf SWE-Bench Pro, einem Test mit echten Software-Aufgaben, kommt M3 auf 59,0% und liegt damit vor GPT-5.5 (58,6%) und Gemini 3.1 Pro (54,2%), aber hinter Claude Opus 4.7 (64,3%). Der eigentliche Trick steckt in der Architektur. Die neue MiniMax Sparse Attention soll bei einer Million Token nur noch ein Zwanzigstel der Rechenlast brauchen, das Decoding läuft laut Firma 15,6-mal schneller als beim Vorgänger. Der Preis: 0,60 Dollar pro Million Eingabe-Token, 2,40 Dollar für die Ausgabe, in der ersten Woche die Hälfte. Das unterbietet die geschlossene Konkurrenz deutlich.

Für alle, die KI zum Programmieren nutzen, heißt das mehr Auswahl und niedrigere Kosten. Ein günstiges Modell mit riesigem Kontextfenster ist genau das, was Coding-Agenten brauchen, die sich durch große Codebasen oder lange Dokumente fressen müssen. In einem Test ließ MiniMax das Modell knapp zwölf Stunden autonom an einer wissenschaftlichen Aufgabe arbeiten, 18 Commits und 23 Grafiken kamen ohne menschliches Zutun heraus. M3 reiht sich ein in eine Serie chinesischer Open-Weights-Modelle, die den US-Laboren seit DeepSeek und Kimi systematisch Boden abnehmen.

Bleibt das Kleingedruckte. »Offen« ist M3 bislang nur auf dem Papier, die Gewichte und der technische Bericht sollen erst in rund zehn Tagen erscheinen. Ein Teil der Benchmarks lief auf MiniMax‘ eigener Infrastruktur mit eigenem Agenten-Gerüst, unabhängig nachgemessen hat das noch niemand. Und bei abstraktem Denken, etwa auf ARC-AGI-2, hängen chinesische Modelle weiter klar hinter den US-Spitzenreitern. Wer also schon den Abgesang auf die geschlossenen Modelle anstimmt, sollte die zehn Tage lieber abwarten.

Quellen

Ähnliche News

Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.

Bist du bereit für mehr?

Was sagst du dazu?