Meituan baut ein 1,6-Billionen-Modell ganz ohne Nvidia

Meituan kennt man in China als Lieferdienst für das Abendessen. Jetzt hat die Firma eines der größten offenen Coding-Modelle der Welt veröffentlicht. LongCat-2.0 ist seit dem 30. Juni auf Hugging Face frei verfügbar, ein Mixture-of-Experts-Modell mit 1,6 Billionen Parametern. Der eigentliche Clou steht im Kleingedruckten: Trainiert wurde es komplett auf chinesischen Chips, kein einziger Nvidia-Beschleuniger war beteiligt.

Die Zahlen sind happig. Pro Token feuern nur 33 bis 56 Milliarden Parameter, der Rest schläft, das hält die Sache effizient. Das Kontextfenster fasst eine Million Token, also gut und gern eine komplette Codebasis am Stück. Auf SWE-bench Pro landet das Modell bei 59,5, auf Terminal-Bench bei 70,8, beides Tests für echte Programmieraufgaben. Trainiert wurde auf einem Cluster aus 50.000 heimischen Karten, das laut Meituan in dieser Größe ein Novum für rein chinesische Hardware ist. Keine A100, keine H100, keine MI300X.

Und genau da wird es unbequem für Washington. Seit Ende 2022 sollen Exportkontrollen China von den schnellsten KI-Chips fernhalten. Ein Essenslieferant baut jetzt ein Billionen-Parameter-Modell ganz ohne diese Chips und stellt die Gewichte zum freien Download ins Netz. Jedes Modell, das so entsteht, macht die Sperren ein Stück weniger wirksam. Für Entwickler heißt das mehr Auswahl bei den offenen Modellen, mehr Druck auf die Preise und einen weiteren Namen auf der langen Liste chinesischer Coding-KIs neben DeepSeek, Qwen und Kimi.

Ob die heimischen Chips bei Tempo und Stromverbrauch wirklich mit Nvidia mithalten, sagt Meituan nicht. Das wäre dann doch die interessantere Zahl gewesen.

Quellen

Ähnliche News

Bist du bereit für mehr?

Was sagst du dazu?