DeepSeek verschenkt seinen Tempo-Trick und benchmarkt ihn gleich selbst

KI-News: DeepSpec, DSpark, +85%

DeepSeek hat am Freitag DeepSpec veröffentlicht, einen kompletten Open-Source-Baukasten für sogenanntes Speculative Decoding. Nicht nur fertige Modellgewichte, sondern die ganze Trainings- und Bewertungsmaschinerie, dazu drei Algorithmen mit den Namen DSpark, DFlash und Eagle3. Frei lizenziert, zum Herunterladen für jeden.

Das Prinzip ist simpel. Ein kleines, schnelles Modell schlägt die nächsten Wörter vor, das große, teure Modell nickt sie im Stapel ab, statt jedes Token einzeln zu berechnen. Der neue Algorithmus DSpark soll die Ausgabe um 60 bis 85% beschleunigen, gemessen am hauseigenen Vorgänger. Gegen die etablierte Methode Eagle3 wächst die akzeptierte Wortlänge um bis zu 30,9%. Unterstützt werden die Modellfamilien Qwen3 und Gemma, laufen soll das Ganze auf einem Knoten mit acht GPUs und rund 38 Terabyte Speicher. Ein Wochenendprojekt für den Laptop ist das also nicht.

Für Nutzer ist Tempo bei der Inferenz kein technisches Detail, sondern bares Geld. Schnellere Antworten bedeuten niedrigere Kosten pro Anfrage, und wer ohnehin ein Auge auf chinesische KI-Modelle hat, bekommt das Rezept hier frei Haus. Während OpenAI und Anthropic ihre Optimierungen hüten, legt DeepSeek den kompletten Trainingscode offen. Wer eigene KI-APIs betreibt und auf Qwen3 oder Gemma setzt, kann sich daraus maßgeschneiderte Beschleuniger bauen, ohne das Grundmodell anzufassen.

Bleibt ein Schönheitsfehler. Jede dieser Glanzzahlen hat DeepSeek gegen die eigene frühere Technik auf der eigenen Hardware gemessen. Wie schnell DeepSpec in echten Tokens pro Sekunde läuft und ob die Werte auch außerhalb von Qwen3 und Gemma halten, verschweigt die Veröffentlichung. Wer sich selbst die Note gibt, schreibt am Ende selten eine Vier.

Quellen

Ähnliche News

Diese Meldung wurde mit Unterstützung von Claude (Anthropic) recherchiert und verfasst. Inhaltliche Fehler sind möglich. Die verlinkten Quellen ermöglichen eine eigene Prüfung. Fachbegriffe erläutert das Glossar.

Bist du bereit für mehr?

Was sagst du dazu?