So erstellst du dir deine eigene KI

So erstellst du dir deine eigene KI 1

Du willst eine KI, die deinen Namen trägt, deine Regeln befolgt und nur das weiß, was du ihr beibringst. Klingt nach einem Projekt für ein Entwicklerteam mit Rechenzentrum und siebenstelligem Budget.

Ist es aber nicht. Jedenfalls nicht zwingend.

Eine eigene KI erstellen kann 2026 jeder. Ohne eine einzige Zeile Code, ohne Server, ohne Informatikstudium. Die einfachste Variante dauert fünfzehn Minuten. Die anspruchsvollste verschlingt Millionen. Dazwischen liegt ein Spektrum, das die meisten gar nicht kennen.

Was »eigene KI« überhaupt bedeutet

Der Begriff ist dehnbar. Für die einen bedeutet er einen Chatbot mit eigenem Namen und Profilbild. Für andere ein Sprachmodell, das ausschließlich mit den eigenen Dateien arbeitet. Und für wieder andere ein Modell, dessen Gewichte auf eigener Hardware liegen, komplett unabhängig von OpenAI, Google oder Anthropic.

Ein Custom GPT ist eine individuell konfigurierte Version von ChatGPT, die auf bestimmte Aufgaben, Tonalitäten oder Wissensbereiche zugeschnitten ist. Die Konfiguration erfolgt per natürlicher Sprache, nicht per Code. Ähnliche Konzepte bieten Google (Gemini Gems) und Anthropic (Claude Projects).

Im Kern lassen sich fünf Stufen unterscheiden. Jede bringt mehr Kontrolle, aber auch mehr Aufwand.

Stufe 1, System-Prompt anpassen. Du sagst der KI, wer sie ist, wie sie antworten soll und was sie vermeiden muss. Das ist die Basis von Custom GPTs, Gemini Gems und Claude Projects. Keine Programmierung nötig, alles passiert über natürliche Sprache.

Stufe 2, eigene Dokumente einbinden. Die KI antwortet auf Basis deiner Dateien, nicht auf Basis ihres allgemeinen Trainings. Google NotebookLM macht genau das. Die Fachleute nennen es RAG.

Stufe 3, ein bestehendes Modell nachtrainieren. Du veränderst das Verhalten des Modells selbst, nicht nur seine Anweisungen. Das nennt sich Fine-Tuning und erfordert Trainingsdaten, API-Zugang und technisches Verständnis.

Stufe 4, ein offenes Modell lokal betreiben. Du lädst ein Modell wie Google Gemma oder Metas Llama herunter und startest es auf deinem eigenen Rechner. Offline, kostenlos nach dem Download, völlig unter deiner Kontrolle. Für die meisten Privatnutzer ist das der spannendste Weg, wenn Datenschutz zählt. Worauf man dabei achten sollte, steht in Eigene KI auf dem Rechner — 11 Dinge, die du vorher wissen solltest.

Eigene KI erstellen — fünf Stufen von der Konfiguration bis zum eigenen Modell

Stufe 5, ein Modell von Grund auf trainieren. Eigene Architektur, eigene Trainingsdaten, eigene Gewichte. Das macht niemand privat. Es kostet Millionen, braucht Tausende GPUs und Monate Rechenzeit. Selbst ein Fine-Tuning auf einem bestehenden Modell ist eine andere Liga als der reine Lokalbetrieb in Stufe 4.

Die meisten, die »eigene KI« sagen, meinen Stufe 1 oder 2. Das ist auch plausibel so.

Eigene KI erstellen ohne Programmierung

Alle großen Anbieter haben Werkzeuge eingeführt, mit denen sich eine KI per Textanweisung konfigurieren lässt. Du beschreibst in normaler Sprache, was die KI tun soll, lädst womöglich ein paar Dokumente hoch und gibst ihr einen Namen. Fertig.

Bei OpenAI heißt das Custom GPTs. Du öffnest den GPT Builder in ChatGPT, beschreibst die gewünschte Rolle, und die KI hilft dir beim Rest. Seit 2026 funktioniert das auch mit den günstigeren Abo-Stufen, nicht nur mit Plus.

Bei Google sind es Gemini Gems. Ähnliches Prinzip, aber mit einem entscheidenden Vorteil. Gems greifen direkt auf dein Google Drive zu. Wenn du ein Dokument dort aktualisierst, sieht die Gem die Änderung sofort. Keine manuelle Synchronisation, kein erneuter Upload.

Bei Anthropic gibt es Claude Projects und seit Anfang 2026 auch Claude Skills. Projects funktionieren wie ein Ordner mit Kontext, den Claude bei jeder Unterhaltung mitliest. Skills gehen weiter, sie sind verpackte Anleitungen, die Claude automatisch aktiviert, wenn sie zum Thema passen.

Custom GPTs, Claude Projects und Gemini Gems im Vergleich (Stand 05/2026)
Custom GPTsClaude ProjectsGemini Gems
AnbieterOpenAIAnthropicGoogle
Abo nötigAb ChatGPT Go (rund 8 €/Monat)Ab Claude Pro (rund 22 €/Monat)Kostenlos nutzbar
Zeichenlimit Anweisungenrund 8.000 ZeichenKein Limitrund 4.000 Zeichen
Datei-UploadJa, bis 20 DateienJa, großes KontextfensterJa, Google Drive direkt
TeilenPer Link oder im GPT StoreInnerhalb der OrganisationPer Link
StärkeGrößtes Ökosystem, viele fertige GPTsKomplexeste Anweisungen möglichEnge Google-Integration

Der Unterschied zwischen den Plattformen liegt weniger in den Fähigkeiten als im Platz für Anweisungen. Claude Projects haben kein Zeichenlimit für Instruktionen. Wer komplexe Regeln hinterlegen will, einen bestimmten Schreibstil, Fachvokabular, Entscheidungslogiken, merkt den Unterschied schnell.

Was alle drei gemeinsam haben. Du trainierst kein eigenes Modell, du konfigurierst ein bestehendes. Das ist ein wichtiger Unterschied. Deine KI nutzt dasselbe Sprachmodell wie alle anderen. Sie verhält sich nur anders, weil du ihr andere Anweisungen gegeben hast.

Das ist wie ein Koch, der nach deinem Rezept kocht. Er bringt seine Fähigkeiten mit. Du bestimmst das Gericht.

Was passiert, wenn du eigene Daten brauchst

Die Drei-Klick-Variante stößt an eine Grenze, sobald deine KI spezifisches Wissen braucht, das nicht im Trainingsmaterial der großen Modelle steckt. Firmendokumente, Handbücher, Forschungsnotizen, Produktkataloge, alles, was intern ist und nirgendwo im öffentlichen Internet steht.

RAG (Retrieval-Augmented Generation) ist eine Methode, bei der ein KI-Modell vor dem Antworten relevante Abschnitte aus einer Dokumentensammlung abruft und als Kontext mitverarbeitet. Das Modell wird dabei nicht verändert, es bekommt nur zusätzliches Material zum Lesen.

RAG funktioniert nach einem einfachen Prinzip. Deine Dokumente werden in kleine Abschnitte zerlegt und als Vektoren gespeichert. Wenn du eine Frage stellst, sucht das System zuerst die passenden Abschnitte heraus und gibt sie dem Sprachmodell als Kontext mit. Das Modell antwortet dann auf Basis deiner Daten, nicht auf Basis seines allgemeinen Trainings.

Der einfachste Weg dahin ist Google NotebookLM. Du lädst PDFs, Webseiten oder YouTube-Videos hoch, und die KI arbeitet ausschließlich mit diesem Material. Kostenlos, keine Programmierung, brauchbar bis sehr gut. Für private Lernprojekte oder Recherchen reicht das meistens.

Wer mehr Kontrolle braucht, kann mit KI-APIs und Tools wie LangChain oder LlamaIndex ein eigenes RAG-System aufbauen. Das erfordert Python-Kenntnisse und ein Grundverständnis für Embeddings und Vektordatenbanken. Kein Hexenwerk, aber auch nicht mehr per Klick erledigt.

Die Kosten halten sich in Grenzen. Ein einfaches RAG-System mit ein paar hundert Dokumenten lässt sich für unter 10 Euro im Monat betreiben. Die API-Kosten für die Abfragen liegen bei wenigen Cent pro Anfrage.

RAG oder Fine-Tuning — wann sich was lohnt

Beide Ansätze klingen ähnlich, lösen aber unterschiedliche Probleme.

RAG gibt dem Modell Zugang zu aktuellen Daten, ohne es zu verändern. Fine-Tuning verändert das Modell selbst, damit es einen bestimmten Stil, Jargon oder eine bestimmte Denkweise verinnerlicht.

Ein Beispiel. Du willst, dass deine KI Kundenanfragen im Tonfall deines Unternehmens beantwortet und dabei auf interne Wissensdatenbanken zugreift. Das Wissen kommt über RAG. Der Tonfall kommt über Fine-Tuning. Oder, wenn du es einfacher halten willst, über einen gut geschriebenen System-Prompt.

RAG und Fine-Tuning im Vergleich (Stand 05/2026)
RAGFine-Tuning
ZweckZugang zu eigenen DatenVerhalten und Stil ändern
Modell verändert?NeinJa
Kosten0–50 €/Monat5.000–50.000 € pro Durchlauf
AktualisierungSofort, Dokumente austauschenNeues Training nötig
Technische HürdeGering bis mittelHoch
Typischer EinsatzWissensdatenbanken, Support, RechercheMarkenstimme, Fachjargon, spezielles Reasoning

Fine-Tuning kostet je nach Modell und Datenmenge zwischen 5.000 und 50.000 Euro pro Durchlauf. Und bei jedem Update der Trainingsdaten muss der Prozess wiederholt werden. RAG ist dynamischer, billiger und für die meisten Anwendungsfälle die bessere Wahl.

Die erfolgreichsten KI-Systeme 2026 kombinieren beides, so beschreibt es unter anderem IBM in seiner Analyse der beiden Ansätze. RAG für die Fakten, Fine-Tuning für das Verhalten. Das ist eine Lösung für Unternehmen mit Budget und klarem Anwendungsfall. Für Einzelpersonen, Studenten oder kleine Teams ist RAG allein fast immer ausreichend.

Wenn das Modell selbst dir gehören soll

Wer wirklich unabhängig sein will, kann ein offenes Sprachmodell herunterladen und lokal betreiben. Google Gemma, Metas Llama, Alibabas Qwen, IBMs Granite oder Liquid AIs LFM2 sind kompakt genug für normale Laptops. Tools wie Ollama oder LM Studio machen die Installation simpel.

Der Reiz ist offensichtlich. Kein Anbieter sieht, was du fragst, kein Abo, kein Internet nötig. Der Haken auch. Lokale Modelle sind kleiner als GPT-5 oder Claude Opus, sie antworten manchmal ungenauer und brauchen mehr Führung. Für viele Alltagsaufgaben reicht das trotzdem.

Das Thema hat genug Eigengewicht für einen eigenen Artikel. Was Hardware, Modellauswahl, Privatsphäre und realistische Erwartungen angeht, steht in Eigene KI auf dem Rechner — 11 Dinge, die du vorher wissen solltest alles, was du vor der Installation wissen solltest.

Stufe 5, ein Modell komplett von Grund auf zu trainieren, mit eigener Architektur und eigenen Trainingsdaten, ist eine andere Liga. Hugging Face hostet über 500.000 vortrainierte Modelle, die als Basis dienen können. Selbst ein Fine-Tuning auf dieser Grundlage erfordert GPU-Zugang, technische Expertise und je nach Modellgröße erhebliche Rechenzeit. Für Privatpersonen ist das womöglich der falsche Weg. Die Frage »Kann ich mein eigenes Modell trainieren?« lässt sich mit Ja beantworten. Die Frage »Sollte ich?« eher mit Nein.

Wofür sich welcher Weg eignet

Du willst einen persönlichen Lernassistenten, der dich in deinem Fach abfragt und deinen Lernstil kennt? Custom GPT oder Claude Project, Stufe 1, eine Viertelstunde Arbeit.

Du willst eine KI, die dein 200-seitiges Skript kennt und Fragen dazu beantwortet? NotebookLM, Stufe 2, fünf Minuten.

Du willst einen Kundensupport-Bot, der Firmensprache spricht und auf interne Dokumente zugreift? RAG plus System-Prompt, Stufe 2 mit gutem Setup.

Du willst eine KI, die komplett offline läuft und keine Daten nach außen schickt? Ollama mit Gemma oder Llama, Stufe 4. Etwas technischer, aber machbar.

Du willst ein Modell, das deine Branche versteht wie kein zweites? Fine-Tuning, Stufe 3. Budget einplanen.

In den meisten Fällen führt der schnellste Weg über Stufe 1. Wer seiner KI eine Persönlichkeit gibt, einen klaren System-Prompt schreibt und ein paar Referenzdokumente hochlädt, hat in einer halben Stunde etwas, das sich wie eine eigene KI anfühlt. Und für den Alltag ist das nicht ganz wenig.

Die eigene KI ist kein Zukunftsprojekt mehr. Sie ist an einem Nachmittag zu schaffen. (lk)

Sven Lennartz Avatar

Der Autor

Sven Edmund Lennartz ist seit 25 Jahren Fachautor und Gründer mehrerer Online-Unternehmen, wie Dr. Web (Webdesign), Conterest (Bloggen), Sternenvogelreisen (Sprache) und Smashing Magazine (Webdesign & Entwicklung). Autorenhomepage

Bist du bereit für mehr?

Was sagst du dazu?