
Wer Texte schreibt, steht früher oder später vor der Frage: In welchem Format speichere ich das eigentlich? Die Antwort hängt davon ab, was du mit dem Text vorhast. Ein Protokoll für die Uni braucht ein anderes Format als eine Webseite, eine Konfigurationsdatei oder ein Prompt für eine KI.
Je nachdem hast du verschiedene Möglichkeiten. Mit Vor- und Nachteilen. Und manches nur für bestimmte Zwecke.
Lerne die Bildungssprache! Das praktische Handbuch schlauer Wörter unterstützt dich mit über 1.600 durchdachten Einträgen. Besser verstehen und klüger schreiben. Verständliche Erläuterungen und lebensnahe Beispiele erleichtern das Einprägen. Jetzt ansehen
Reine Textformate
Diese Formate enthalten nur Text – keine Formatierungen, keine eingebetteten Bilder, keine versteckten Metadaten. Sie sind universell lesbar und extrem robust.
TXT (Plain Text) ist das einfachste aller Formate. Jeder Computer kann es öffnen, jedes Programm kann es lesen. Ideal für schnelle Notizen, Ideensammlungen oder wenn du sichergehen willst, dass dein Text in 50 Jahren noch lesbar ist. Der Nachteil: Keine Formatierung möglich. Kein Fett, kein Kursiv, keine Überschriften.
Markdown (MD) löst genau dieses Problem. Es ist ebenfalls ein reines Textformat, erlaubt aber einfache Formatierungen durch bestimmte Zeichen. Ein Text mit Sternchen wird fett, einer mit Unterstrichen kursiv. Markdown hat sich als Standard für technische Dokumentationen, Readme-Dateien und Blogs etabliert.
# Das ist eine Überschrift
Das ist normaler Text mit **fettem** und *kursivem* Wort.
- Aufzählung eins
- Aufzählung zwei
Markdown eignet sich hervorragend für alles, was später ins Web soll oder versioniert werden muss. GitHub, Reddit und unzählige Content-Management-Systeme unterstützen es nativ.
Strukturierte Datenformate
Diese Formate dienen weniger dem Lesen durch Menschen als dem Austausch zwischen Programmen – obwohl sie durchaus menschenlesbar sind.
XML (Extensible Markup Language) strukturiert Daten hierarchisch durch öffnende und schließende Tags. Es ist streng, präzise und selbstbeschreibend. Jedes Element muss korrekt geschlossen werden, sonst ist das Dokument ungültig.
<buch>
<titel>Der Prozess</titel>
<autor>Franz Kafka</autor>
<jahr>1925</jahr>
</buch>
XML findet sich in Konfigurationsdateien, beim Datenaustausch zwischen Systemen und überall dort, wo Daten validiert werden müssen. Die strenge Syntax verhindert Fehler, macht das Format aber auch gesprächiger als nötig.
YAML (YAML Ain’t Markup Language) verfolgt einen anderen Ansatz: Lesbarkeit durch Einrückung statt durch Tags. Es ist kompakter und für Menschen angenehmer zu schreiben.
buch:
titel: Der Prozess
autor: Franz Kafka
jahr: 1925
YAML hat sich als Standard für Konfigurationsdateien etabliert – von Docker über Kubernetes bis zu GitHub Actions. Vorsicht allerdings: Einrückungsfehler führen zu schwer auffindbaren Bugs.
JSON (JavaScript Object Notation) liegt irgendwo dazwischen. Es ist kompakter als XML, aber strenger als YAML. Das Format ist der Standard für Web-APIs und den Datenaustausch im Internet.
{
"buch": {
"titel": "Der Prozess",
"autor": "Franz Kafka",
"jahr": 1925
}
}
Auszeichnungssprachen fürs Web
HTML (Hypertext Markup Language) ist die Sprache des Webs. Jede Webseite, die du besuchst, basiert auf HTML. Es strukturiert Inhalte durch semantische Tags und wird vom Browser interpretiert und dargestellt.
<article>
<h1>Überschrift</h1>
<p>Ein Absatz mit <strong>wichtigem</strong> Text.</p>
</article>
HTML zu beherrschen ist grundlegend, wenn du im digitalen Raum arbeiten willst. Für reine Textproduktion ist es allerdings zu aufwendig – hier greift man besser zu Markdown und konvertiert bei Bedarf.
Dokumentenformate
DOCX ist das Format von Microsoft Word und der De-facto-Standard für Textverarbeitung in Büros, Schulen und Universitäten. Es speichert Formatierungen, Bilder, Tabellen und Metadaten in einer komprimierten XML-Struktur.
Die Vorteile: Vertraut, weit verbreitet, gut für kollaboratives Arbeiten mit Änderungsverfolgung. Die Nachteile: Proprietär, nicht ideal für Versionskontrolle, manchmal inkompatibel zwischen verschiedenen Word-Versionen.
ODT (Open Document Text) ist das offene Pendant zu DOCX, unterstützt von LibreOffice und anderen freien Office-Paketen. Funktional gleichwertig, aber weniger verbreitet.
PDF (Portable Document Format) ist kein Bearbeitungs-, sondern ein Endformat. Es bewahrt das Layout exakt, unabhängig von Betriebssystem oder installierter Software. Ideal für Abgaben, offizielle Dokumente und alles, was nicht mehr verändert werden soll.
EPUB (Electronic Publication) ist das Standardformat für E-Books. Anders als PDF passt sich der Text an die Bildschirmgröße an – ideal für Smartphones, E-Reader und Tablets. Wer längere Texte mobil lesen will, ist mit EPUB besser bedient. Viele Bibliotheken und Open-Access-Publikationen bieten ihre Inhalte in diesem Format an.
RTF (Rich Text Format) ist ein älteres Format, das grundlegende Formatierungen unterstützt und von nahezu jeder Textverarbeitung gelesen werden kann. Es spielt heute kaum noch eine Rolle, kann aber nützlich sein, wenn maximale Kompatibilität zwischen verschiedenen Programmen gefragt ist.
Wissenschaftliche und akademische Formate
Im akademischen Bereich gelten eigene Regeln. Hier zählt Präzision, Nachvollziehbarkeit und oft auch die Möglichkeit, komplexe mathematische Formeln darzustellen.
LaTeX ist der Goldstandard für wissenschaftliche Arbeiten, besonders in Mathematik, Physik und Informatik. Es ist kein WYSIWYG-Editor, sondern eine Auszeichnungssprache: Du schreibst Code, der dann zu einem perfekt gesetzten Dokument kompiliert wird.
documentclass{article}
begin{document}
section{Einleitung}
Die Formel $E = mc^2$ veränderte unser Weltbild.
end{document}
Der Einstieg ist steil, aber der Aufwand lohnt sich. LaTeX erzeugt typografisch saubere Dokumente, nummeriert Kapitel und Abbildungen automatisch und verwaltet Literaturverweise souverän. Für Abschlussarbeiten in technischen Fächern oft Pflicht, in Geisteswissenschaften seltener anzutreffen.
BibTeX und BibLaTeX sind Formate für Literaturverzeichnisse, die mit LaTeX zusammenarbeiten. Eine BibTeX-Datei sammelt alle Quellen an einem Ort:
@book{kafka1925,
author = {Franz Kafka},
title = {Der Prozess},
year = {1925},
publisher = {Verlag Die Schmiede}
}
Im Text referenzierst du nur den Schlüssel, das Literaturverzeichnis generiert sich automatisch im gewünschten Zitierstil – ob APA, Chicago oder DIN-ISO.
CSV (Comma-Separated Values) ist unverzichtbar für alle, die mit Daten arbeiten. Umfrageergebnisse, Messwerte, Statistiken – alles landet früher oder später in einer CSV-Datei. Das Format ist simpel: Werte werden durch Kommas oder Semikolons getrennt, jede Zeile ist ein Datensatz.
Name;Matrikelnummer;Note
Müller, Anna;12345;1,7
Schmidt, Paul;12346;2,3
Excel, SPSS, R und Python lesen CSV problemlos. Für den Austausch von Tabellendaten zwischen verschiedenen Programmen ist es die sicherste Wahl.
Textformate und Künstliche Intelligenz
Sprachmodelle wie ChatGPT, Claude oder Gemini haben eigene Vorlieben, was Textformate angeht. Wer diese kennt, bekommt bessere Ergebnisse.
Markdown ist das bevorzugte Format der meisten KI-Systeme. Sie verstehen die Struktur, interpretieren Überschriften als Hierarchie und können Markdown auch selbst sauber ausgeben. Wenn du einer KI einen längeren Text zur Analyse gibst, strukturiere ihn mit Markdown-Überschriften – das verbessert die Ergebnisse messbar.
XML eignet sich hervorragend für komplexe Prompts. Die klare Trennung durch Tags hilft der KI, verschiedene Teile einer Anfrage zu unterscheiden:
<aufgabe>Fasse den folgenden Text zusammen</aufgabe>
<stil>akademisch, sachlich</stil>
<text>Hier steht der zu bearbeitende Text...</text>
Viele professionelle Prompt-Ingenieure arbeiten mit XML-Strukturen, weil sie präzisere Anweisungen ermöglichen.
JSON kommt ins Spiel, wenn du strukturierte Ausgaben brauchst. Du kannst der KI ein JSON-Schema vorgeben und sie bitten, ihre Antwort in diesem Format zu liefern – praktisch für automatisierte Weiterverarbeitung.
Was KI-Systeme nicht mögen: PDFs und DOCX-Dateien sind problematisch. Die KI sieht nicht das formatierte Dokument, sondern muss den Text erst extrahieren. Dabei gehen Strukturinformationen verloren, Tabellen werden unleserlich, Fußnoten landen an seltsamen Stellen. Wenn du ein Word-Dokument von einer KI analysieren lassen willst, kopiere den Text vorher in ein Markdown-Dokument und strukturiere ihn sauber.
Bilder in PDFs sind für textbasierte KI unsichtbar. Ein eingescanntes Dokument ist für sie eine leere Seite, es sei denn, du nutzt vorher OCR-Software (Optical Character Recognition), um den Text zu extrahieren.
Welches Format für welchen Zweck?
Die folgende Übersicht zeigt auf einen Blick, welches Format sich für welchen Einsatzzweck eignet:
| Zweck | Format | Warum |
|---|---|---|
| Schnelle Notizen | TXT | Universell, kein Schnickschnack |
| Blogposts, Dokumentation | Markdown | Strukturiert, konvertierbar |
| Hausarbeit, Seminar | DOCX → PDF | Standard an Unis |
| Naturwissenschaft | LaTeX → PDF | Formeln, Typografie |
| E-Books, mobile Lektüre | EPUB | Fließtext, anpassbar |
| Literaturverwaltung | BibTeX | Automatische Verzeichnisse |
| Tabellen, Messdaten | CSV | Überall lesbar |
| Konfiguration | YAML, JSON | Kompakt, maschinenlesbar |
| Datenaustausch | XML, JSON | Validierbar, strukturiert |
| Webseiten | HTML | Browserstandard |
| KI-Prompts | Markdown, XML | Bessere Ergebnisse |
| KI-Ausgaben (strukturiert) | JSON | Weiterverarbeitung |
| Archivierung | PDF/A, TXT | Langzeitstabil |
| Versionskontrolle (Git) | MD, TXT, YAML, LaTeX | Diff-freundlich |
Aud den Kontext kommt es an
Für die Uni wirst du meist mit DOCX arbeiten und als PDF abgeben – das erwarten die meisten Dozenten. In technischen Fächern lohnt sich der Umstieg auf LaTeX, auch wenn die Lernkurve anfangs frustriert. Für eigene Projekte, Programmierung oder Webarbeit ist Markdown die beste Wahl. Es ist schneller zu schreiben, lässt sich problemlos versionieren und konvertiert mühelos in andere Formate.
Wer regelmäßig mit KI-Tools arbeitet, sollte Markdown und XML beherrschen. Die Fähigkeit, Informationen klar zu strukturieren, wird immer wichtiger – nicht nur für menschliche Leser, sondern auch für maschinelle.