Welche GPT-5-Modelle sind 2026 verfügbar?

Seit März 2026 sind die wichtigsten GPT-5-Modelle: GPT-5.3 Instant (schnell für den Alltag), GPT-5.2 Thinking (tiefgehendes Reasoning), GPT-5.2-Codex (agentenbasiertes Coding), GPT-5.3-Codex (fortgeschrittenes Coding) und GPT-5.3-Codex-Spark (Echtzeit-Coding auf Cerebras). GPT-5.4 wurde geleakt, aber noch nicht offiziell veröffentlicht.

Was ist der Unterschied zwischen GPT-5.2 und GPT-5.3?

GPT-5.2 ist das leistungsstärkere Reasoning-Modell (Thinking-Tier), das sich am besten für komplexe Aufgaben, Forschung und Analysen eignet. GPT-5.3 Instant ist auf Geschwindigkeit und Alltagsaufgaben mit reduzierten Halluzinationen optimiert. Der Auto-Modus von ChatGPT schaltet je nach Aufgabenkomplexität zwischen ihnen um.

Welches GPT-5-Modell eignet sich am besten für Coding?

Verwenden Sie für das Coding GPT-5.2-Codex oder GPT-5.3-Codex für komplexe Engineering-Aufgaben oder GPT-5.3-Codex-Spark für Echtzeit-Coding mit über 1000 Token/Sekunde. Codex-Modelle unterstützen xHigh Reasoning-Aufwand für maximale Genauigkeit bei schwierigen Problemen.

Wie viel kosten GPT-5-Modelle über die API?

Die Preise variieren: GPT-5.3 Instant beginnt bei etwa 0,30 $/1 Mio. Input-Token. GPT-5.2 kostet 1,75 $/1 Mio. Input und 14 $/1 Mio. Output. GPT-5.2-Codex liegt bei 1,75 $/1 Mio. Input. GPT-5.3-Codex-Spark bietet wettbewerbsfähige Preise für Hochgeschwindigkeits-Inferenz. Gecachte Input-Token erhalten bis zu 90 % Rabatt.

Wann wird GPT-5.4 veröffentlicht?

GPT-5.4 wurde versehentlich durch Codex-Code-Commits geleakt, die sich auf '5.4 oder neuer' bezogen. OpenAI postete am 3. März 2026: '5.4 früher als Sie denken'. Zu den erwarteten Features gehören ein Kontextfenster von 2 Mio. Token und die Verarbeitung von Bildern in voller Auflösung. Ein offizielles Veröffentlichungsdatum gibt es noch nicht.

OpenAI GPT-5 Modell-Leitfaden: GPT-5.2 vs 5.3 vs 5.4 — Welches sollten Sie verwenden? (2026)

4. März 2026 — Die GPT-5-Familie von OpenAI ist seit dem Start von GPT-5.0 Mitte 2025 rasant gewachsen. In weniger als acht Monaten hat sich das Angebot von einem einzelnen Modell zu einem weitverzweigten Ökosystem spezialisierter Varianten entwickelt: Alltagsassistenten, Deep-Reasoner, agentenbasierte Coder und Echtzeit-Inferenz-Engines.

Das Problem? Die Wahl des richtigen Modells ist nicht mehr offensichtlich. GPT-5.2 Thinking, GPT-5.3 Instant, GPT-5.2-Codex, GPT-5.3-Codex, GPT-5.3-Codex-Spark — jedes Modell brilliert bei unterschiedlichen Aufgaben und hat eine eigene Preisgestaltung. Und da GPT-5.4 erst vor wenigen Tagen geleakt wurde, steht die Landschaft kurz vor einer erneuten Verschiebung.

Dieser Leitfaden schlüsselt jedes heute verfügbare GPT-5-Modell auf, vergleicht sie direkt miteinander und gibt Ihnen einen klaren Entscheidungsrahmen für die Wahl des richtigen Modells basierend auf Ihrem Anwendungsfall und Budget.

Die GPT-5-Modellfamilie im Überblick

Modell	Veröffentlicht	Bestens geeignet für	Kontextfenster	Geschwindigkeit	Reasoning
GPT-5.3 Instant	3. März 2026	Alltagsaufgaben, Schreiben, Übersetzung	400K	Schnell	Standard
GPT-5.2 Thinking	11. Dez. 2025	Komplexe Forschung, Analyse, technisches Schreiben	256K	Moderat	Deep (xHigh)
GPT-5.2-Codex	14. Jan. 2026	Agentenbasiertes Coding, Cybersicherheit, Software-Engineering	400K	Moderat	Deep (xHigh)
GPT-5.3-Codex	Feb. 2026	Agentenbasiertes Coding der nächsten Generation	1M	Moderat	Deep (xHigh)
GPT-5.3-Codex-Spark	12. Feb. 2026	Echtzeit-Coding, sofortiges Feedback	128K	Ultraschnell (1000+ tok/s)	Standard
GPT-5.4 (geleakt)	TBD	Allround-Flaggschiff	2M (erwartet)	Unbekannt	Unbekannt

GPT-5.3 Instant: Das Arbeitstier für jeden Tag

GPT-5.3 Instant wurde am 3. März 2026 veröffentlicht und ersetzt GPT-5.2 Instant als Standardmodell für alle ChatGPT-Nutzer. Der API-Modellname lautet gpt-5.3-chat-latest. Es verfügt über ein 400K Token Kontextfenster — ein massives Upgrade gegenüber den vorherigen 128K.

Stärken des Modells

26,8 % weniger Halluzinationen bei der Websuche (19,7 % weniger ohne) im Vergleich zu GPT-5.2 Instant.
Anti-"Cringe"-Tuning — OpenAI hat gezielt den übertriebenen Konversationsstil korrigiert (z. B. "Stopp. Atmen Sie tief durch."), der GPT-5.2 Instant plagte.
Weniger unnötige Verweigerungen — Die Wahrscheinlichkeit, dass harmlose Fragen abgelehnt oder defensive Disclaimer hinzugefügt werden, ist geringer.
Bessere Web-Synthese — Reichhaltigere, besser kontextualisierte Websuchergebnisse anstelle von reinen Linklisten.
400K Token Kontextfenster — 3-mal größer als die Vorgängergeneration.

Wer es verwenden sollte

GPT-5.3 Instant ist die richtige Wahl für die meisten Alltagsaufgaben: E-Mails entwerfen, Brainstorming, Zusammenfassen von Dokumenten, Beantworten von Fragen, Übersetzen von Inhalten und allgemeines Schreiben. Es ist für alle ChatGPT-Stufen verfügbar (Free: 10 Nachrichten/5 Stunden, Plus: 160 Nachrichten/3 Stunden). GPT-5.2 Instant bleibt unter "Legacy Models" bis zum 3. Juni 2026 verfügbar.

Wann man upgraden sollte

Wenn Ihre Aufgabe tiefes, mehrstufiges Reasoning erfordert, komplexe Tabellenkalkulationen verarbeitet werden müssen oder eine kontinuierliche analytische Arbeit nötig ist, wird GPT-5.2 Thinking GPT-5.3 Instant übertreffen. Die gute Nachricht: Der Auto-Modus von ChatGPT übernimmt dieses Routing für Sie (mehr dazu unten).

GPT-5.2 Thinking: Der Deep Reasoner

GPT-5.2 wurde am 11. Dezember 2025 veröffentlicht und ist das Flaggschiff unter den Reasoning-Modellen von OpenAI. Es arbeitet auf drei Ebenen — Instant, Thinking und Pro — wobei jede Ebene eine andere Tiefe des Reasoning-Aufwands darstellt.

Benchmark-Leistung

GPT-5.2 dominiert konkurrierende Modelle in den Benchmarks, die für das reale Reasoning am wichtigsten sind:

Benchmark	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
GDPval (allgemeine Präferenz)	70,9% Siege/Gleichstand	59,6%	53,6%
ARC-AGI-2 (neuartiges Denken)	52,9%	37,6%	31,1%
SWE-Bench Pro (Software Eng.)	55,6%	—	—
MRCRv2 (256K Long-Context)	Nahezu perfekt	—	—

Wichtige Spezifikationen

Kontextfenster: 256K Token mit nahezu perfektem Recall über das gesamte Fenster.
Wissensstand: 31. August 2025.
Reasoning-Aufwand: Unterstützt Standard, High und xHigh für maximale Tiefe.
Preise: 1,75 $/1 Mio. Input-Token, 14,00 $/1 Mio. Output-Token.

Wer es verwenden sollte

GPT-5.2 Thinking ist die richtige Wahl für:

Forschung und Analyse — Synthetisieren großer Dokumente, Vergleichen von Datensätzen, Identifizieren von Mustern.
Komplexes technisches Schreiben — Whitepapers, Dokumentationen, ausführliche Leitfäden.
Tabellen- und Datenarbeit — Finanzmodellierung, mehrstufige Berechnungen.
Rechtliche und Compliance-Prüfungen — Aufgaben, die sorgfältiges, schrittweises Denken erfordern.
Schwierige Problemlösungen — Alles, bei dem das Modell "stärker nachdenken" muss.

GPT-5.2-Codex: Der agentenbasierte Coder

GPT-5.2-Codex wurde am 14. Januar 2026 veröffentlicht und ist speziell für das Software-Engineering konzipiert. Es ist nicht nur ein Coding-Assistent — es ist ein agentenbasiertes Coding-Modell, das mehrstufige Engineering-Aufgaben autonom planen, ausführen und iterieren kann.

Was es unterscheidet

Kontext-Kompaktierung — Komprimiert den Kontext während langer Coding-Sessions intelligent, um über längere Aufgaben hinweg kohärent arbeiten zu können.
400K Token Kontextfenster — Groß genug, um ganze Codebasen im Kontext zu halten.
Fokus auf Cybersicherheit — Speziell trainiert auf Schwachstellenanalyse und Fehlerbehebung.

Benchmark-Leistung

Benchmark	GPT-5.2-Codex
SWE-Bench Verified	80,0%
CVE-Bench (Schwachstellenerkennung)	87,0%

Modellvarianten

GPT-5.2-Codex wird in mehreren Varianten ausgeliefert, die auf unterschiedliche Kosten-Geschwindigkeits-Qualitäts-Abwägungen optimiert sind:

Variante	Optimiert für
Codex (Standard)	Ausgewogene Leistung
Codex Mini	Geringere Kosten, einfachere Aufgaben
Codex Max	Maximale Qualität
Codex Max High	Erweiterte Reasoning-Tiefe
Codex Max Extra High	Tiefstes Reasoning (xHigh)
Codex Low Fast	Geschwindigkeitsoptimiert
Codex Medium Fast	Ausgewogene Geschwindigkeit und Qualität

Preise

Input: 1,75 $ pro 1 Mio. Token
Output: 14,00 $ pro 1 Mio. Token
Gecachter Input: Bis zu 90 % Rabatt auf wiederholte Prompts.

GPT-5.3-Codex und Codex-Spark: Coding der nächsten Generation

GPT-5.3-Codex

GPT-5.3-Codex wurde im Februar 2026 veröffentlicht und ist der Nachfolger von GPT-5.2-Codex. Das Highlight-Upgrade: ein 1-Millionen-Token-Kontextfenster — genug, um die meisten großen Produktions-Codebasen in einer einzigen Session zu erfassen.

Erste Ergebnisse zeigen Verbesserungen gegenüber dem Vorgänger bei SWE-Bench Pro und Terminal-Bench 2.0, den Benchmarks, die am aussagekräftigsten für die reale Software-Engineering-Leistung sind. Dies ist das Modell der Wahl für die anspruchsvollsten agentenbasierten Coding-Workflows.

GPT-5.3-Codex-Spark

Codex-Spark wurde am 12. Februar 2026 veröffentlicht und verfolgt einen grundlegend anderen Ansatz. In Partnerschaft mit Cerebras entwickelt, liefert es über 1.000 Token pro Sekunde — was es mit großem Abstand zum schnellsten Coding-Modell der GPT-5-Familie macht.

Feature	GPT-5.3-Codex	GPT-5.3-Codex-Spark
Geschwindigkeit	Standard-Inferenz	1.000+ Token/Sek
Kontextfenster	1M Token	128K Token
Ziel-Anwendungsfall	Tiefes agentenbasiertes Coding	Echtzeit-Feedback beim Coding
Verfügbarkeit	API und ChatGPT	Research Preview (Plus-Nutzer)
Hardware	Standard-GPU-Cluster	Cerebras Wafer-Scale Chips

Wann man welches Modell verwenden sollte

GPT-5.3-Codex — Langfristige Engineering-Aufgaben, bei denen die Kontextgröße entscheidend ist: große Refactorings, codebasisweite Analysen, komplexe Änderungen an mehreren Dateien.
GPT-5.3-Codex-Spark — Interaktives Coding, bei dem Geschwindigkeit zählt: Code-Reviews, schnelles Prototyping, Echtzeit-Pair-Programming, schnelle Iterationszyklen.

Spark erzielt starke Ergebnisse auf SWE-Bench Pro in einem Bruchteil der Zeit im Vergleich zu Standard-Codex-Modellen — ideal, wenn Sie schnelle Antworten benötigen, ohne zu viel Qualität opfern zu wollen.

GPT-5.4: Was als Nächstes kommt

GPT-5.4 wurde noch nicht offiziell angekündigt, aber durch mehrere Leaks Anfang März 2026 versehentlich enthüllt.

Die Beweise

Codex-Code-Commits (1.-2. März 2026): Ein Pull-Request eines OpenAI-Ingenieurs bezog sich auf "GPT-5.4 oder neuer", bevor er hastig bearbeitet wurde.
Social-Media-Post von OpenAI (3. März 2026): OpenAI postete "5.4 früher als Sie denken" — der bisher deutlichste offizielle Hinweis.
API-Endpunkt-Sichtung: "alpha-gpt-5.4" erschien kurzzeitig in einem öffentlichen Modell-Endpunkt.

Erwartete Features

Basierend auf geleaktem Code und glaubwürdigen Berichten:

2-Millionen-Token-Kontextfenster — Doppelt so groß wie das derzeit größte (1M bei GPT-5.3-Codex).
Bildverarbeitung in voller Auflösung — Ein neuer API-Parameter detail: original, der die Bildkompression komplett umgeht.
Verbesserte agentenbasierte Fähigkeiten — Stärkere Ausführung mehrstufiger Aufgaben und autonome Workflows.

Zeitplan für die Veröffentlichung

Prognosemärkte schätzen derzeit:

Zeitraum	Wahrscheinlichkeit
Bis April 2026	55%
Bis Juni 2026	74%

Angesichts der beschleunigten Release-Kadenz von OpenAI — GPT-5.0 (August 2025), GPT-5.1 (November 2025), GPT-5.2 (Dezember 2025), GPT-5.3-Codex (Februar 2026) — ist ein Release im Frühjahr 2026 plausibel.

Welches GPT-5-Modell sollten Sie verwenden?

Nutzen Sie diese Entscheidungsmatrix, um das richtige Modell für Ihre Aufgabe zu finden:

Anwendungsfall	Empfohlenes Modell	Warum
Schnelle Fragen und Chat	GPT-5.3 Instant	Schnellstes, kostengünstigstes, in der Gratis-Stufe verfügbar
E-Mails entwerfen und Schreiben	GPT-5.3 Instant	Starke Schreibqualität mit angenehmem Tonfall
Übersetzung	GPT-5.3 Instant	Speziell für Übersetzungsaufgaben verbessert
Forschung und Analyse	GPT-5.2 Thinking	Tiefes Reasoning, 256K Kontext, nahezu perfekter Recall
Finanzmodellierung	GPT-5.2 Thinking (xHigh)	Mehrstufige Berechnungen erfordern tiefes Reasoning
Technische Dokumentation	GPT-5.2 Thinking	Am besten für strukturierte, präzise Langform-Inhalte
Fehlerbehebung und Code-Review	GPT-5.2-Codex	80 % SWE-Bench, stark im Verständnis von bestehendem Code
Refactoring großer Codebasen	GPT-5.3-Codex	1M-Kontextfenster fasst ganze Codebasen
Sicherheits-Auditing	GPT-5.2-Codex	87 % CVE-Bench, auf Schwachstellenmuster trainiert
Echtzeit-Pair-Programming	GPT-5.3-Codex-Spark	1000+ tok/s bedeutet sofortiges Feedback
Schnelles Prototyping	GPT-5.3-Codex-Spark	Geschwindigkeit vor Tiefe für iterative Entwicklung
Multimodal mit Bildern	Auf GPT-5.4 warten	Verarbeitung in voller Auflösung erwartet
Dokumente mit 2M+ Token	Auf GPT-5.4 warten	2M-Kontextfenster noch nicht verfügbar

Die einfache Faustregel

Geschwindigkeit zählt am meisten → GPT-5.3 Instant oder Codex-Spark.
Qualität zählt am meisten → GPT-5.2 Thinking (xHigh).
Coding-Aufgaben → GPT-5.2-Codex, GPT-5.3-Codex oder Codex-Spark je nach Kontextgröße und Geschwindigkeitsbedarf.
Unsicher → Nutzen Sie den ChatGPT Auto-Modus und lassen Sie OpenAI das Routing übernehmen.

Preisvergleich

Modell	Input (pro 1M Token)	Output (pro 1M Token)	Rabatt für gecachten Input
GPT-5.3 Instant	~$0,30	~$1,20	Bis zu 75%
GPT-5.2 Thinking	1,75 $	14,00 $	Bis zu 90%
GPT-5.2-Codex	1,75 $	14,00 $	Bis zu 90%
GPT-5.3-Codex	TBD	TBD	TBD
GPT-5.3-Codex-Spark	Kompetitiv	Kompetitiv	Verfügbar

Tipps zur Kostenoptimierung

Nutzen Sie gecachte Inputs — Wenn Sie wiederholt ähnliche Prompts senden, können gecachte Token die Kosten um bis zu 90 % senken.
Modell an Aufgabe anpassen — Verwenden Sie GPT-5.2 Thinking nicht für einfache Fragen; GPT-5.3 Instant ist 5-6 mal günstiger.
Nutzen Sie Codex Mini für einfaches Coding — Die Mini-Variante erledigt Routine-Coding-Aufgaben zu deutlich geringeren Kosten.
Batch-API-Aufrufe — OpenAI bietet niedrigere Preise für Batch-Operationen an, bei denen Latenz nicht kritisch ist.

So funktioniert der ChatGPT Auto-Modus

Wenn Sie in ChatGPT "Auto" auswählen (die Standardeinstellung für die meisten Nutzer), leitet OpenAI Ihre Nachrichten dynamisch zwischen GPT-5.3 Instant und GPT-5.2 Thinking weiter, basierend auf der Komplexität Ihrer Anfrage.

Funktionsweise des Routings

Ihre Anfrage	Gewähltes Modell	Warum
"Wie ist das Wetter in Tokio?"	GPT-5.3 Instant	Einfache Faktenabfrage
"Fasse diesen Artikel zusammen"	GPT-5.3 Instant	Unkomplizierte Aufgabe
"Analysiere diese Tabelle und finde Anomalien"	GPT-5.2 Thinking	Mehrstufige Analyse erforderlich
"Vergleiche diese zwei Verträge Klausel für Klausel"	GPT-5.2 Thinking	Tiefes Reasoning erforderlich
"Schreibe ein Haiku über den Frühling"	GPT-5.3 Instant	Kreativ, aber einfach
"Debugge diese rekursive Funktion"	GPT-5.2 Thinking	Technische Problemlösung

Was das für Sie bedeutet

Für die meisten ChatGPT-Nutzer ist der Auto-Modus die richtige Wahl. Sie erhalten die Geschwindigkeit von GPT-5.3 Instant für einfache Aufgaben und die Reasoning-Power von GPT-5.2 Thinking, wenn die Aufgabe es erfordert — ohne manuell zwischen Modellen wechseln zu müssen.

Wenn Sie über die API entwickeln, müssen Sie explizit wählen. Nutzen Sie dazu die obige Entscheidungsmatrix.

Legen Sie los

Die GPT-5-Modellfamilie ist leistungsstark, aber die Wahl zwischen den Modellen ist nur die halbe Miete. Der Aufbau echter Anwendungen erfordert die richtigen Werkzeuge.

NxCode ermöglicht es Ihnen, KI-gestützte Webanwendungen mit natürlicher Sprache zu erstellen — ohne manuelle Modellauswahl oder Infrastruktur-Setup. Beschreiben Sie, was Sie wollen, und NxCode generiert produktionsreifen Code mit den richtigen integrierten KI-Anbindungen.

NxCode kostenlos testen — Intelligenter bauen, schneller veröffentlichen.

Quellen

Weitere Ressourcen

Geschrieben vom NxCode Team | Intelligenter bauen, nicht schwerer.

OpenAI GPT-5 Modell-Leitfaden: GPT-5.2 vs 5.3 vs 5.4 — Welches sollten Sie verwenden? (2026)

OpenAI GPT-5 Modell-Leitfaden: GPT-5.2 vs 5.3 vs 5.4 — Welches sollten Sie verwenden? (2026)

Die GPT-5-Modellfamilie im Überblick

GPT-5.3 Instant: Das Arbeitstier für jeden Tag

Stärken des Modells

Wer es verwenden sollte

Wann man upgraden sollte

GPT-5.2 Thinking: Der Deep Reasoner

Benchmark-Leistung

Wichtige Spezifikationen

Wer es verwenden sollte

GPT-5.2-Codex: Der agentenbasierte Coder

Was es unterscheidet

Benchmark-Leistung

Modellvarianten

Preise

GPT-5.3-Codex und Codex-Spark: Coding der nächsten Generation

GPT-5.3-Codex

GPT-5.3-Codex-Spark

Wann man welches Modell verwenden sollte

GPT-5.4: Was als Nächstes kommt

Die Beweise

Erwartete Features

Zeitplan für die Veröffentlichung

Welches GPT-5-Modell sollten Sie verwenden?

Die einfache Faustregel

Preisvergleich

Tipps zur Kostenoptimierung

So funktioniert der ChatGPT Auto-Modus

Funktionsweise des Routings

Was das für Sie bedeutet

Legen Sie los

Quellen

Weitere Ressourcen

Related Tools

Mit NxCode bauen

Jetzt selbst ausprobieren

Related Articles

GPT-5.4 vs GPT-5.2: Was hat sich geändert & sollten Sie upgraden? (2026)

OpenAI Codex vs Cursor 2026: Welchen AI-Coding-Agenten sollten Sie nutzen?

Sonnet vs Opus: Welches Claude-Modell wählen (Schnelle Entscheidungshilfe 2026)

GLM-5 Vollständiger Leitfaden: Chinas 744B Open-Source-Modell, das mit GPT-5.2 (2026) konkurriert