Jaké model ID mám použít pro GPT-5.4 v API?

Použijte 'gpt-5.4' jako model ID pro standardní model. Pro maximální výkon u komplexních úkolů použijte 'gpt-5.4-pro'. Oba jsou k dispozici přes standardní OpenAI Chat Completions API endpoint.

Jak funguje parametr reasoning effort v GPT-5.4?

Parametr reasoning.effort určuje, kolik interního compute GPT-5.4 využívá pro chain-of-thought reasoning. Akceptuje pět úrovní: none, low, medium, high a xhigh. Výchozí hodnota je medium. Nastavením na none se model chová jako non-thinking model (nejrychlejší a nejlevnější), zatímco xhigh nabízí maximální reasoning depth pro komplexní problémy.

Kolik stojí GPT-5.4 API?

GPT-5.4 stojí $2.50 za 1M input tokens a $15 za 1M output tokens. GPT-5.4 Pro stojí $30 za 1M input tokens a $180 za 1M output tokens. Input pricing se zdvojnásobuje, když překročíte 272K tokens v jednom požadavku.

Jaká je velikost GPT-5.4 context window?

GPT-5.4 podporuje 1,050,000-token context window s až 128K tokens output. To je dostatečně velké pro zpracování celých codebases v jediném požadavku. Vezměte na vědomí, že input pricing se zdvojnásobuje nad 272K tokens.

Může GPT-5.4 ovládat počítač přes API?

Ano. GPT-5.4 je první general-purpose model s vestavěnými computer-use schopnostmi. Aktivujete to zahrnutím computer_use tool type v tools array. Model může následně ovládat desktop apps, klikat na tlačítka, vyplňovat formuláře a autonomně navigovat skrze UIs. Dosahuje 75 % v OSWorld, což je více než human expert baseline na 72.4 %.

Jaké jsou požadavky na přístup k GPT-5.4 API?

Potřebujete placený OpenAI API účet s minimálně $5 v předchozích výdajích (Tier 1 access). GPT-5.4 není k dispozici ve free API tier. Pro uživatele ChatGPT je vyžadováno předplatné Plus ($20/month), Team ($25/month) nebo Pro ($200/month).

Mám používat GPT-5.4 nebo GPT-5.4 Pro?

Používejte standardní GPT-5.4 pro naprostou většinu úkolů — zvládá coding, analysis a reasoning dobře za $2.50/$15 za milion tokens. Rezervujte si GPT-5.4 Pro ($30/$180 za milion tokens) pro úkoly, kde je přesnost klíčová a náklady jsou sekundární, jako je komplexní multi-step reasoning, high-stakes code reviews nebo nuancovaný výzkum. Pro stojí 12x více, proto používejte standard jako default a upgradujte pouze tehdy, když uvidíte rozdíly v kvalitě.

Idei principale

Cinci niveluri de efort de raționament: Parametrul reasoning.effort (none, low, medium, high, xhigh) controlează compromisul cost-calitate per cerere -- none se comportă ca un model fără gândire (cel mai rapid/ieftin), în timp ce xhigh oferă profunzime maximă la un cost de 3-5 ori mai mare.
Utilizarea nativă a calculatorului prin API: GPT-5.4 poate opera aplicații desktop, poate da click pe butoane și poate naviga autonom în interfețe UI, obținând un scor de 75% pe OSWorld (depășind pragul de referință al experților umani de 72,4%) -- activat prin transmiterea unui tip de instrument computer_use.
Context de peste 1M de tokens la $2.50/$15: Fereastra de input de 1.050.000 de tokens procesează baze de cod întregi într-o singură cerere, deși prețul pentru input se dublează peste 272K tokens.
GPT-5.4 Pro costă de 12 ori mai mult: Rezervă varianta Pro de $30/$180 per milion de tokens pentru sarcini cu mize mari unde acuratețea este critică -- folosește GPT-5.4 standard pentru marea majoritate a sarcinilor de lucru.

Ghid pentru dezvoltatori GPT-5.4 API: Efort de raționament, utilizarea calculatorului și exemple de cod

March 11, 2026 -- GPT-5.4 este cel mai capabil model OpenAI de până acum și vine cu funcții API care schimbă semnificativ modul în care construiești cu acesta. Efort de raționament ajustabil, utilizare nativă a calculatorului, o fereastră de context de peste 1M de tokens și o generare de cod îmbunătățită semnificativ -- toate prin același endpoint Chat Completions pe care îl cunoști deja.

Acest ghid este pentru dezvoltatorii care doresc să înceapă să construiască folosind GPT-5.4 API astăzi. Fără marketing. Doar ID-uri de modele, parametri, exemple de cod, calcule de prețuri și compromisurile practice pe care trebuie să le faci.

Pornire rapidă

ID-uri modele

Model	API ID	Cel mai bun pentru
GPT-5.4	`gpt-5.4`	Sarcini de uz general, coding, raționament, utilizarea calculatorului
GPT-5.4 Pro	`gpt-5.4-pro`	Acuratețe maximă în sarcini complexe, cu mize mari

Primul tău apel API

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
    ]
)

print(response.choices[0].message.content)

Asta este tot. Dacă ai folosit orice model GPT prin Chat Completions API, GPT-5.4 este un înlocuitor direct. Diferențele constau în noii parametri și noile capabilități.

Prețuri

Model	Input	Output	Note
GPT-5.4	$2.50 / 1M tokens	$15.00 / 1M tokens	Input-ul se dublează peste 272K tokens
GPT-5.4 Pro	$30.00 / 1M tokens	$180.00 / 1M tokens	De 12 ori costul variantei standard

Fereastra de context: 1.050.000 tokens input, 128.000 tokens output maxim.

Cerințe de acces: Cont API plătit cu un consum minim anterior de $5 (Tier 1). Nu este disponibil pe nivelul gratuit.

Efort de raționament: Controlul bugetului de gândire

Cel mai important parametru nou în GPT-5.4 este reasoning.effort. Acesta controlează cât de mult calcul intern alocă modelul pentru raționamentul de tip chain-of-thought înainte de a produce un răspuns.

Cele cinci niveluri

Nivel	Comportament	Când să îl utilizezi
`none`	Fără chain-of-thought. Cel mai rapid, cel mai ieftin. Se comportă ca un model fără gândire.	Transformări simple, formatare, extragere
`low`	Raționament minim. Verificări rapide.	Întrebări și răspunsuri simple, clasificare, rezumare
`medium`	Raționament echilibrat. Acesta este nivelul implicit.	Coding general, analiză, majoritatea sarcinilor de producție
`high`	Lanțuri de raționament extinse. Mai amănunțit.	Debugging complex, decizii de arhitectură, logică în mai mulți pași
`xhigh`	Profunzime maximă de raționament. Cel mai lent, dar cel mai precis.	Matematică dificilă, refactorizări mari, audituri de securitate, cercetare

Exemplu de cod: Setarea efortului de raționament

from openai import OpenAI
client = OpenAI()

# Raționament ridicat pentru o sarcină complexă de refactorizare
response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n    results = []\n    while url:\n        resp = requests.get(url)\n        data = resp.json()\n        results.extend(data['items'])\n        url = data.get('next')\n    return results"}
    ]
)

Sfaturi practice privind nivelurile de raționament

Începe de la medium și ajustează. Pentru majoritatea fluxurilor de lucru API, setarea implicită este cea corectă. Iată cum să abordezi situația:

Căi sensibile la latență (autocomplete, chat, interfețe în timp real): Folosește low sau none. Diferența de viteză este substanțială, iar pentru sarcini precum formatarea textului sau căutări simple, raționamentul suplimentar nu aduce nicio valoare.
Procesare în loturi (pipeline-uri de code review, analiza documentelor, extragerea datelor): Folosește high. Nu blochezi un utilizator, deci latența suplimentară nu contează, iar îmbunătățirile de acuratețe se cumulează pentru sute de elemente.
Cereri unice cu miză mare (audit de securitate al unei baze de cod, planificarea unei migrări complexe, proiectarea unui algoritm nou): Folosește xhigh. Acesta este momentul în care calculul de 12 ori mai mare se justifică.

Implicația costurilor: Un efort de raționament mai mare înseamnă că sunt generați (și facturați) mai mulți tokens interni. O cerere la nivelul xhigh poate costa de 3-5 ori mai mult decât aceeași cerere la nivelul low. Monitorizează utilizarea de tokens atunci când schimbi nivelurile.

Computer Use API

GPT-5.4 este primul model de uz general cu capabilități native de utilizare a calculatorului. Pe benchmark-ul OSWorld, acesta obține 75% -- depășind pragul de referință al experților umani de 72,4%. Aceasta nu este o interfață peste capturi de ecran. Modelul înțelege nativ interfețele desktop și le poate opera autonom.

Cum funcționează

Trimite un prompt care descrie ceea ce dorești să fie făcut
Modelul face capturi de ecran ale mediului țintă
Acesta generează clicuri de mouse, intrări de la tastatură și acțiuni de navigare
Execută o buclă de tip build-run-verify-fix pentru a-și verifica propria muncă
Returnează rezultatele sau cere clarificări

Exemplu de cod: Computer Use

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use"}],
    messages=[
        {"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
    ]
)

Ce poate face Computer Use

Automatizarea browserului: Completarea formularelor, navigarea în fluxuri de lucru cu mai mulți pași, extragerea datelor structurate din pagini dinamice
Operarea aplicațiilor desktop: Deschiderea aplicațiilor, interacțiunea cu interfețe native UI, transferul de date între programe
Fluxuri de testare: Parcurgerea fluxurilor UI prin clicuri, verificarea stărilor vizuale, rularea secvențelor de onboarding
Introducerea datelor: Mutarea datelor între foi de calcul, sisteme CRM și instrumente interne

Limitări de cunoscut

Latență: Fiecare ciclu de acțiune implică o captură de ecran, inferența modelului și executarea acțiunii. Sarcinile cu mai mulți pași durează timp real.
Supraveghere necesară: Nu rula utilizarea calculatorului nesupravegheată pe sisteme sensibile. Modelul poate da clic greșit, poate interpreta greșit elementele UI sau poate întreprinde acțiuni neintenționate.
Configurarea mediului: Utilizarea calculatorului necesită un mediu cu afișaj. Pentru automatizarea pe partea de server, ai nevoie de un afișaj virtual (de exemplu, Xvfb pe Linux sau un desktop virtual).
Fără acces la sistemul de fișiere în mod implicit: Utilizarea calculatorului operează prin UI, nu prin apeluri directe la sistemul de fișiere. Combină-l cu instrumente de execuție de cod pentru fluxuri de lucru hibride.

Coding cu GPT-5.4

GPT-5.4 moștenește și îmbunătățește capabilitățile de coding ale GPT-5.3 Codex. Benchmark-urile spun povestea:

Benchmark	Scor GPT-5.4	Ce testează
SWE-Bench Pro	57,7%	Rezolvarea problemelor GitHub din lumea reală
SWE-Bench Verified	~80%	Subset selectat de SWE-Bench
Terminal-Bench 2.0	75,1%	Sarcini de dezvoltare bazate pe terminal

Ce este diferit față de GPT-5.3 Codex

cu 47% mai puțini tokens în sarcinile complexe -- output mai puțin redundant, cod mai concis
Modificări în mai multe fișiere cu mai puține reîncercări -- o mai bună înțelegere a dependențelor dintre fișiere
Respectă tiparele specifice repository-ului -- se adaptează la convențiile bazei tale de cod atunci când i se oferă context
cu 33% mai puține erori factuale -- mai puține halucinații în referințele API, utilizarea bibliotecilor și configurare

Sfaturi pentru o mai bună generare de cod

1. Folosește prompturi de sistem pentru a seta standardele de codare.

response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
        {"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
    ]
)

2. Oferă-i codul tău real pentru context. Fereastra de context de 1M de tokens a GPT-5.4 înseamnă că poți include module întregi sau chiar repository-uri complete. Modelul produce cod semnificativ mai bun atunci când poate vedea tiparele, tipurile și convențiile existente.

3. Setează efortul de raționament la high sau xhigh pentru modificări complexe. Rezolvările simple de bug-uri funcționează bine la medium, dar refactorizările arhitecturale, migrările și modificările în mai multe fișiere beneficiază vizibil de un efort de raționament mai mare.

4. Folosește max_completion_tokens pentru a preveni răspunsurile necontrolate. Pentru generarea de cod, setează o limită rezonabilă astfel încât să nu fii facturat pentru explicații lungi pe care nu le-ai cerut.

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[...],
    max_completion_tokens=4096
)

Strategii pentru context mare

Fereastra de context de 1.050.000 de tokens este superputerea discretă a GPT-5.4. Iată cum să o folosești eficient -- și să eviți capcanele de cost.

Suprataxa de 272K

Prețul pentru input se dublează odată ce depășești 272K tokens într-o singură cerere. Asta înseamnă că o cerere de 500K tokens costă aproximativ:

Primii 272K tokens: 272K x $2.50/1M = $0,68
Restul de 228K tokens: 228K x $5.00/1M = $1,14
Cost total input: $1,82

Pentru comparație, aceeași cerere la prețul standard ar costa $1,25. Suprataxa adaugă ~46% la factură în acest caz.

Exemplu de cod: Utilizarea unui context mare

from openai import OpenAI
client = OpenAI()

# Încarcă întreaga bază de cod în context
with open("codebase_dump.txt", "r") as f:
    full_codebase_content = f.read()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": full_codebase_content},  # până la 1M tokens
        {"role": "user", "content": "Find all security vulnerabilities in this codebase"}
    ],
    max_completion_tokens=8192
)

Cele mai bune practici pentru contexte mari

Recomandat:

Pune fișierele cele mai relevante la început. Modelul acordă cea mai mare atenție începutului și sfârșitului contextului. Plasează fișierele cele mai relevante pentru sarcină primele.
Folosește mesajul de sistem pentru materialul de referință. Plasează baza de cod, documentația sau datele în mesajul de sistem. Pune instrucțiunile propriu-zise în mesajul utilizatorului.
Setează max_completion_tokens explicit. Cu un output maxim de 128K, un răspuns nelimitat pe un context mare poate deveni rapid scump.

De evitat:

Nu folosi întotdeauna întreaga fereastră. Dacă sarcina ta are nevoie doar de 50K tokens de context, nu o completa până la 1M. Plătești pentru tokens de input indiferent dacă modelul are nevoie de ei sau nu.
Nu ignora limita de 272K. Structurează prompturile pentru a rămâne sub 272K atunci când este posibil. Dacă ești la 280K, vezi dacă poți elimina 10K tokens de context mai puțin relevant pentru a economisi suprataxa.
Nu te aștepta la o reamintire perfectă pe parcursul a 1M de tokens. Performanța scade treptat odată cu lungimea contextului. Pentru cea mai mare acuratețe, păstrează informațiile cele mai critice în primii 200K tokens.

GPT-5.4 vs GPT-5.4 Pro: Când să faci upgrade

GPT-5.4 Pro costă de 12 ori mai mult decât GPT-5.4 standard. Iată când este justificat acest cost.

Dimensiune	GPT-5.4	GPT-5.4 Pro
Cost input	$2.50 / 1M	$30.00 / 1M
Cost output	$15.00 / 1M	$180.00 / 1M
Cel mai bun pentru	Majoritatea sarcinilor de dezvoltare	Acuratețe maximă pe probleme dificile
Profunzime raționament	Puternic la toate nivelurile	Raționament intern mai profund în mod implicit
Latență	Standard	Mai mare (mai mult calcul per cerere)

Folosește GPT-5.4 standard când:

Construiești aplicații de producție cu costuri previzibile
Sarcinile sunt bine definite (CRUD, transformări, coding standard)
Ai nevoie de latență mai mică pentru funcțiile destinate utilizatorilor
Procesezi volume mari de cereri

Folosește GPT-5.4 Pro când:

Acuratețea unei singure cereri contează mai mult decât costul (analiză juridică, cercetare medicală, audituri de securitate)
Abordezi probleme inedite pentru care modelul nu a văzut multe exemple
Lanțurile de raționament cu mai mulți pași trebuie să fie impecabile
Realizezi benchmark-uri competitive sau evaluări

Regula practică: Rămâi la standard în mod implicit. Rulează cele mai dificile cazuri de test prin ambele modele. Dacă Pro produce constant rezultate mai bune pentru fluxul tău specific de lucru, comută acele apeluri specifice pe Pro și păstrează restul pe standard.

Migrarea de la GPT-5.3 Codex

Dacă folosești în prezent GPT-5.3 Codex (sau GPT-5.2-Codex), iată diferențele cheie de luat în calcul.

Ce se schimbă

Zonă	GPT-5.3 Codex	GPT-5.4
Model ID	`gpt-5.3-codex`	`gpt-5.4`
Fereastră de context	1.000.000 tokens	1.050.000 tokens
Computer use	Indisponibil	Suport nativ
Efort de raționament	Suportat	Suportat (același parametru)
Preț (input)	Variază în funcție de variantă	$2.50 / 1M tokens
Preț (output)	Variază în funcție de variantă	$15.00 / 1M tokens
Eficiență tokens	Nivel de referință	cu 47% mai puțini tokens la sarcinile complexe

Listă de verificare pentru migrare

Schimbă ID-ul modelului. Schimbă gpt-5.3-codex cu gpt-5.4 în apelurile tale API.
Testează setările de efort de raționament. Există aceleași niveluri de efort (none până la xhigh), dar GPT-5.4 poate produce compromisuri de calitate diferite la fiecare nivel. Re-evaluează setările implicite.
Revizuiește bugetele de tokens pentru output. GPT-5.4 este mai concis (cu 47% mai puțini tokens la sarcinile complexe). S-ar putea să poți reduce max_completion_tokens și să economisești la costurile de output.
Evaluează utilizarea calculatorului. Dacă aveai soluții alternative pentru automatizarea UI (scripturi Selenium, instrumente personalizate), utilizarea nativă a calculatorului din GPT-5.4 le-ar putea înlocui.
Atenție la suprataxa de 272K. Dacă sarcinile tale pe Codex foloseau contexte mari, dar se încadrau în structura de prețuri Codex, recalculează costurile cu prețurile pe niveluri ale GPT-5.4.

Ce rămâne la fel

Endpoint-ul Chat Completions API este identic
Rolurile mesajelor system/user/assistant funcționează în același mod
Streaming-ul, apelarea funcțiilor și utilizarea instrumentelor sunt toate compatibile
Sintaxa parametrului reasoning este neschimbată

Benchmark-uri pe scurt

Pentru o referință rapidă, iată cum performează GPT-5.4 în benchmark-urile care contează cel mai mult pentru dezvoltatori:

Benchmark	Scor	Ce măsoară
SWE-Bench Pro	57,7%	Inginerie software complexă din lumea reală
SWE-Bench Verified	~80%	Rezolvarea problemelor GitHub selectate
Terminal-Bench 2.0	75,1%	Coding bazat pe terminal și sarcini de sistem
OSWorld	75,0%	Operarea calculatorului desktop (referință umană: 72,4%)
GDPval	83%	Muncă intelectuală profesională în 44 de ocupații

Metrici de calitate suplimentare:

cu 33% mai puține erori factuale comparativ cu GPT-5.2
cu 18% mai puține răspunsuri cu orice fel de greșeli în total

Rezumat

GPT-5.4 nu este o schimbare revoluționară de API -- este una practică. Același endpoint, același format de mesaj, aceleași tipare de utilizare a instrumentelor. Ceea ce este nou este faptul că acum ai un control detaliat asupra calculului de raționament, utilizare nativă a calculatorului fără instrumente terțe, o fereastră de context suficient de mare pentru baze de cod întregi și un output de cod semnificativ mai bun.

Cele trei lucruri de făcut chiar acum:

Setează reasoning.effort în mod intenționat. Nu te baza pe setarea implicită pentru fiecare apel. Potrivește nivelul de efort cu complexitatea sarcinii și bugetul tău de latență/cost.
Experimentează cu utilizarea calculatorului. Dacă ai fluxuri de automatizare UI, testează-le folosind capabilitățile native GPT-5.4. S-ar putea să poți renunța la scripturile Selenium fragile.
Auditează utilizarea contextului. Având în vedere limita de suprataxă de 272K și fereastra de 1M, există bani reali de economisit (sau de irosit) în funcție de modul în care îți structurezi prompturile.

Modelul este disponibil acum la gpt-5.4 pentru conturile API de Tier 1+. Începe să construiești.

GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use, a Code Examples (2026)