Millist model ID-d peaksin GPT-5.4 jaoks API-s kasutama?

Kasutage standardse mudeli jaoks 'gpt-5.4' kui model ID. Maksimaalse jõudluse saavutamiseks keeruliste ülesannete puhul kasutage 'gpt-5.4-pro'. Mõlemad on saadaval standardse OpenAI Chat Completions API endpoint kaudu.

Kuidas toimib reasoning effort parameeter GPT-5.4-s?

Parameeter reasoning.effort määrab, kui palju sisemist compute-ressurssi GPT-5.4 chain-of-thought reasoning jaoks kasutab. See toetab viit taset: none, low, medium, high ja xhigh. Vaikeväärtus on medium. Valides none, käitub mudel kui non-thinking model (kiireim ja odavaim), samas kui xhigh pakub maksimaalset reasoning depth keeruliste probleemide lahendamiseks.

Kui palju maksab GPT-5.4 API?

GPT-5.4 maksab $2.50 1M input tokens kohta ja $15 1M output tokens kohta. GPT-5.4 Pro maksab $30 1M input tokens kohta ja $180 1M output tokens kohta. Input pricing duubeldub, kui ületate 272K tokens ühes päringus.

Kui suur on GPT-5.4 context window?

GPT-5.4 toetab 1,050,000-token context window-t kuni 128K tokens output mahuga. See on piisavalt suur, et töödelda terveid codebases ühes päringus. Pidage meeles, et input pricing duubeldub üle 272K tokens.

Kas GPT-5.4 suudab API kaudu arvutit juhtida?

Jah. GPT-5.4 on esimene general-purpose model, millel on sisseehitatud computer-use võimekused. Saate selle aktiveerida, lisades computer_use tool type tools array-sse. Mudel saab seejärel juhtida desktop apps, klikkida nuppudele, täita vorme ja navigeerida autonoomselt läbi UIs. See saavutab OSWorld testis 75%, mis on kõrgem kui human expert baseline (72.4%).

Millised on nõuded GPT-5.4 API-le juurdepääsuks?

Teil on vaja tasulist OpenAI API kontot, millel on vähemalt $5 eelnevaid kulutusi (Tier 1 access). GPT-5.4 ei ole saadaval free API tier-is. ChatGPT kasutajatele on vajalik Plus ($20/month), Team ($25/month) või Pro ($200/month) tellimus.

Kas peaksin kasutama GPT-5.4 või GPT-5.4 Pro mudelit?

Kasutage standardset GPT-5.4 enamiku ülesannete jaoks — see saab hästi hakkama coding, analysis ja reasoning tegevustega hinnaga $2.50/$15 miljoni tokens kohta. Reserveerige GPT-5.4 Pro ($30/$180 miljoni tokens kohta) ülesanneteks, kus täpsus on kriitiline ja kulud on sekundaarsed, nagu näiteks keeruline multi-step reasoning, high-stakes code reviews või nüansirohke uurimistöö. Pro maksab 12x rohkem, seega kasutage standardit kui default ja uuendage ainult siis, kui näete erinevusi kvaliteedis.

Ključne ugotovitve

Pet stopenj truda pri razmišljanju: Parameter reasoning.effort (none, low, medium, high, xhigh) nadzoruje razmerje med stroški in kakovostjo na zahtevek -- none se obnaša kot model brez razmišljanja (najhitrejši/najcenejši), medtem ko xhigh zagotavlja največjo globino pri 3-5x višjih stroških.
Nativna uporaba računalnika prek API: GPT-5.4 lahko upravlja namizne aplikacije, klika gumbe in avtonomno krmari po uporabniških vmesnikih, pri čemer dosega 75% na OSWorld (kar presega 72.4% izhodišče človeških strokovnjakov) -- to omogočite s podajanjem vrste orodja computer_use.
Kontekst z več kot 1M tokens za $2.50/$15: Vhodno okno z 1,050,000 tokens omogoča obdelavo celotnih zbirk kode v enem samem zahtevku, čeprav se cena vnosa podvoji nad 272K tokens.
GPT-5.4 Pro stane 12x več: Različico Pro s ceno $30/$180 na milijon tokens rezervirajte za kritična opravila, kjer je natančnost bistvena -- za večino delovnih obremenitev uporabite standardni GPT-5.4.

GPT-5.4 API vodnik za razvijalce: Trud pri razmišljanju, uporaba računalnika in primeri kode

March 11, 2026 -- GPT-5.4 je doslej najzmogljivejši model podjetja OpenAI in prihaja z API funkcijami, ki bistveno spreminjajo način, kako gradite z njim. Nastavljiv trud pri razmišljanju, nativna uporaba računalnika, kontekstno okno z več kot 1M tokens in znatno izboljšano generiranje kode -- vse prek iste končne točke Chat Completions, ki jo že poznate.

Ta vodnik je namenjen razvijalcem, ki želijo danes začeti graditi z GPT-5.4 API. Brez marketinškega olepševanja. Samo ID-ji modelov, parametri, primeri kode, izračun cen in praktični kompromisi, ki jih morate sprejeti.

Hitri začetek

ID-ji modelov

Model	API ID	Najboljše za
GPT-5.4	`gpt-5.4`	Splošna opravila, programiranje, razmišljanje, uporaba računalnika
GPT-5.4 Pro	`gpt-5.4-pro`	Največja natančnost pri kompleksnih, kritičnih opravilih

Vaš prvi API klic

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
    ]
)

print(response.choices[0].message.content)

To je vse. Če ste uporabili kateri koli GPT model prek Chat Completions API, je GPT-5.4 neposredna zamenjava. Razlike so v novih parametrih in zmožnostih.

Cene

Model	Vnos	Izhod	Opombe
GPT-5.4	$2.50 / 1M tokens	$15.00 / 1M tokens	Vnos se podvoji nad 272K tokens
GPT-5.4 Pro	$30.00 / 1M tokens	$180.00 / 1M tokens	12x strošek standardnega modela

Kontekstno okno: 1,050,000 tokens vnos, 128,000 tokens maksimalni izhod.

Zahteve za dostop: Plačljiv API račun z najmanj $5 predhodne porabe (Tier 1). Ni na voljo v brezplačnem paketu.

Trud pri razmišljanju: Nadzor proračuna za razmišljanje

Najpomembnejši novi parameter v GPT-5.4 je reasoning.effort. Nadzoruje, koliko notranje računske moči model dodeli razmišljanju v verigi misli, preden poda odgovor.

Pet stopenj

Stopnja	Obnašanje	Kdaj uporabiti
`none`	Brez verige misli. Najhitreje, najceneje. Obnaša se kot model brez razmišljanja.	Preproste transformacije, oblikovanje, ekstrakcija
`low`	Minimalno razmišljanje. Hitre preverbe razumnosti.	Preprosta vprašanja in odgovori, klasifikacija, povzemanje
`medium`	Uravnoteženo razmišljanje. To je privzeta nastavitev.	Splošno programiranje, analiza, večina produkcijskih delovnih obremenitev
`high`	Razširjene verige razmišljanja. Bolj temeljito.	Kompleksno iskanje napak, arhitekturne odločitve, večstopenjska logika
`xhigh`	Največja globina razmišljanja. Najpočasneje, a najnatančneje.	Težka matematika, obsežni refaktorji, varnostne revizije, raziskave

Primer kode: Nastavitev truda pri razmišljanju

from openai import OpenAI
client = OpenAI()

# High reasoning for a complex refactoring task
response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n    results = []\n    while url:\n        resp = requests.get(url)\n        data = resp.json()\n        results.extend(data['items'])\n        url = data.get('next')\n    return results"}
    ]
)

Praktični napotki glede stopenj razmišljanja

Začnite pri medium in prilagodite. Za večino API delovnih obremenitev je privzeta nastavitev prava izbira. Tukaj je način razmišljanja:

Poti, občutljive na zakasnitev (samodejno dokončanje, klepet, vmesniki v realnem času): Uporabite low ali none. Razlika v hitrosti je precejšnja, pri nalogah, kot sta oblikovanje besedila ali preprosta iskanja, pa dodatno razmišljanje ne doda nobene vrednosti.
Paketna obdelava (cevovodi za pregled kode, analiza dokumentov, ekstrakcija podatkov): Uporabite high. Ne blokirate uporabnika, zato dodatna zakasnitev ni pomembna, izboljšave natančnosti pa se kopičijo skozi na stotine postavk.
Kritični posamezni zahtevki (varnostna revizija zbirke kode, načrtovanje kompleksne migracije, snovanje novih algoritmov): Uporabite xhigh. Tukaj se 12x večja računska moč povrne sama.

Vpliv na stroške: Večji trud pri razmišljanju pomeni, da se ustvari (in zaračuna) več notranjih tokens. Zahtevek pri xhigh lahko stane 3–5x več kot isti zahtevek pri low. Spremljajte porabo tokens, ko spreminjate stopnje.

Computer Use API

GPT-5.4 je prvi splošni model z nativnimi zmožnostmi uporabe računalnika. Na merilu OSWorld dosega 75% -- kar presega izhodišče človeških strokovnjakov, ki znaša 72.4%. To ni le ovitek okoli posnetkov zaslona. Model nativno razume namizne vmesnike in jih lahko upravlja avtonomno.

Kako deluje

Pošljete navodilo, ki opisuje, kaj želite storiti
Model naredi posnetke zaslona ciljnega okolja
Generira klike z miško, vnose s tipkovnico in dejanja navigacije
Izvede zanko zgradi-zaženi-preveri-popravi, da preveri svoje delo
Vrne rezultate ali prosi za pojasnilo

Primer kode: Uporaba računalnika

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use"}],
    messages=[
        {"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
    ]
)

Kaj uporaba računalnika omogoča

Avtomatizacija brskalnika: Izpolnjevanje obrazcev, navigacija po večstopenjskih delovnih tokovih, strganje strukturiranih podatkov z dinamičnih strani
Upravljanje namiznih aplikacij: Odpiranje aplikacij, interakcija z nativnimi uporabniškimi vmesniki, prenos podatkov med programi
Testiranje delovnih tokov: Klikanje skozi UI tokove, preverjanje vizualnih stanj, izvajanje uvajalnih sekvenc
Vnos podatkov: Premikanje podatkov med preglednicami, sistemi CRM in notranjimi orodji

Omejitve, ki jih morate poznati

Zakasnitev: Vsak cikel dejanja vključuje posnetek zaslona, sklepanje modela in izvedbo dejanja. Večstopenjske naloge zahtevajo dejanski čas.
Potreben nadzor: Ne izvajajte uporabe računalnika brez nadzora na občutljivih sistemih. Model lahko napačno klikne, napačno interpretira elemente vmesnika ali izvede nenamerna dejanja.
Nastavitev okolja: Uporaba računalnika zahteva zaslonsko okolje. Za avtomatizacijo na strani strežnika potrebujete virtualni zaslon (npr. Xvfb na Linuxu ali virtualno namizje).
Brez dostopa do datotečnega sistema po privzetem: Uporaba računalnika deluje prek uporabniškega vmesnika, ne prek neposrednih klicov datotečnega sistema. Za hibridne delovne tokove jo povežite z orodji za izvajanje kode.

Programiranje z GPT-5.4

GPT-5.4 deduje in izboljšuje zmožnosti programiranja modela GPT-5.3 Codex. Rezultati meril uspešnosti povedo svojo zgodbo:

Merilo uspešnosti	Rezultat GPT-5.4	Kaj testira
SWE-Bench Pro	57.7%	Reševanje dejanskih težav na GitHub
SWE-Bench Verified	~80%	Izbran nabor SWE-Bench
Terminal-Bench 2.0	75.1%	Razvojne naloge v terminalu

Kaj je drugače kot pri GPT-5.3 Codex

47% manj tokens pri kompleksnih nalogah -- manj gostobeseden izhod, bolj strnjena koda
Spremembe v več datotekah z manj ponovitvami -- boljše razumevanje odvisnosti med datotekami
Upošteva vzorce, specifične za repozitorij -- prilagodi se konvencijam vaše zbirke kode, ko dobi kontekst
33% manj dejanskih napak -- manj halucinacij pri API referencah, uporabi knjižnic in konfiguraciji

Nasveti za boljše generiranje kode

1. Uporabite sistemska navodila za nastavitev standardov kodiranja.

response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
        {"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
    ]
)

2. Podajte mu svojo dejansko kodo za kontekst. GPT-5.4 kontekstno okno z 1M tokens pomeni, da lahko vključite celotne module ali celo polne repozitorije. Model ustvari bistveno boljšo kodo, ko vidi obstoječe vzorce, tipe in konvencije.

3. Nastavite trud pri razmišljanju na high ali xhigh za kompleksne spremembe. Preprosti popravki hroščev delujejo dobro pri medium, vendar arhitekturni refaktorji, migracije in spremembe v več datotekah merljivo pridobijo z višjim trudom pri razmišljanju.

4. Uporabite max_completion_tokens, da preprečite predolge odgovore. Pri generiranju kode nastavite razumno omejitev, da vam ne bodo zaračunana dolga pojasnila, ki jih niste zahtevali.

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[...],
    max_completion_tokens=4096
)

Strategije za velik kontekst

Kontekstno okno z 1,050,000 tokens je tiha supermoč modela GPT-5.4. Tukaj je opisano, kako ga učinkovito uporabljati -- in se izogniti stroškovnim pastem.

Doplačilo nad 272K

Cena vnosa se podvoji, ko presežete 272K tokens v enem samem zahtevku. To pomeni, da zahtevek s 500K tokens stane približno:

Prvih 272K tokens: 272K x $2.50/1M = $0.68
Preostalih 228K tokens: 228K x $5.00/1M = $1.14
Skupni strošek vnosa: $1.82

Za primerjavo, isti zahtevek bi po standardni ceni stal $1.25. Doplačilo v tem primeru doda ~46% k računu.

Primer kode: Uporaba velikega konteksta

from openai import OpenAI
client = OpenAI()

# Load entire codebase into context
with open("codebase_dump.txt", "r") as f:
    full_codebase_content = f.read()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": full_codebase_content},  # up to 1M tokens
        {"role": "user", "content": "Find all security vulnerabilities in this codebase"}
    ],
    max_completion_tokens=8192
)

Najboljše prakse za velike kontekste

DA:

Najbolj relevantne datoteke postavite na začetek. Model posveča največ pozornosti začetku in koncu konteksta. Datoteke, ki so najbolj relevantne za nalogo, postavite na prvo mesto.
Uporabite sistemsko sporočilo za referenčno gradivo. Svojo zbirko kode, dokumentacijo ali podatke postavite v sistemsko sporočilo. Svoja dejanska navodila pa v uporabniško sporočilo.
Eksplicitno nastavite max_completion_tokens. Pri 128K maksimalnem izhodu lahko neomejen odgovor na velikem kontekstu hitro postane drag.

NE:

Ne uporabljajte vedno celotnega okna. Če vaša naloga potrebuje le 50K tokens konteksta, ga ne polnite do 1M. Vhodne tokens plačate ne glede na to, ali jih model potrebuje ali ne.
Ne prezrite meje 272K. Svoja navodila strukturirajte tako, da ostanejo pod 272K, kadar je to mogoče. Če ste pri 280K, preverite, ali lahko odstranite 10K tokens manj relevantnega konteksta, da prihranite pri doplačilu.
Ne pričakujte popolnega priklica v 1M tokens. Zmogljivost postopoma upada z dolžino konteksta. Za največjo natančnost naj bodo najbolj kritične informacije v prvih 200K tokens.

GPT-5.4 proti GPT-5.4 Pro: Kdaj nadgraditi

GPT-5.4 Pro stane 12x več kot standardni GPT-5.4. Tukaj je opisano, kdaj je to upravičeno.

Dimenzija	GPT-5.4	GPT-5.4 Pro
Strošek vnosa	$2.50 / 1M	$30.00 / 1M
Strošek izhoda	$15.00 / 1M	$180.00 / 1M
Najboljše za	Večino razvojnih nalog	Največjo natančnost pri težkih problemih
Globina razmišljanja	Močna na vseh stopnjah	Privzeto globlje notranje razmišljanje
Zakasnitev	Standardna	Višja (več izračunov na zahtevek)

Uporabite standardni GPT-5.4, ko:

Gradite produkcijske aplikacije s predvidljivimi stroški
So naloge dobro opredeljene (CRUD, transformacije, standardno kodiranje)
Potrebujete manjšo zakasnitev za funkcije, namenjene uporabnikom
Obdelujete velike količine zahtevkov

Uporabite GPT-5.4 Pro, ko:

Je natančnost pri posameznem zahtevku pomembnejša od stroškov (pravna analiza, medicinske raziskave, varnostne revizije)
Se lotevate novih problemov, za katere model ni videl veliko primerov
Morajo biti večstopenjske verige razmišljanja brezhibne
Izvajate konkurenčno primerjavo ali ocenjevanje

Praktično pravilo: Privzeto uporabite standardni model. Svoje najtežje testne primere zaženite skozi oba modela. Če Pro dosledno daje boljše rezultate pri vaši specifični delovni obremenitvi, preklopite te specifične klice na Pro, vse ostalo pa obdržite na standardnem modelu.

Migracija z GPT-5.3 Codex

Če trenutno uporabljate GPT-5.3 Codex (ali GPT-5.2-Codex), so tukaj ključne razlike, ki jih morate načrtovati.

Kaj se spremeni

Področje	GPT-5.3 Codex	GPT-5.4
ID modela	`gpt-5.3-codex`	`gpt-5.4`
Kontekstno okno	1,000,000 tokens	1,050,000 tokens
Uporaba računalnika	Ni na voljo	Nativna podpora
Trud pri razmišljanju	Podprto	Podprto (isti parameter)
Cena (vnos)	Odvisna od različice	$2.50 / 1M tokens
Cena (izhod)	Odvisna od različice	$15.00 / 1M tokens
Učinkovitost tokens	Izhodišče	47% manj tokens pri kompleksnih nalogah

Kontrolni seznam za migracijo

Zamenjajte ID modela. Spremenite gpt-5.3-codex v gpt-5.4 v svojih API klicih.
Preizkusite nastavitve truda pri razmišljanju. Obstajajo iste stopnje truda (od none do xhigh), vendar lahko GPT-5.4 pri vsaki stopnji proizvede drugačne kompromise v kakovosti. Ponovno ocenite svoje privzete vrednosti.
Preglejte proračune za izhodne tokens. GPT-5.4 je bolj jedrnat (47% manj tokens pri kompleksnih nalogah). Morda boste lahko znižali max_completion_tokens in prihranili pri stroških izhoda.
Ocenite uporabo računalnika. Če ste imeli zaobide za avtomatizacijo uporabniškega vmesnika (Selenium skripte, orodja po meri), jih lahko GPT-5.4 nativna uporaba računalnika nadomesti.
Bodite pozorni na doplačilo nad 272K. Če so vaše Codex delovne obremenitve uporabljale velike kontekste, vendar ostale znotraj Codex cenovne strukture, ponovno izračunajte stroške s stopenjskim določanjem cen vnosa modela GPT-5.4.

Kaj ostaja enako

Končna točka Chat Completions API je identična
Vloge sporočil system/user/assistant delujejo enako
Pretočno predvajanje (streaming), klicanje funkcij (function calling) in uporaba orodij (tool use) so popolnoma združljivi
Sintaksa parametra reasoning ostaja nespremenjena

Hitri pregled meril uspešnosti

Za hitro referenco, tukaj je, kako GPT-5.4 deluje v merilih uspešnosti, ki so najpomembnejša za razvijalce:

Merilo uspešnosti	Rezultat	Kaj meri
SWE-Bench Pro	57.7%	Kompleksno programsko inženirstvo v realnem svetu
SWE-Bench Verified	~80%	Izbrano reševanje težav na GitHub
Terminal-Bench 2.0	75.1%	Kodiranje v terminalu in sistemske naloge
OSWorld	75.0%	Upravljanje namiznega računalnika (človeško izhodišče: 72.4%)
GDPval	83%	Strokovno delo z znanjem v 44 poklicih

Dodatne metrike kakovosti:

33% manj dejanskih napak v primerjavi z GPT-5.2
18% manj odgovorov s kakršno koli napako na splošno

Povzetek

GPT-5.4 ni revolucionarna sprememba API-ja -- je praktična. Ista končna točka, ista oblika sporočil, isti vzorci uporabe orodij. Novo je to, da imate zdaj natančen nadzor nad izračunom razmišljanja, nativno uporabo računalnika brez orodij tretjih oseb, kontekstno okno, ki je dovolj veliko za celotne zbirke kode, in bistveno boljši izhod kode.

Tri stvari, ki jih morate storiti takoj:

Namerno nastavite reasoning.effort. Ne zanašajte se na privzeto vrednost za vsak klic. Stopnjo truda prilagodite kompleksnosti naloge ter svojemu proračunu za zakasnitev in stroške.
Eksperimentirajte z uporabo računalnika. Če imate kakršne koli delovne tokove za avtomatizacijo uporabniškega vmesnika, jih preizkusite z nativnimi zmožnostmi uporabe računalnika modela GPT-5.4. Morda boste lahko upokojili krhke Selenium skripte.
Revidirajte svojo porabo konteksta. Z mejo doplačila pri 272K in oknom 1M lahko prihranite (ali zapravite) dejanski denar, odvisno od tega, kako strukturirate svoja navodila.

Model je zdaj na voljo na gpt-5.4 za račune API stopnje Tier 1+. Začnite graditi.

GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use ja Code Examples (2026)