GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use ja Code Examples (2026)
← Nazaj na novice

GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use ja Code Examples (2026)

N

NxCode Team

11 min read

Ključne ugotovitve

  • Pet stopenj truda pri razmišljanju: Parameter reasoning.effort (none, low, medium, high, xhigh) nadzoruje razmerje med stroški in kakovostjo na zahtevek -- none se obnaša kot model brez razmišljanja (najhitrejši/najcenejši), medtem ko xhigh zagotavlja največjo globino pri 3-5x višjih stroških.
  • Nativna uporaba računalnika prek API: GPT-5.4 lahko upravlja namizne aplikacije, klika gumbe in avtonomno krmari po uporabniških vmesnikih, pri čemer dosega 75% na OSWorld (kar presega 72.4% izhodišče človeških strokovnjakov) -- to omogočite s podajanjem vrste orodja computer_use.
  • Kontekst z več kot 1M tokens za $2.50/$15: Vhodno okno z 1,050,000 tokens omogoča obdelavo celotnih zbirk kode v enem samem zahtevku, čeprav se cena vnosa podvoji nad 272K tokens.
  • GPT-5.4 Pro stane 12x več: Različico Pro s ceno $30/$180 na milijon tokens rezervirajte za kritična opravila, kjer je natančnost bistvena -- za večino delovnih obremenitev uporabite standardni GPT-5.4.

GPT-5.4 API vodnik za razvijalce: Trud pri razmišljanju, uporaba računalnika in primeri kode

March 11, 2026 -- GPT-5.4 je doslej najzmogljivejši model podjetja OpenAI in prihaja z API funkcijami, ki bistveno spreminjajo način, kako gradite z njim. Nastavljiv trud pri razmišljanju, nativna uporaba računalnika, kontekstno okno z več kot 1M tokens in znatno izboljšano generiranje kode -- vse prek iste končne točke Chat Completions, ki jo že poznate.

Ta vodnik je namenjen razvijalcem, ki želijo danes začeti graditi z GPT-5.4 API. Brez marketinškega olepševanja. Samo ID-ji modelov, parametri, primeri kode, izračun cen in praktični kompromisi, ki jih morate sprejeti.


Hitri začetek

ID-ji modelov

ModelAPI IDNajboljše za
GPT-5.4gpt-5.4Splošna opravila, programiranje, razmišljanje, uporaba računalnika
GPT-5.4 Progpt-5.4-proNajvečja natančnost pri kompleksnih, kritičnih opravilih

Vaš prvi API klic

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
    ]
)

print(response.choices[0].message.content)

To je vse. Če ste uporabili kateri koli GPT model prek Chat Completions API, je GPT-5.4 neposredna zamenjava. Razlike so v novih parametrih in zmožnostih.

Cene

ModelVnosIzhodOpombe
GPT-5.4$2.50 / 1M tokens$15.00 / 1M tokensVnos se podvoji nad 272K tokens
GPT-5.4 Pro$30.00 / 1M tokens$180.00 / 1M tokens12x strošek standardnega modela

Kontekstno okno: 1,050,000 tokens vnos, 128,000 tokens maksimalni izhod.

Zahteve za dostop: Plačljiv API račun z najmanj $5 predhodne porabe (Tier 1). Ni na voljo v brezplačnem paketu.


Trud pri razmišljanju: Nadzor proračuna za razmišljanje

Najpomembnejši novi parameter v GPT-5.4 je reasoning.effort. Nadzoruje, koliko notranje računske moči model dodeli razmišljanju v verigi misli, preden poda odgovor.

Pet stopenj

StopnjaObnašanjeKdaj uporabiti
noneBrez verige misli. Najhitreje, najceneje. Obnaša se kot model brez razmišljanja.Preproste transformacije, oblikovanje, ekstrakcija
lowMinimalno razmišljanje. Hitre preverbe razumnosti.Preprosta vprašanja in odgovori, klasifikacija, povzemanje
mediumUravnoteženo razmišljanje. To je privzeta nastavitev.Splošno programiranje, analiza, večina produkcijskih delovnih obremenitev
highRazširjene verige razmišljanja. Bolj temeljito.Kompleksno iskanje napak, arhitekturne odločitve, večstopenjska logika
xhighNajvečja globina razmišljanja. Najpočasneje, a najnatančneje.Težka matematika, obsežni refaktorji, varnostne revizije, raziskave

Primer kode: Nastavitev truda pri razmišljanju

from openai import OpenAI
client = OpenAI()

# High reasoning for a complex refactoring task
response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n    results = []\n    while url:\n        resp = requests.get(url)\n        data = resp.json()\n        results.extend(data['items'])\n        url = data.get('next')\n    return results"}
    ]
)

Praktični napotki glede stopenj razmišljanja

Začnite pri medium in prilagodite. Za večino API delovnih obremenitev je privzeta nastavitev prava izbira. Tukaj je način razmišljanja:

  • Poti, občutljive na zakasnitev (samodejno dokončanje, klepet, vmesniki v realnem času): Uporabite low ali none. Razlika v hitrosti je precejšnja, pri nalogah, kot sta oblikovanje besedila ali preprosta iskanja, pa dodatno razmišljanje ne doda nobene vrednosti.

  • Paketna obdelava (cevovodi za pregled kode, analiza dokumentov, ekstrakcija podatkov): Uporabite high. Ne blokirate uporabnika, zato dodatna zakasnitev ni pomembna, izboljšave natančnosti pa se kopičijo skozi na stotine postavk.

  • Kritični posamezni zahtevki (varnostna revizija zbirke kode, načrtovanje kompleksne migracije, snovanje novih algoritmov): Uporabite xhigh. Tukaj se 12x večja računska moč povrne sama.

Vpliv na stroške: Večji trud pri razmišljanju pomeni, da se ustvari (in zaračuna) več notranjih tokens. Zahtevek pri xhigh lahko stane 3–5x več kot isti zahtevek pri low. Spremljajte porabo tokens, ko spreminjate stopnje.


Computer Use API

GPT-5.4 je prvi splošni model z nativnimi zmožnostmi uporabe računalnika. Na merilu OSWorld dosega 75% -- kar presega izhodišče človeških strokovnjakov, ki znaša 72.4%. To ni le ovitek okoli posnetkov zaslona. Model nativno razume namizne vmesnike in jih lahko upravlja avtonomno.

Kako deluje

  1. Pošljete navodilo, ki opisuje, kaj želite storiti
  2. Model naredi posnetke zaslona ciljnega okolja
  3. Generira klike z miško, vnose s tipkovnico in dejanja navigacije
  4. Izvede zanko zgradi-zaženi-preveri-popravi, da preveri svoje delo
  5. Vrne rezultate ali prosi za pojasnilo

Primer kode: Uporaba računalnika

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use"}],
    messages=[
        {"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
    ]
)

Kaj uporaba računalnika omogoča

  • Avtomatizacija brskalnika: Izpolnjevanje obrazcev, navigacija po večstopenjskih delovnih tokovih, strganje strukturiranih podatkov z dinamičnih strani
  • Upravljanje namiznih aplikacij: Odpiranje aplikacij, interakcija z nativnimi uporabniškimi vmesniki, prenos podatkov med programi
  • Testiranje delovnih tokov: Klikanje skozi UI tokove, preverjanje vizualnih stanj, izvajanje uvajalnih sekvenc
  • Vnos podatkov: Premikanje podatkov med preglednicami, sistemi CRM in notranjimi orodji

Omejitve, ki jih morate poznati

  • Zakasnitev: Vsak cikel dejanja vključuje posnetek zaslona, sklepanje modela in izvedbo dejanja. Večstopenjske naloge zahtevajo dejanski čas.
  • Potreben nadzor: Ne izvajajte uporabe računalnika brez nadzora na občutljivih sistemih. Model lahko napačno klikne, napačno interpretira elemente vmesnika ali izvede nenamerna dejanja.
  • Nastavitev okolja: Uporaba računalnika zahteva zaslonsko okolje. Za avtomatizacijo na strani strežnika potrebujete virtualni zaslon (npr. Xvfb na Linuxu ali virtualno namizje).
  • Brez dostopa do datotečnega sistema po privzetem: Uporaba računalnika deluje prek uporabniškega vmesnika, ne prek neposrednih klicov datotečnega sistema. Za hibridne delovne tokove jo povežite z orodji za izvajanje kode.

Programiranje z GPT-5.4

GPT-5.4 deduje in izboljšuje zmožnosti programiranja modela GPT-5.3 Codex. Rezultati meril uspešnosti povedo svojo zgodbo:

Merilo uspešnostiRezultat GPT-5.4Kaj testira
SWE-Bench Pro57.7%Reševanje dejanskih težav na GitHub
SWE-Bench Verified~80%Izbran nabor SWE-Bench
Terminal-Bench 2.075.1%Razvojne naloge v terminalu

Kaj je drugače kot pri GPT-5.3 Codex

  • 47% manj tokens pri kompleksnih nalogah -- manj gostobeseden izhod, bolj strnjena koda
  • Spremembe v več datotekah z manj ponovitvami -- boljše razumevanje odvisnosti med datotekami
  • Upošteva vzorce, specifične za repozitorij -- prilagodi se konvencijam vaše zbirke kode, ko dobi kontekst
  • 33% manj dejanskih napak -- manj halucinacij pri API referencah, uporabi knjižnic in konfiguraciji

Nasveti za boljše generiranje kode

1. Uporabite sistemska navodila za nastavitev standardov kodiranja.

response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
        {"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
    ]
)

2. Podajte mu svojo dejansko kodo za kontekst. GPT-5.4 kontekstno okno z 1M tokens pomeni, da lahko vključite celotne module ali celo polne repozitorije. Model ustvari bistveno boljšo kodo, ko vidi obstoječe vzorce, tipe in konvencije.

3. Nastavite trud pri razmišljanju na high ali xhigh za kompleksne spremembe. Preprosti popravki hroščev delujejo dobro pri medium, vendar arhitekturni refaktorji, migracije in spremembe v več datotekah merljivo pridobijo z višjim trudom pri razmišljanju.

4. Uporabite max_completion_tokens, da preprečite predolge odgovore. Pri generiranju kode nastavite razumno omejitev, da vam ne bodo zaračunana dolga pojasnila, ki jih niste zahtevali.

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[...],
    max_completion_tokens=4096
)

Strategije za velik kontekst

Kontekstno okno z 1,050,000 tokens je tiha supermoč modela GPT-5.4. Tukaj je opisano, kako ga učinkovito uporabljati -- in se izogniti stroškovnim pastem.

Doplačilo nad 272K

Cena vnosa se podvoji, ko presežete 272K tokens v enem samem zahtevku. To pomeni, da zahtevek s 500K tokens stane približno:

  • Prvih 272K tokens: 272K x $2.50/1M = $0.68
  • Preostalih 228K tokens: 228K x $5.00/1M = $1.14
  • Skupni strošek vnosa: $1.82

Za primerjavo, isti zahtevek bi po standardni ceni stal $1.25. Doplačilo v tem primeru doda ~46% k računu.

Primer kode: Uporaba velikega konteksta

from openai import OpenAI
client = OpenAI()

# Load entire codebase into context
with open("codebase_dump.txt", "r") as f:
    full_codebase_content = f.read()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": full_codebase_content},  # up to 1M tokens
        {"role": "user", "content": "Find all security vulnerabilities in this codebase"}
    ],
    max_completion_tokens=8192
)

Najboljše prakse za velike kontekste

DA:

  • Najbolj relevantne datoteke postavite na začetek. Model posveča največ pozornosti začetku in koncu konteksta. Datoteke, ki so najbolj relevantne za nalogo, postavite na prvo mesto.
  • Uporabite sistemsko sporočilo za referenčno gradivo. Svojo zbirko kode, dokumentacijo ali podatke postavite v sistemsko sporočilo. Svoja dejanska navodila pa v uporabniško sporočilo.
  • Eksplicitno nastavite max_completion_tokens. Pri 128K maksimalnem izhodu lahko neomejen odgovor na velikem kontekstu hitro postane drag.

NE:

  • Ne uporabljajte vedno celotnega okna. Če vaša naloga potrebuje le 50K tokens konteksta, ga ne polnite do 1M. Vhodne tokens plačate ne glede na to, ali jih model potrebuje ali ne.
  • Ne prezrite meje 272K. Svoja navodila strukturirajte tako, da ostanejo pod 272K, kadar je to mogoče. Če ste pri 280K, preverite, ali lahko odstranite 10K tokens manj relevantnega konteksta, da prihranite pri doplačilu.
  • Ne pričakujte popolnega priklica v 1M tokens. Zmogljivost postopoma upada z dolžino konteksta. Za največjo natančnost naj bodo najbolj kritične informacije v prvih 200K tokens.

GPT-5.4 proti GPT-5.4 Pro: Kdaj nadgraditi

GPT-5.4 Pro stane 12x več kot standardni GPT-5.4. Tukaj je opisano, kdaj je to upravičeno.

DimenzijaGPT-5.4GPT-5.4 Pro
Strošek vnosa$2.50 / 1M$30.00 / 1M
Strošek izhoda$15.00 / 1M$180.00 / 1M
Najboljše zaVečino razvojnih nalogNajvečjo natančnost pri težkih problemih
Globina razmišljanjaMočna na vseh stopnjahPrivzeto globlje notranje razmišljanje
ZakasnitevStandardnaVišja (več izračunov na zahtevek)

Uporabite standardni GPT-5.4, ko:

  • Gradite produkcijske aplikacije s predvidljivimi stroški
  • So naloge dobro opredeljene (CRUD, transformacije, standardno kodiranje)
  • Potrebujete manjšo zakasnitev za funkcije, namenjene uporabnikom
  • Obdelujete velike količine zahtevkov

Uporabite GPT-5.4 Pro, ko:

  • Je natančnost pri posameznem zahtevku pomembnejša od stroškov (pravna analiza, medicinske raziskave, varnostne revizije)
  • Se lotevate novih problemov, za katere model ni videl veliko primerov
  • Morajo biti večstopenjske verige razmišljanja brezhibne
  • Izvajate konkurenčno primerjavo ali ocenjevanje

Praktično pravilo: Privzeto uporabite standardni model. Svoje najtežje testne primere zaženite skozi oba modela. Če Pro dosledno daje boljše rezultate pri vaši specifični delovni obremenitvi, preklopite te specifične klice na Pro, vse ostalo pa obdržite na standardnem modelu.


Migracija z GPT-5.3 Codex

Če trenutno uporabljate GPT-5.3 Codex (ali GPT-5.2-Codex), so tukaj ključne razlike, ki jih morate načrtovati.

Kaj se spremeni

PodročjeGPT-5.3 CodexGPT-5.4
ID modelagpt-5.3-codexgpt-5.4
Kontekstno okno1,000,000 tokens1,050,000 tokens
Uporaba računalnikaNi na voljoNativna podpora
Trud pri razmišljanjuPodprtoPodprto (isti parameter)
Cena (vnos)Odvisna od različice$2.50 / 1M tokens
Cena (izhod)Odvisna od različice$15.00 / 1M tokens
Učinkovitost tokensIzhodišče47% manj tokens pri kompleksnih nalogah

Kontrolni seznam za migracijo

  1. Zamenjajte ID modela. Spremenite gpt-5.3-codex v gpt-5.4 v svojih API klicih.
  2. Preizkusite nastavitve truda pri razmišljanju. Obstajajo iste stopnje truda (od none do xhigh), vendar lahko GPT-5.4 pri vsaki stopnji proizvede drugačne kompromise v kakovosti. Ponovno ocenite svoje privzete vrednosti.
  3. Preglejte proračune za izhodne tokens. GPT-5.4 je bolj jedrnat (47% manj tokens pri kompleksnih nalogah). Morda boste lahko znižali max_completion_tokens in prihranili pri stroških izhoda.
  4. Ocenite uporabo računalnika. Če ste imeli zaobide za avtomatizacijo uporabniškega vmesnika (Selenium skripte, orodja po meri), jih lahko GPT-5.4 nativna uporaba računalnika nadomesti.
  5. Bodite pozorni na doplačilo nad 272K. Če so vaše Codex delovne obremenitve uporabljale velike kontekste, vendar ostale znotraj Codex cenovne strukture, ponovno izračunajte stroške s stopenjskim določanjem cen vnosa modela GPT-5.4.

Kaj ostaja enako

  • Končna točka Chat Completions API je identična
  • Vloge sporočil system/user/assistant delujejo enako
  • Pretočno predvajanje (streaming), klicanje funkcij (function calling) in uporaba orodij (tool use) so popolnoma združljivi
  • Sintaksa parametra reasoning ostaja nespremenjena

Hitri pregled meril uspešnosti

Za hitro referenco, tukaj je, kako GPT-5.4 deluje v merilih uspešnosti, ki so najpomembnejša za razvijalce:

Merilo uspešnostiRezultatKaj meri
SWE-Bench Pro57.7%Kompleksno programsko inženirstvo v realnem svetu
SWE-Bench Verified~80%Izbrano reševanje težav na GitHub
Terminal-Bench 2.075.1%Kodiranje v terminalu in sistemske naloge
OSWorld75.0%Upravljanje namiznega računalnika (človeško izhodišče: 72.4%)
GDPval83%Strokovno delo z znanjem v 44 poklicih

Dodatne metrike kakovosti:

  • 33% manj dejanskih napak v primerjavi z GPT-5.2
  • 18% manj odgovorov s kakršno koli napako na splošno

Povzetek

GPT-5.4 ni revolucionarna sprememba API-ja -- je praktična. Ista končna točka, ista oblika sporočil, isti vzorci uporabe orodij. Novo je to, da imate zdaj natančen nadzor nad izračunom razmišljanja, nativno uporabo računalnika brez orodij tretjih oseb, kontekstno okno, ki je dovolj veliko za celotne zbirke kode, in bistveno boljši izhod kode.

Tri stvari, ki jih morate storiti takoj:

  1. Namerno nastavite reasoning.effort. Ne zanašajte se na privzeto vrednost za vsak klic. Stopnjo truda prilagodite kompleksnosti naloge ter svojemu proračunu za zakasnitev in stroške.
  2. Eksperimentirajte z uporabo računalnika. Če imate kakršne koli delovne tokove za avtomatizacijo uporabniškega vmesnika, jih preizkusite z nativnimi zmožnostmi uporabe računalnika modela GPT-5.4. Morda boste lahko upokojili krhke Selenium skripte.
  3. Revidirajte svojo porabo konteksta. Z mejo doplačila pri 272K in oknom 1M lahko prihranite (ali zapravite) dejanski denar, odvisno od tega, kako strukturirate svoja navodila.

Model je zdaj na voljo na gpt-5.4 za račune API stopnje Tier 1+. Začnite graditi.

Nazaj na vse novice
Vam je bil članek všeč?

Gradite z NxCode

Spremenite svojo idejo v delujučo aplikacijo — brez programiranja.

46.000+ razvijalcev je ta mesec gradilo z NxCode

Poskusite sami

Opišite, kaj želite — NxCode to zgradi za vas.

46.000+ razvijalcev je ta mesec gradilo z NxCode