Ključne ugotovitve
- Pet stopenj truda pri razmišljanju: Parameter
reasoning.effort(none, low, medium, high, xhigh) nadzoruje razmerje med stroški in kakovostjo na zahtevek --nonese obnaša kot model brez razmišljanja (najhitrejši/najcenejši), medtem koxhighzagotavlja največjo globino pri 3-5x višjih stroških. - Nativna uporaba računalnika prek API: GPT-5.4 lahko upravlja namizne aplikacije, klika gumbe in avtonomno krmari po uporabniških vmesnikih, pri čemer dosega 75% na OSWorld (kar presega 72.4% izhodišče človeških strokovnjakov) -- to omogočite s podajanjem vrste orodja
computer_use. - Kontekst z več kot 1M tokens za $2.50/$15: Vhodno okno z 1,050,000 tokens omogoča obdelavo celotnih zbirk kode v enem samem zahtevku, čeprav se cena vnosa podvoji nad 272K tokens.
- GPT-5.4 Pro stane 12x več: Različico Pro s ceno $30/$180 na milijon tokens rezervirajte za kritična opravila, kjer je natančnost bistvena -- za večino delovnih obremenitev uporabite standardni GPT-5.4.
GPT-5.4 API vodnik za razvijalce: Trud pri razmišljanju, uporaba računalnika in primeri kode
March 11, 2026 -- GPT-5.4 je doslej najzmogljivejši model podjetja OpenAI in prihaja z API funkcijami, ki bistveno spreminjajo način, kako gradite z njim. Nastavljiv trud pri razmišljanju, nativna uporaba računalnika, kontekstno okno z več kot 1M tokens in znatno izboljšano generiranje kode -- vse prek iste končne točke Chat Completions, ki jo že poznate.
Ta vodnik je namenjen razvijalcem, ki želijo danes začeti graditi z GPT-5.4 API. Brez marketinškega olepševanja. Samo ID-ji modelov, parametri, primeri kode, izračun cen in praktični kompromisi, ki jih morate sprejeti.
Hitri začetek
ID-ji modelov
| Model | API ID | Najboljše za |
|---|---|---|
| GPT-5.4 | gpt-5.4 | Splošna opravila, programiranje, razmišljanje, uporaba računalnika |
| GPT-5.4 Pro | gpt-5.4-pro | Največja natančnost pri kompleksnih, kritičnih opravilih |
Vaš prvi API klic
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
]
)
print(response.choices[0].message.content)
To je vse. Če ste uporabili kateri koli GPT model prek Chat Completions API, je GPT-5.4 neposredna zamenjava. Razlike so v novih parametrih in zmožnostih.
Cene
| Model | Vnos | Izhod | Opombe |
|---|---|---|---|
| GPT-5.4 | $2.50 / 1M tokens | $15.00 / 1M tokens | Vnos se podvoji nad 272K tokens |
| GPT-5.4 Pro | $30.00 / 1M tokens | $180.00 / 1M tokens | 12x strošek standardnega modela |
Kontekstno okno: 1,050,000 tokens vnos, 128,000 tokens maksimalni izhod.
Zahteve za dostop: Plačljiv API račun z najmanj $5 predhodne porabe (Tier 1). Ni na voljo v brezplačnem paketu.
Trud pri razmišljanju: Nadzor proračuna za razmišljanje
Najpomembnejši novi parameter v GPT-5.4 je reasoning.effort. Nadzoruje, koliko notranje računske moči model dodeli razmišljanju v verigi misli, preden poda odgovor.
Pet stopenj
| Stopnja | Obnašanje | Kdaj uporabiti |
|---|---|---|
none | Brez verige misli. Najhitreje, najceneje. Obnaša se kot model brez razmišljanja. | Preproste transformacije, oblikovanje, ekstrakcija |
low | Minimalno razmišljanje. Hitre preverbe razumnosti. | Preprosta vprašanja in odgovori, klasifikacija, povzemanje |
medium | Uravnoteženo razmišljanje. To je privzeta nastavitev. | Splošno programiranje, analiza, večina produkcijskih delovnih obremenitev |
high | Razširjene verige razmišljanja. Bolj temeljito. | Kompleksno iskanje napak, arhitekturne odločitve, večstopenjska logika |
xhigh | Največja globina razmišljanja. Najpočasneje, a najnatančneje. | Težka matematika, obsežni refaktorji, varnostne revizije, raziskave |
Primer kode: Nastavitev truda pri razmišljanju
from openai import OpenAI
client = OpenAI()
# High reasoning for a complex refactoring task
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n results = []\n while url:\n resp = requests.get(url)\n data = resp.json()\n results.extend(data['items'])\n url = data.get('next')\n return results"}
]
)
Praktični napotki glede stopenj razmišljanja
Začnite pri medium in prilagodite. Za večino API delovnih obremenitev je privzeta nastavitev prava izbira. Tukaj je način razmišljanja:
-
Poti, občutljive na zakasnitev (samodejno dokončanje, klepet, vmesniki v realnem času): Uporabite
lowalinone. Razlika v hitrosti je precejšnja, pri nalogah, kot sta oblikovanje besedila ali preprosta iskanja, pa dodatno razmišljanje ne doda nobene vrednosti. -
Paketna obdelava (cevovodi za pregled kode, analiza dokumentov, ekstrakcija podatkov): Uporabite
high. Ne blokirate uporabnika, zato dodatna zakasnitev ni pomembna, izboljšave natančnosti pa se kopičijo skozi na stotine postavk. -
Kritični posamezni zahtevki (varnostna revizija zbirke kode, načrtovanje kompleksne migracije, snovanje novih algoritmov): Uporabite
xhigh. Tukaj se 12x večja računska moč povrne sama.
Vpliv na stroške: Večji trud pri razmišljanju pomeni, da se ustvari (in zaračuna) več notranjih tokens. Zahtevek pri xhigh lahko stane 3–5x več kot isti zahtevek pri low. Spremljajte porabo tokens, ko spreminjate stopnje.
Computer Use API
GPT-5.4 je prvi splošni model z nativnimi zmožnostmi uporabe računalnika. Na merilu OSWorld dosega 75% -- kar presega izhodišče človeških strokovnjakov, ki znaša 72.4%. To ni le ovitek okoli posnetkov zaslona. Model nativno razume namizne vmesnike in jih lahko upravlja avtonomno.
Kako deluje
- Pošljete navodilo, ki opisuje, kaj želite storiti
- Model naredi posnetke zaslona ciljnega okolja
- Generira klike z miško, vnose s tipkovnico in dejanja navigacije
- Izvede zanko zgradi-zaženi-preveri-popravi, da preveri svoje delo
- Vrne rezultate ali prosi za pojasnilo
Primer kode: Uporaba računalnika
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
tools=[{"type": "computer_use"}],
messages=[
{"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
]
)
Kaj uporaba računalnika omogoča
- Avtomatizacija brskalnika: Izpolnjevanje obrazcev, navigacija po večstopenjskih delovnih tokovih, strganje strukturiranih podatkov z dinamičnih strani
- Upravljanje namiznih aplikacij: Odpiranje aplikacij, interakcija z nativnimi uporabniškimi vmesniki, prenos podatkov med programi
- Testiranje delovnih tokov: Klikanje skozi UI tokove, preverjanje vizualnih stanj, izvajanje uvajalnih sekvenc
- Vnos podatkov: Premikanje podatkov med preglednicami, sistemi CRM in notranjimi orodji
Omejitve, ki jih morate poznati
- Zakasnitev: Vsak cikel dejanja vključuje posnetek zaslona, sklepanje modela in izvedbo dejanja. Večstopenjske naloge zahtevajo dejanski čas.
- Potreben nadzor: Ne izvajajte uporabe računalnika brez nadzora na občutljivih sistemih. Model lahko napačno klikne, napačno interpretira elemente vmesnika ali izvede nenamerna dejanja.
- Nastavitev okolja: Uporaba računalnika zahteva zaslonsko okolje. Za avtomatizacijo na strani strežnika potrebujete virtualni zaslon (npr. Xvfb na Linuxu ali virtualno namizje).
- Brez dostopa do datotečnega sistema po privzetem: Uporaba računalnika deluje prek uporabniškega vmesnika, ne prek neposrednih klicov datotečnega sistema. Za hibridne delovne tokove jo povežite z orodji za izvajanje kode.
Programiranje z GPT-5.4
GPT-5.4 deduje in izboljšuje zmožnosti programiranja modela GPT-5.3 Codex. Rezultati meril uspešnosti povedo svojo zgodbo:
| Merilo uspešnosti | Rezultat GPT-5.4 | Kaj testira |
|---|---|---|
| SWE-Bench Pro | 57.7% | Reševanje dejanskih težav na GitHub |
| SWE-Bench Verified | ~80% | Izbran nabor SWE-Bench |
| Terminal-Bench 2.0 | 75.1% | Razvojne naloge v terminalu |
Kaj je drugače kot pri GPT-5.3 Codex
- 47% manj tokens pri kompleksnih nalogah -- manj gostobeseden izhod, bolj strnjena koda
- Spremembe v več datotekah z manj ponovitvami -- boljše razumevanje odvisnosti med datotekami
- Upošteva vzorce, specifične za repozitorij -- prilagodi se konvencijam vaše zbirke kode, ko dobi kontekst
- 33% manj dejanskih napak -- manj halucinacij pri API referencah, uporabi knjižnic in konfiguraciji
Nasveti za boljše generiranje kode
1. Uporabite sistemska navodila za nastavitev standardov kodiranja.
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
{"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
]
)
2. Podajte mu svojo dejansko kodo za kontekst. GPT-5.4 kontekstno okno z 1M tokens pomeni, da lahko vključite celotne module ali celo polne repozitorije. Model ustvari bistveno boljšo kodo, ko vidi obstoječe vzorce, tipe in konvencije.
3. Nastavite trud pri razmišljanju na high ali xhigh za kompleksne spremembe. Preprosti popravki hroščev delujejo dobro pri medium, vendar arhitekturni refaktorji, migracije in spremembe v več datotekah merljivo pridobijo z višjim trudom pri razmišljanju.
4. Uporabite max_completion_tokens, da preprečite predolge odgovore. Pri generiranju kode nastavite razumno omejitev, da vam ne bodo zaračunana dolga pojasnila, ki jih niste zahtevali.
response = client.chat.completions.create(
model="gpt-5.4",
messages=[...],
max_completion_tokens=4096
)
Strategije za velik kontekst
Kontekstno okno z 1,050,000 tokens je tiha supermoč modela GPT-5.4. Tukaj je opisano, kako ga učinkovito uporabljati -- in se izogniti stroškovnim pastem.
Doplačilo nad 272K
Cena vnosa se podvoji, ko presežete 272K tokens v enem samem zahtevku. To pomeni, da zahtevek s 500K tokens stane približno:
- Prvih 272K tokens: 272K x $2.50/1M = $0.68
- Preostalih 228K tokens: 228K x $5.00/1M = $1.14
- Skupni strošek vnosa: $1.82
Za primerjavo, isti zahtevek bi po standardni ceni stal $1.25. Doplačilo v tem primeru doda ~46% k računu.
Primer kode: Uporaba velikega konteksta
from openai import OpenAI
client = OpenAI()
# Load entire codebase into context
with open("codebase_dump.txt", "r") as f:
full_codebase_content = f.read()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": full_codebase_content}, # up to 1M tokens
{"role": "user", "content": "Find all security vulnerabilities in this codebase"}
],
max_completion_tokens=8192
)
Najboljše prakse za velike kontekste
DA:
- Najbolj relevantne datoteke postavite na začetek. Model posveča največ pozornosti začetku in koncu konteksta. Datoteke, ki so najbolj relevantne za nalogo, postavite na prvo mesto.
- Uporabite sistemsko sporočilo za referenčno gradivo. Svojo zbirko kode, dokumentacijo ali podatke postavite v sistemsko sporočilo. Svoja dejanska navodila pa v uporabniško sporočilo.
- Eksplicitno nastavite
max_completion_tokens. Pri 128K maksimalnem izhodu lahko neomejen odgovor na velikem kontekstu hitro postane drag.
NE:
- Ne uporabljajte vedno celotnega okna. Če vaša naloga potrebuje le 50K tokens konteksta, ga ne polnite do 1M. Vhodne tokens plačate ne glede na to, ali jih model potrebuje ali ne.
- Ne prezrite meje 272K. Svoja navodila strukturirajte tako, da ostanejo pod 272K, kadar je to mogoče. Če ste pri 280K, preverite, ali lahko odstranite 10K tokens manj relevantnega konteksta, da prihranite pri doplačilu.
- Ne pričakujte popolnega priklica v 1M tokens. Zmogljivost postopoma upada z dolžino konteksta. Za največjo natančnost naj bodo najbolj kritične informacije v prvih 200K tokens.
GPT-5.4 proti GPT-5.4 Pro: Kdaj nadgraditi
GPT-5.4 Pro stane 12x več kot standardni GPT-5.4. Tukaj je opisano, kdaj je to upravičeno.
| Dimenzija | GPT-5.4 | GPT-5.4 Pro |
|---|---|---|
| Strošek vnosa | $2.50 / 1M | $30.00 / 1M |
| Strošek izhoda | $15.00 / 1M | $180.00 / 1M |
| Najboljše za | Večino razvojnih nalog | Največjo natančnost pri težkih problemih |
| Globina razmišljanja | Močna na vseh stopnjah | Privzeto globlje notranje razmišljanje |
| Zakasnitev | Standardna | Višja (več izračunov na zahtevek) |
Uporabite standardni GPT-5.4, ko:
- Gradite produkcijske aplikacije s predvidljivimi stroški
- So naloge dobro opredeljene (CRUD, transformacije, standardno kodiranje)
- Potrebujete manjšo zakasnitev za funkcije, namenjene uporabnikom
- Obdelujete velike količine zahtevkov
Uporabite GPT-5.4 Pro, ko:
- Je natančnost pri posameznem zahtevku pomembnejša od stroškov (pravna analiza, medicinske raziskave, varnostne revizije)
- Se lotevate novih problemov, za katere model ni videl veliko primerov
- Morajo biti večstopenjske verige razmišljanja brezhibne
- Izvajate konkurenčno primerjavo ali ocenjevanje
Praktično pravilo: Privzeto uporabite standardni model. Svoje najtežje testne primere zaženite skozi oba modela. Če Pro dosledno daje boljše rezultate pri vaši specifični delovni obremenitvi, preklopite te specifične klice na Pro, vse ostalo pa obdržite na standardnem modelu.
Migracija z GPT-5.3 Codex
Če trenutno uporabljate GPT-5.3 Codex (ali GPT-5.2-Codex), so tukaj ključne razlike, ki jih morate načrtovati.
Kaj se spremeni
| Področje | GPT-5.3 Codex | GPT-5.4 |
|---|---|---|
| ID modela | gpt-5.3-codex | gpt-5.4 |
| Kontekstno okno | 1,000,000 tokens | 1,050,000 tokens |
| Uporaba računalnika | Ni na voljo | Nativna podpora |
| Trud pri razmišljanju | Podprto | Podprto (isti parameter) |
| Cena (vnos) | Odvisna od različice | $2.50 / 1M tokens |
| Cena (izhod) | Odvisna od različice | $15.00 / 1M tokens |
| Učinkovitost tokens | Izhodišče | 47% manj tokens pri kompleksnih nalogah |
Kontrolni seznam za migracijo
- Zamenjajte ID modela. Spremenite
gpt-5.3-codexvgpt-5.4v svojih API klicih. - Preizkusite nastavitve truda pri razmišljanju. Obstajajo iste stopnje truda (od
nonedoxhigh), vendar lahko GPT-5.4 pri vsaki stopnji proizvede drugačne kompromise v kakovosti. Ponovno ocenite svoje privzete vrednosti. - Preglejte proračune za izhodne tokens. GPT-5.4 je bolj jedrnat (47% manj tokens pri kompleksnih nalogah). Morda boste lahko znižali
max_completion_tokensin prihranili pri stroških izhoda. - Ocenite uporabo računalnika. Če ste imeli zaobide za avtomatizacijo uporabniškega vmesnika (Selenium skripte, orodja po meri), jih lahko GPT-5.4 nativna uporaba računalnika nadomesti.
- Bodite pozorni na doplačilo nad 272K. Če so vaše Codex delovne obremenitve uporabljale velike kontekste, vendar ostale znotraj Codex cenovne strukture, ponovno izračunajte stroške s stopenjskim določanjem cen vnosa modela GPT-5.4.
Kaj ostaja enako
- Končna točka Chat Completions API je identična
- Vloge sporočil system/user/assistant delujejo enako
- Pretočno predvajanje (streaming), klicanje funkcij (function calling) in uporaba orodij (tool use) so popolnoma združljivi
- Sintaksa parametra
reasoningostaja nespremenjena
Hitri pregled meril uspešnosti
Za hitro referenco, tukaj je, kako GPT-5.4 deluje v merilih uspešnosti, ki so najpomembnejša za razvijalce:
| Merilo uspešnosti | Rezultat | Kaj meri |
|---|---|---|
| SWE-Bench Pro | 57.7% | Kompleksno programsko inženirstvo v realnem svetu |
| SWE-Bench Verified | ~80% | Izbrano reševanje težav na GitHub |
| Terminal-Bench 2.0 | 75.1% | Kodiranje v terminalu in sistemske naloge |
| OSWorld | 75.0% | Upravljanje namiznega računalnika (človeško izhodišče: 72.4%) |
| GDPval | 83% | Strokovno delo z znanjem v 44 poklicih |
Dodatne metrike kakovosti:
- 33% manj dejanskih napak v primerjavi z GPT-5.2
- 18% manj odgovorov s kakršno koli napako na splošno
Povzetek
GPT-5.4 ni revolucionarna sprememba API-ja -- je praktična. Ista končna točka, ista oblika sporočil, isti vzorci uporabe orodij. Novo je to, da imate zdaj natančen nadzor nad izračunom razmišljanja, nativno uporabo računalnika brez orodij tretjih oseb, kontekstno okno, ki je dovolj veliko za celotne zbirke kode, in bistveno boljši izhod kode.
Tri stvari, ki jih morate storiti takoj:
- Namerno nastavite
reasoning.effort. Ne zanašajte se na privzeto vrednost za vsak klic. Stopnjo truda prilagodite kompleksnosti naloge ter svojemu proračunu za zakasnitev in stroške. - Eksperimentirajte z uporabo računalnika. Če imate kakršne koli delovne tokove za avtomatizacijo uporabniškega vmesnika, jih preizkusite z nativnimi zmožnostmi uporabe računalnika modela GPT-5.4. Morda boste lahko upokojili krhke Selenium skripte.
- Revidirajte svojo porabo konteksta. Z mejo doplačila pri 272K in oknom 1M lahko prihranite (ali zapravite) dejanski denar, odvisno od tega, kako strukturirate svoja navodila.
Model je zdaj na voljo na gpt-5.4 za račune API stopnje Tier 1+. Začnite graditi.