Peamised järeldused
- Viis reasoning effort taset: Parameeter
reasoning.effort(none,low,medium,high,xhigh) kontrollib kulu ja kvaliteedi suhet päringu kohta --nonekäitub nagu mitte-mõtlev mudel (kiireim/odavaim), samas kuixhighpakub maksimaalset sügavust 3-5x suurema kulu juures. - Natiivne computer use API kaudu: GPT-5.4 suudab juhtida töölauarakendusi, klõpsata nuppe ja navigeerida kasutajaliidestes autonoomselt, saavutades OSWorld testis tulemuse 75% (ületades inimeksperdi 72.4% baastaseme) -- seda võimaldab
computer_usetööriista tüübi edastamine. - 1M+ token kontekst hinnaga $2.50/$15: 1,050,000-token sisendiaken võimaldab töödelda terveid koodibaase ühe päringuga, kuigi sisendi hind kahekordistub pärast 272K tokens.
- GPT-5.4 Pro maksab 12x rohkem: Jäta $30/$180 per miljon token Pro variant kriitilistele ülesannetele, kus täpsus on määrav -- enamiku töökoormuste puhul kasuta vaikimisi standardset GPT-5.4 mudelit.
GPT-5.4 API arendaja juhend: Reasoning Effort, Computer Use ja koodinäited
March 11, 2026 -- GPT-5.4 on OpenAI seni võimekaim mudel ning see sisaldab API funktsioone, mis muudavad oluliselt seda, kuidas te lahendusi ehitate. Kohandatav reasoning effort, natiivne computer use, 1M+ token kontekstiaken ja märkimisväärselt parandatud koodi genereerimine -- kõik see on saadaval läbi sama Chat Completions lõpp-punkti, mida te juba tunnete.
See juhend on mõeldud arendajatele, kes soovivad alustada GPT-5.4 API-ga ehitamist täna. Ei mingit turundusmüra. Ainult mudelite ID-d, parameetrid, koodinäited, hinnastuse arvutuskäik ja praktilised valikukohad, mida peate tegema.
Kiire algus
Mudelite ID-d
| Mudel | API ID | Parim valik |
|---|---|---|
| GPT-5.4 | gpt-5.4 | Üldotstarbelised ülesanded, programmeerimine, arutlemine, computer use |
| GPT-5.4 Pro | gpt-5.4-pro | Maksimaalne täpsus keeruliste ja kõrgete panustega ülesannete puhul |
Sinu esimene API päring
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
]
)
print(response.choices[0].message.content)
See ongi kõik. Kui olete kasutanud mõnda GPT mudelit läbi Chat Completions API, on GPT-5.4 selle otsene asendus. Erinevused seisnevad uutes parameetrites ja võimekustes.
Hinnastus
| Mudel | Sisend | Väljund | Märkused |
|---|---|---|---|
| GPT-5.4 | $2.50 / 1M tokens | $15.00 / 1M tokens | Sisendi hind kahekordistub pärast 272K tokens |
| GPT-5.4 Pro | $30.00 / 1M tokens | $180.00 / 1M tokens | 12x standardmudeli hind |
Kontekstiaken: 1,050,000 tokens sisend, 128,000 tokens maksimaalne väljund.
Juurdepääsu nõuded: Tasuline API konto vähemalt $5 suuruse eelneva kuluga (Tier 1). Ei ole saadaval tasuta paketis.
Reasoning Effort: Mõtlemise eelarve kontrollimine
Kõige olulisem uus parameeter GPT-5.4 puhul on reasoning.effort. See kontrollib, kui palju sisemist arvutusressurssi mudel eraldab mõtteahela (chain-of-thought) arutlusele enne vastuse andmist.
Viis taset
| Tase | Käitumine | Millal kasutada |
|---|---|---|
none | Mõtteahel puudub. Kiireim, odavaim. Käitub nagu mitte-mõtlev mudel. | Lihtsad teisendused, vormindamine, andmete eraldamine |
low | Minimaalne arutlus. Kiired loogikakontrollid. | Lihtsad küsimused-vastused, klassifitseerimine, kokkuvõtete tegemine |
medium | Tasakaalustatud arutlus. See on vaikimisi seade. | Üldine programmeerimine, analüüs, enamik toodangu töökoormusi |
high | Laiendatud mõtteahelad. Põhjalikum. | Keeruline silumine, arhitektuuriotsused, mitmeetapiline loogika |
xhigh | Maksimaalne arutlussügavus. Aeglaseim, kuid täpseim. | Raske matemaatika, suured refaktoreerimised, turvaauditid, teadustöö |
Koodinäide: Reasoning Effort seadistamine
from openai import OpenAI
client = OpenAI()
# High reasoning keerulise refaktoreerimise ülesande jaoks
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n results = []\n while url:\n resp = requests.get(url)\n data = resp.json()\n results.extend(data['items'])\n url = data.get('next')\n return results"}
]
)
Praktilised juhised reasoning levels kasutamiseks
Alusta tasemelt medium ja kohanda. Enamiku API töökoormuste puhul on vaikimisi seade õige valik. Siin on, kuidas sellele läheneda:
-
Latentsustundlikud teed (automaatne täitmine, vestlus, reaalajas kasutajaliidesed): Kasuta
lowvõinone. Kiiruse erinevus on märkimisväärne ning selliste ülesannete puhul nagu teksti vormindamine või lihtsad otsingud ei anna täiendav arutlus lisaväärtust. -
Pakktöötlus (koodiülevaatuse konveierid, dokumentide analüüs, andmete eraldamine): Kasuta
high. Te ei blokeeri kasutajat, seega täiendav latentsus ei oma tähtsust, ning täpsuse paranemine summeerub sadade üksuste lõikes. -
Kõrgete panustega üksikpäringud (koodibaasi turvaaudit, keeruline migratsiooni planeerimine, uue algoritmi väljatöötamine): Kasuta
xhigh. See on koht, kus 12x suurem arvutusressurss end ära tasub.
Mõju kuludele: Kõrgem reasoning effort tähendab, et genereeritakse (ja arveldatakse) rohkem sisemisi tokens. Päring tasemel xhigh võib maksta 3--5x rohkem kui sama päring tasemel low. Jälgige oma token kasutust tasemete muutmisel.
Computer Use API
GPT-5.4 on esimene üldotstarbeline mudel, millel on natiivne computer-use võimekus. OSWorld võrdlustestis saavutab see tulemuse 75% -- ületades inimeksperdi 72.4% baastaset. See ei ole lihtsalt ekraanitõmmiste ümbris. Mudel mõistab natiivselt töölaua liideseid ja suudab neid autonoomselt juhtida.
Kuidas see töötab
- Saadate juhise, mis kirjeldab soovitud tegevust.
- Mudel teeb sihtkeskkonnast ekraanitõmmiseid.
- See genereerib hiireklõpsud, klaviatuuri sisendid ja navigeerimistoimingud.
- See viib läbi build-run-verify-fix tsükli, et kontrollida oma tööd.
- See tagastab tulemused või küsib selgitusi.
Koodinäide: Computer Use
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
tools=[{"type": "computer_use"}],
messages=[
{"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
]
)
Mida Computer Use suudab teha
- Brauseri automatiseerimine: Täita vorme, navigeerida mitmeetapilistes töövoogudes, eraldada struktureeritud andmeid dünaamilistelt lehtedelt.
- Töölauarakenduste juhtimine: Avada rakendusi, suhelda natiivsete kasutajaliidestega, edastada andmeid programmide vahel.
- Testimise töövood: Läbida UI voogusid, kontrollida visuaalseid olekuid, testida uute kasutajate teekondi.
- Andmesisestus: Liigutada andmeid tabelarvutuslehtede, CRM-ide ja siseveebi tööriistade vahel.
Piirangud, mida teada
- Latentsus: Iga tegevustsükkel hõlmab ekraanitõmmist, mudeli järeldust ja tegevuse sooritamist. Mitmeetapilised ülesanded võtavad aega.
- Vajalik järelevalve: Ärge laske computer use funktsioonil töötada järelevalveta tundlikes süsteemides. Mudel võib teha valesid klõpse, tõlgendada valesti UI elemente või sooritada ettekavatsematuid tegevusi.
- Keskkonna seadistamine: Computer use vajab ekraanikeskkonda. Serveripoolseks automatiseerimiseks on vaja virtuaalset ekraani (nt Xvfb Linuxis või virtuaalne töölaud).
- Vaikimisi puudub juurdepääs failisüsteemile: Computer use töötab läbi kasutajaliidese, mitte otseste failisüsteemi poole pöördumiste kaudu. Kombineerige see koodi täitmise tööriistadega hübriidsete töövoogude jaoks.
Programmeerimine GPT-5.4-ga
GPT-5.4 pärib ja parandab GPT-5.3 Codex mudeli programmeerimisvõimekust. Võrdlustestid räägivad iseenda eest:
| Võrdlustest | GPT-5.4 tulemus | Mida see testib |
|---|---|---|
| SWE-Bench Pro | 57.7% | Reaalsete GitHubi probleemide lahendamine |
| SWE-Bench Verified | ~80% | Valitud alamhulk SWE-Bench testist |
| Terminal-Bench 2.0 | 75.1% | Terminalipõhised arendusülesanded |
Erinevused võrreldes GPT-5.3 Codex mudeliga
- 47% vähem tokens keeruliste ülesannete puhul -- vähem paljusõnaline väljund, kompaktsem kood.
- Mitme faili muudatused vähemate korduskatsetega -- parem arusaam failidevahelistest sõltuvustest.
- Järgib repositooriumipõhiseid mustreid -- kohandub teie koodibaasi tavadega, kui talle antakse piisavalt konteksti.
- 33% vähem faktivigu -- vähem hallutsinatsioone API viidetes, teekide kasutamises ja seadistustes.
Näpunäited paremaks koodi genereerimiseks
1. Kasuta system prompts koodistandardite määramiseks.
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
{"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
]
)
2. Anna talle kontekstiks oma tegelik kood. GPT-5.4 1M token kontekstiaken tähendab, et saate kaasata terveid mooduleid või isegi täielikke repositooriume. Mudel loob oluliselt paremat koodi, kui ta näeb olemasolevaid mustreid, tüüpe ja tavasid.
3. Keeruliste muudatuste puhul määra reasoning effort tasemele high või xhigh. Lihtsad veaparandused töötavad hästi tasemel medium, kuid arhitektuursed refaktoreerimised, migratsioonid ja mitme faili muudatused saavad märgatavat kasu kõrgemast reasoning effort tasemest.
4. Kasuta max_completion_tokens parameetrit liigsete vastuste vältimiseks. Koodi genereerimisel seadke mõistlik piirang, et vältida tasu maksmist pikkade selgituste eest, mida te ei palunud.
response = client.chat.completions.create(
model="gpt-5.4",
messages=[...],
max_completion_tokens=4096
)
Suure konteksti strateegiad
1,050,000-token kontekstiaken on GPT-5.4 varjatud supervõime. Siin on, kuidas seda tõhusalt kasutada ja vältida kululõkse.
272K lisatasu
Sisendi hind kahekordistub, kui ületate ühe päringuga 272K tokens piiri. See tähendab, et 500K-token päring maksab ligikaudu:
- Esimesed 272K tokens: 272K x $2.50/1M = $0.68
- Ülejäänud 228K tokens: 228K x $5.00/1M = $1.14
- Sisendi kogukulu: $1.82
Võrdluseks, sama päring standardhinnaga maksaks $1.25. Lisatasu suurendab antud juhul arvet ~46%.
Koodinäide: Suure konteksti kasutamine
from openai import OpenAI
client = OpenAI()
# Kogu koodibaasi laadimine konteksti
with open("codebase_dump.txt", "r") as f:
full_codebase_content = f.read()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": full_codebase_content}, # kuni 1M tokens
{"role": "user", "content": "Find all security vulnerabilities in this codebase"}
],
max_completion_tokens=8192
)
Parimad tavad suurte kontekstide puhul
Tee seda:
- Paiguta kõige asjakohasemad failid ettepoole. Mudel pöörab kõige rohkem tähelepanu konteksti algusele ja lõpule. Pane ülesande jaoks kõige olulisemad failid esimesena.
- Kasuta system message viitematerjali jaoks. Pane oma koodibaas, dokumentatsioon või andmed süsteemisõnumisse (system message). Pane oma tegelikud juhised kasutajasõnumisse (user message).
- Määra
max_completion_tokensselgesõnaliselt. 128K maksimaalse väljundi juures võib piiramatu vastus suure konteksti puhul kiiresti kulukaks muutuda.
Ära tee seda:
- Ära kasuta alati täielikku akent. Kui teie ülesanne vajab vaid 50K tokens konteksti, ärge täitke seda 1M-ni. Te maksate sisendi tokens eest sõltumata sellest, kas mudel neid vajab või mitte.
- Ära ignoreeri 272K piiri. Struktureerige oma juhised nii, et need jääksid võimalusel alla 272K. Kui olete 280K juures, vaadake, kas saate eemaldada 10K tokens vähem asjakohast konteksti, et säästa lisatasult.
- Ära oota täiuslikku meenutamist 1M tokens ulatuses. Sooritus langeb järk-järgult koos konteksti pikkusega. Kõrgeima täpsuse tagamiseks hoidke kõige kriitilisem teave esimese 200K tokens piires.
GPT-5.4 vs GPT-5.4 Pro: Millal üle minna
GPT-5.4 Pro maksab 12x rohkem kui standardne GPT-5.4. Siin on juhud, mil see on õigustatud.
| Dimensioon | GPT-5.4 | GPT-5.4 Pro |
|---|---|---|
| Sisendi kulu | $2.50 / 1M | $30.00 / 1M |
| Väljundi kulu | $15.00 / 1M | $180.00 / 1M |
| Parim valik | Enamik arendusülesandeid | Maksimaalne täpsus rasketes küsimustes |
| Arutlussügavus | Tugev kõikidel tasemetel | Vaikimisi sügavam sisemine arutlus |
| Latentsus | Standardne | Kõrgem (rohkem arvutusressurssi päringu kohta) |
Kasuta standardset GPT-5.4 mudelit, kui:
- Ehitate toodangurakendusi ennustatavate kuludega.
- Ülesanded on hästi määratletud (CRUD, teisendused, tavaline programmeerimine).
- Vajate kasutajatele suunatud funktsioonide puhul madalamat latentsust.
- Töötlete suuri päringumahtusid.
Kasuta GPT-5.4 Pro mudelit, kui:
- Täpsus ühel päringul on olulisem kui kulu (õigusanalüüs, meditsiinilised uuringud, turvaauditid).
- Tegelete uudsete probleemidega, millest mudel pole palju näiteid näinud.
- Mitmeetapilised arutlusahelad peavad olema lünkadeta.
- Tegelete konkurentsipõhise võrdlemise või hindamisega.
Praktiline reegel: Kasuta vaikimisi standardmudelit. Käivita oma raskeimad testjuhtumid mõlema mudeliga. Kui Pro annab teie konkreetse töökoormuse puhul järjepidevalt paremaid tulemusi, suunake need konkreetsed päringud Pro-le ja jätke kõik muu standardmudelile.
Migreerumine GPT-5.3 Codex mudelilt
Kui kasutate praegu GPT-5.3 Codex (või GPT-5.2-Codex) mudelit, siis siin on peamised erinevused, millega arvestada.
Mis muutub
| Valdkond | GPT-5.3 Codex | GPT-5.4 |
|---|---|---|
| Mudeli ID | gpt-5.3-codex | gpt-5.4 |
| Kontekstiaken | 1,000,000 tokens | 1,050,000 tokens |
| Computer use | Pole saadaval | Natiivne toetus |
| Reasoning effort | Toetatud | Toetatud (sama parameeter) |
| Hinnastus (sisend) | Varieerub variandi põhjal | $2.50 / 1M tokens |
| Hinnastus (väljund) | Varieerub variandi põhjal | $15.00 / 1M tokens |
| Tokenitõhusus | Baastase | 47% vähem tokens keeruliste ülesannete puhul |
Migratsiooni kontrollnimekiri
- Vaheta mudeli ID. Muuda
gpt-5.3-codexväärtuseksgpt-5.4oma API kutsetes. - Testi oma reasoning effort seadeid. Samad tasemed on olemas (
nonekunixhigh), kuid GPT-5.4 võib pakkuda igal tasemel teistsuguseid kvaliteedi ja kulu suhteid. Hinda oma vaikeseaded uuesti üle. - Vaata üle väljundi tokenite eelarved. GPT-5.4 on lakoonilisem (47% vähem tokens keeruliste ülesannete puhul). Võimalik, et saate vähendada
max_completion_tokensväärtust ja säästa väljundi kuludelt. - Hinda computer use võimekust. Kui teil olid asenduslahendused UI automatiseerimiseks (Selenium skriptid, kohandatud tööriistad), võib GPT-5.4 natiivne computer use need asendada.
- Jälgi 272K lisatasu. Kui teie Codexi töökoormused kasutasid suuri kontekste, kuid jäid Codexi hinnastruktuuri piiresse, arvutage kulud ümber GPT-5.4 astmelise sisendi hinnastusega.
Mis jääb samaks
- Chat Completions API lõpp-punkt on identne.
- System/user/assistant sõnumite rollid töötavad samamoodi.
- Voogedastus (streaming), funktsioonide kutsumine (function calling) ja tööriistade kasutamine on kõik ühilduvad.
reasoningparameetri süntaks on muutmata.
Võrdlustestid lühidalt
Kiireks ülevaateks on siin GPT-5.4 tulemused arendajate jaoks olulisemates võrdlustestides:
| Võrdlustest | Tulemus | Mida see mõõdab |
|---|---|---|
| SWE-Bench Pro | 57.7% | Keeruline reaalne tarkvaratehnika |
| SWE-Bench Verified | ~80% | Valitud GitHubi probleemide lahendamine |
| Terminal-Bench 2.0 | 75.1% | Terminalipõhised programmeerimis- ja süsteemiülesanded |
| OSWorld | 75.0% | Lauaarvuti juhtimine (inimeste baastase: 72.4%) |
| GDPval | 83% | Professionaalne teadmustöö 44 ametiala lõikes |
Täiendavad kvaliteedinäitajad:
- 33% vähem faktivigu võrreldes mudeliga GPT-5.2.
- 18% vähem vigadega vastuseid üldiselt.
Kokkuvõte
GPT-5.4 ei ole revolutsiooniline muudatus API-s -- see on praktiline muudatus. Sama lõpp-punkt, sama sõnumivorming, samad tööriistade kasutamise mustrid. Uus on see, et teil on nüüd peenhäälestatud kontroll arutlusvõimekuse üle, natiivne computer-use ilma kolmanda osapoole tööriistadeta, piisavalt suur kontekstiaken tervete koodibaaside jaoks ja märkimisväärselt parem koodiväljund.
Kolm asja, mida kohe teha:
- Määra
reasoning.effortteadlikult. Ära looda igas päringus vaikimisi seadele. Vali tase vastavalt ülesande keerukusele ning oma latentsuse ja kulu eelarvele. - Eksperimenteeri computer use funktsiooniga. Kui teil on UI automatiseerimise töövooge, testige neid GPT-5.4 natiivse computer-use võimekusega. Võimalik, et saate loobuda rabelevatest Selenium skriptidest.
- Auditige oma konteksti kasutust. Arvestades 272K lisatasu piiri ja 1M akent, on võimalik säästa (või raisata) päris raha sõltuvalt sellest, kuidas te oma juhiseid struktureerite.
Mudel on nüüd saadaval ID-ga gpt-5.4 Tier 1+ API kontodele. Alustage ehitamist.