Millist model ID-d peaksin GPT-5.4 jaoks API-s kasutama?

Kasutage standardse mudeli jaoks 'gpt-5.4' kui model ID. Maksimaalse jõudluse saavutamiseks keeruliste ülesannete puhul kasutage 'gpt-5.4-pro'. Mõlemad on saadaval standardse OpenAI Chat Completions API endpoint kaudu.

Kuidas toimib reasoning effort parameeter GPT-5.4-s?

Parameeter reasoning.effort määrab, kui palju sisemist compute-ressurssi GPT-5.4 chain-of-thought reasoning jaoks kasutab. See toetab viit taset: none, low, medium, high ja xhigh. Vaikeväärtus on medium. Valides none, käitub mudel kui non-thinking model (kiireim ja odavaim), samas kui xhigh pakub maksimaalset reasoning depth keeruliste probleemide lahendamiseks.

Kui palju maksab GPT-5.4 API?

GPT-5.4 maksab $2.50 1M input tokens kohta ja $15 1M output tokens kohta. GPT-5.4 Pro maksab $30 1M input tokens kohta ja $180 1M output tokens kohta. Input pricing duubeldub, kui ületate 272K tokens ühes päringus.

Kui suur on GPT-5.4 context window?

GPT-5.4 toetab 1,050,000-token context window-t kuni 128K tokens output mahuga. See on piisavalt suur, et töödelda terveid codebases ühes päringus. Pidage meeles, et input pricing duubeldub üle 272K tokens.

Kas GPT-5.4 suudab API kaudu arvutit juhtida?

Jah. GPT-5.4 on esimene general-purpose model, millel on sisseehitatud computer-use võimekused. Saate selle aktiveerida, lisades computer_use tool type tools array-sse. Mudel saab seejärel juhtida desktop apps, klikkida nuppudele, täita vorme ja navigeerida autonoomselt läbi UIs. See saavutab OSWorld testis 75%, mis on kõrgem kui human expert baseline (72.4%).

Millised on nõuded GPT-5.4 API-le juurdepääsuks?

Teil on vaja tasulist OpenAI API kontot, millel on vähemalt $5 eelnevaid kulutusi (Tier 1 access). GPT-5.4 ei ole saadaval free API tier-is. ChatGPT kasutajatele on vajalik Plus ($20/month), Team ($25/month) või Pro ($200/month) tellimus.

Kas peaksin kasutama GPT-5.4 või GPT-5.4 Pro mudelit?

Kasutage standardset GPT-5.4 enamiku ülesannete jaoks — see saab hästi hakkama coding, analysis ja reasoning tegevustega hinnaga $2.50/$15 miljoni tokens kohta. Reserveerige GPT-5.4 Pro ($30/$180 miljoni tokens kohta) ülesanneteks, kus täpsus on kriitiline ja kulud on sekundaarsed, nagu näiteks keeruline multi-step reasoning, high-stakes code reviews või nüansirohke uurimistöö. Pro maksab 12x rohkem, seega kasutage standardit kui default ja uuendage ainult siis, kui näete erinevusi kvaliteedis.

Peamised järeldused

Viis reasoning effort taset: Parameeter reasoning.effort (none, low, medium, high, xhigh) kontrollib kulu ja kvaliteedi suhet päringu kohta -- none käitub nagu mitte-mõtlev mudel (kiireim/odavaim), samas kui xhigh pakub maksimaalset sügavust 3-5x suurema kulu juures.
Natiivne computer use API kaudu: GPT-5.4 suudab juhtida töölauarakendusi, klõpsata nuppe ja navigeerida kasutajaliidestes autonoomselt, saavutades OSWorld testis tulemuse 75% (ületades inimeksperdi 72.4% baastaseme) -- seda võimaldab computer_use tööriista tüübi edastamine.
1M+ token kontekst hinnaga $2.50/$15: 1,050,000-token sisendiaken võimaldab töödelda terveid koodibaase ühe päringuga, kuigi sisendi hind kahekordistub pärast 272K tokens.
GPT-5.4 Pro maksab 12x rohkem: Jäta $30/$180 per miljon token Pro variant kriitilistele ülesannetele, kus täpsus on määrav -- enamiku töökoormuste puhul kasuta vaikimisi standardset GPT-5.4 mudelit.

GPT-5.4 API arendaja juhend: Reasoning Effort, Computer Use ja koodinäited

March 11, 2026 -- GPT-5.4 on OpenAI seni võimekaim mudel ning see sisaldab API funktsioone, mis muudavad oluliselt seda, kuidas te lahendusi ehitate. Kohandatav reasoning effort, natiivne computer use, 1M+ token kontekstiaken ja märkimisväärselt parandatud koodi genereerimine -- kõik see on saadaval läbi sama Chat Completions lõpp-punkti, mida te juba tunnete.

See juhend on mõeldud arendajatele, kes soovivad alustada GPT-5.4 API-ga ehitamist täna. Ei mingit turundusmüra. Ainult mudelite ID-d, parameetrid, koodinäited, hinnastuse arvutuskäik ja praktilised valikukohad, mida peate tegema.

Kiire algus

Mudelite ID-d

Mudel	API ID	Parim valik
GPT-5.4	`gpt-5.4`	Üldotstarbelised ülesanded, programmeerimine, arutlemine, computer use
GPT-5.4 Pro	`gpt-5.4-pro`	Maksimaalne täpsus keeruliste ja kõrgete panustega ülesannete puhul

Sinu esimene API päring

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
    ]
)

print(response.choices[0].message.content)

See ongi kõik. Kui olete kasutanud mõnda GPT mudelit läbi Chat Completions API, on GPT-5.4 selle otsene asendus. Erinevused seisnevad uutes parameetrites ja võimekustes.

Hinnastus

Mudel	Sisend	Väljund	Märkused
GPT-5.4	$2.50 / 1M tokens	$15.00 / 1M tokens	Sisendi hind kahekordistub pärast 272K tokens
GPT-5.4 Pro	$30.00 / 1M tokens	$180.00 / 1M tokens	12x standardmudeli hind

Kontekstiaken: 1,050,000 tokens sisend, 128,000 tokens maksimaalne väljund.

Juurdepääsu nõuded: Tasuline API konto vähemalt $5 suuruse eelneva kuluga (Tier 1). Ei ole saadaval tasuta paketis.

Reasoning Effort: Mõtlemise eelarve kontrollimine

Kõige olulisem uus parameeter GPT-5.4 puhul on reasoning.effort. See kontrollib, kui palju sisemist arvutusressurssi mudel eraldab mõtteahela (chain-of-thought) arutlusele enne vastuse andmist.

Viis taset

Tase	Käitumine	Millal kasutada
`none`	Mõtteahel puudub. Kiireim, odavaim. Käitub nagu mitte-mõtlev mudel.	Lihtsad teisendused, vormindamine, andmete eraldamine
`low`	Minimaalne arutlus. Kiired loogikakontrollid.	Lihtsad küsimused-vastused, klassifitseerimine, kokkuvõtete tegemine
`medium`	Tasakaalustatud arutlus. See on vaikimisi seade.	Üldine programmeerimine, analüüs, enamik toodangu töökoormusi
`high`	Laiendatud mõtteahelad. Põhjalikum.	Keeruline silumine, arhitektuuriotsused, mitmeetapiline loogika
`xhigh`	Maksimaalne arutlussügavus. Aeglaseim, kuid täpseim.	Raske matemaatika, suured refaktoreerimised, turvaauditid, teadustöö

Koodinäide: Reasoning Effort seadistamine

from openai import OpenAI
client = OpenAI()

# High reasoning keerulise refaktoreerimise ülesande jaoks
response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n    results = []\n    while url:\n        resp = requests.get(url)\n        data = resp.json()\n        results.extend(data['items'])\n        url = data.get('next')\n    return results"}
    ]
)

Praktilised juhised reasoning levels kasutamiseks

Alusta tasemelt medium ja kohanda. Enamiku API töökoormuste puhul on vaikimisi seade õige valik. Siin on, kuidas sellele läheneda:

Latentsustundlikud teed (automaatne täitmine, vestlus, reaalajas kasutajaliidesed): Kasuta low või none. Kiiruse erinevus on märkimisväärne ning selliste ülesannete puhul nagu teksti vormindamine või lihtsad otsingud ei anna täiendav arutlus lisaväärtust.
Pakktöötlus (koodiülevaatuse konveierid, dokumentide analüüs, andmete eraldamine): Kasuta high. Te ei blokeeri kasutajat, seega täiendav latentsus ei oma tähtsust, ning täpsuse paranemine summeerub sadade üksuste lõikes.
Kõrgete panustega üksikpäringud (koodibaasi turvaaudit, keeruline migratsiooni planeerimine, uue algoritmi väljatöötamine): Kasuta xhigh. See on koht, kus 12x suurem arvutusressurss end ära tasub.

Mõju kuludele: Kõrgem reasoning effort tähendab, et genereeritakse (ja arveldatakse) rohkem sisemisi tokens. Päring tasemel xhigh võib maksta 3--5x rohkem kui sama päring tasemel low. Jälgige oma token kasutust tasemete muutmisel.

Computer Use API

GPT-5.4 on esimene üldotstarbeline mudel, millel on natiivne computer-use võimekus. OSWorld võrdlustestis saavutab see tulemuse 75% -- ületades inimeksperdi 72.4% baastaset. See ei ole lihtsalt ekraanitõmmiste ümbris. Mudel mõistab natiivselt töölaua liideseid ja suudab neid autonoomselt juhtida.

Kuidas see töötab

Saadate juhise, mis kirjeldab soovitud tegevust.
Mudel teeb sihtkeskkonnast ekraanitõmmiseid.
See genereerib hiireklõpsud, klaviatuuri sisendid ja navigeerimistoimingud.
See viib läbi build-run-verify-fix tsükli, et kontrollida oma tööd.
See tagastab tulemused või küsib selgitusi.

Koodinäide: Computer Use

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use"}],
    messages=[
        {"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
    ]
)

Mida Computer Use suudab teha

Brauseri automatiseerimine: Täita vorme, navigeerida mitmeetapilistes töövoogudes, eraldada struktureeritud andmeid dünaamilistelt lehtedelt.
Töölauarakenduste juhtimine: Avada rakendusi, suhelda natiivsete kasutajaliidestega, edastada andmeid programmide vahel.
Testimise töövood: Läbida UI voogusid, kontrollida visuaalseid olekuid, testida uute kasutajate teekondi.
Andmesisestus: Liigutada andmeid tabelarvutuslehtede, CRM-ide ja siseveebi tööriistade vahel.

Piirangud, mida teada

Latentsus: Iga tegevustsükkel hõlmab ekraanitõmmist, mudeli järeldust ja tegevuse sooritamist. Mitmeetapilised ülesanded võtavad aega.
Vajalik järelevalve: Ärge laske computer use funktsioonil töötada järelevalveta tundlikes süsteemides. Mudel võib teha valesid klõpse, tõlgendada valesti UI elemente või sooritada ettekavatsematuid tegevusi.
Keskkonna seadistamine: Computer use vajab ekraanikeskkonda. Serveripoolseks automatiseerimiseks on vaja virtuaalset ekraani (nt Xvfb Linuxis või virtuaalne töölaud).
Vaikimisi puudub juurdepääs failisüsteemile: Computer use töötab läbi kasutajaliidese, mitte otseste failisüsteemi poole pöördumiste kaudu. Kombineerige see koodi täitmise tööriistadega hübriidsete töövoogude jaoks.

Programmeerimine GPT-5.4-ga

GPT-5.4 pärib ja parandab GPT-5.3 Codex mudeli programmeerimisvõimekust. Võrdlustestid räägivad iseenda eest:

Võrdlustest	GPT-5.4 tulemus	Mida see testib
SWE-Bench Pro	57.7%	Reaalsete GitHubi probleemide lahendamine
SWE-Bench Verified	~80%	Valitud alamhulk SWE-Bench testist
Terminal-Bench 2.0	75.1%	Terminalipõhised arendusülesanded

Erinevused võrreldes GPT-5.3 Codex mudeliga

47% vähem tokens keeruliste ülesannete puhul -- vähem paljusõnaline väljund, kompaktsem kood.
Mitme faili muudatused vähemate korduskatsetega -- parem arusaam failidevahelistest sõltuvustest.
Järgib repositooriumipõhiseid mustreid -- kohandub teie koodibaasi tavadega, kui talle antakse piisavalt konteksti.
33% vähem faktivigu -- vähem hallutsinatsioone API viidetes, teekide kasutamises ja seadistustes.

Näpunäited paremaks koodi genereerimiseks

1. Kasuta system prompts koodistandardite määramiseks.

response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
        {"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
    ]
)

2. Anna talle kontekstiks oma tegelik kood. GPT-5.4 1M token kontekstiaken tähendab, et saate kaasata terveid mooduleid või isegi täielikke repositooriume. Mudel loob oluliselt paremat koodi, kui ta näeb olemasolevaid mustreid, tüüpe ja tavasid.

3. Keeruliste muudatuste puhul määra reasoning effort tasemele high või xhigh. Lihtsad veaparandused töötavad hästi tasemel medium, kuid arhitektuursed refaktoreerimised, migratsioonid ja mitme faili muudatused saavad märgatavat kasu kõrgemast reasoning effort tasemest.

4. Kasuta max_completion_tokens parameetrit liigsete vastuste vältimiseks. Koodi genereerimisel seadke mõistlik piirang, et vältida tasu maksmist pikkade selgituste eest, mida te ei palunud.

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[...],
    max_completion_tokens=4096
)

Suure konteksti strateegiad

1,050,000-token kontekstiaken on GPT-5.4 varjatud supervõime. Siin on, kuidas seda tõhusalt kasutada ja vältida kululõkse.

272K lisatasu

Sisendi hind kahekordistub, kui ületate ühe päringuga 272K tokens piiri. See tähendab, et 500K-token päring maksab ligikaudu:

Esimesed 272K tokens: 272K x $2.50/1M = $0.68
Ülejäänud 228K tokens: 228K x $5.00/1M = $1.14
Sisendi kogukulu: $1.82

Võrdluseks, sama päring standardhinnaga maksaks $1.25. Lisatasu suurendab antud juhul arvet ~46%.

Koodinäide: Suure konteksti kasutamine

from openai import OpenAI
client = OpenAI()

# Kogu koodibaasi laadimine konteksti
with open("codebase_dump.txt", "r") as f:
    full_codebase_content = f.read()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": full_codebase_content},  # kuni 1M tokens
        {"role": "user", "content": "Find all security vulnerabilities in this codebase"}
    ],
    max_completion_tokens=8192
)

Parimad tavad suurte kontekstide puhul

Tee seda:

Paiguta kõige asjakohasemad failid ettepoole. Mudel pöörab kõige rohkem tähelepanu konteksti algusele ja lõpule. Pane ülesande jaoks kõige olulisemad failid esimesena.
Kasuta system message viitematerjali jaoks. Pane oma koodibaas, dokumentatsioon või andmed süsteemisõnumisse (system message). Pane oma tegelikud juhised kasutajasõnumisse (user message).
Määra max_completion_tokens selgesõnaliselt. 128K maksimaalse väljundi juures võib piiramatu vastus suure konteksti puhul kiiresti kulukaks muutuda.

Ära tee seda:

Ära kasuta alati täielikku akent. Kui teie ülesanne vajab vaid 50K tokens konteksti, ärge täitke seda 1M-ni. Te maksate sisendi tokens eest sõltumata sellest, kas mudel neid vajab või mitte.
Ära ignoreeri 272K piiri. Struktureerige oma juhised nii, et need jääksid võimalusel alla 272K. Kui olete 280K juures, vaadake, kas saate eemaldada 10K tokens vähem asjakohast konteksti, et säästa lisatasult.
Ära oota täiuslikku meenutamist 1M tokens ulatuses. Sooritus langeb järk-järgult koos konteksti pikkusega. Kõrgeima täpsuse tagamiseks hoidke kõige kriitilisem teave esimese 200K tokens piires.

GPT-5.4 vs GPT-5.4 Pro: Millal üle minna

GPT-5.4 Pro maksab 12x rohkem kui standardne GPT-5.4. Siin on juhud, mil see on õigustatud.

Dimensioon	GPT-5.4	GPT-5.4 Pro
Sisendi kulu	$2.50 / 1M	$30.00 / 1M
Väljundi kulu	$15.00 / 1M	$180.00 / 1M
Parim valik	Enamik arendusülesandeid	Maksimaalne täpsus rasketes küsimustes
Arutlussügavus	Tugev kõikidel tasemetel	Vaikimisi sügavam sisemine arutlus
Latentsus	Standardne	Kõrgem (rohkem arvutusressurssi päringu kohta)

Kasuta standardset GPT-5.4 mudelit, kui:

Ehitate toodangurakendusi ennustatavate kuludega.
Ülesanded on hästi määratletud (CRUD, teisendused, tavaline programmeerimine).
Vajate kasutajatele suunatud funktsioonide puhul madalamat latentsust.
Töötlete suuri päringumahtusid.

Kasuta GPT-5.4 Pro mudelit, kui:

Täpsus ühel päringul on olulisem kui kulu (õigusanalüüs, meditsiinilised uuringud, turvaauditid).
Tegelete uudsete probleemidega, millest mudel pole palju näiteid näinud.
Mitmeetapilised arutlusahelad peavad olema lünkadeta.
Tegelete konkurentsipõhise võrdlemise või hindamisega.

Praktiline reegel: Kasuta vaikimisi standardmudelit. Käivita oma raskeimad testjuhtumid mõlema mudeliga. Kui Pro annab teie konkreetse töökoormuse puhul järjepidevalt paremaid tulemusi, suunake need konkreetsed päringud Pro-le ja jätke kõik muu standardmudelile.

Migreerumine GPT-5.3 Codex mudelilt

Kui kasutate praegu GPT-5.3 Codex (või GPT-5.2-Codex) mudelit, siis siin on peamised erinevused, millega arvestada.

Mis muutub

Valdkond	GPT-5.3 Codex	GPT-5.4
Mudeli ID	`gpt-5.3-codex`	`gpt-5.4`
Kontekstiaken	1,000,000 tokens	1,050,000 tokens
Computer use	Pole saadaval	Natiivne toetus
Reasoning effort	Toetatud	Toetatud (sama parameeter)
Hinnastus (sisend)	Varieerub variandi põhjal	$2.50 / 1M tokens
Hinnastus (väljund)	Varieerub variandi põhjal	$15.00 / 1M tokens
Tokenitõhusus	Baastase	47% vähem tokens keeruliste ülesannete puhul

Migratsiooni kontrollnimekiri

Vaheta mudeli ID. Muuda gpt-5.3-codex väärtuseks gpt-5.4 oma API kutsetes.
Testi oma reasoning effort seadeid. Samad tasemed on olemas (none kuni xhigh), kuid GPT-5.4 võib pakkuda igal tasemel teistsuguseid kvaliteedi ja kulu suhteid. Hinda oma vaikeseaded uuesti üle.
Vaata üle väljundi tokenite eelarved. GPT-5.4 on lakoonilisem (47% vähem tokens keeruliste ülesannete puhul). Võimalik, et saate vähendada max_completion_tokens väärtust ja säästa väljundi kuludelt.
Hinda computer use võimekust. Kui teil olid asenduslahendused UI automatiseerimiseks (Selenium skriptid, kohandatud tööriistad), võib GPT-5.4 natiivne computer use need asendada.
Jälgi 272K lisatasu. Kui teie Codexi töökoormused kasutasid suuri kontekste, kuid jäid Codexi hinnastruktuuri piiresse, arvutage kulud ümber GPT-5.4 astmelise sisendi hinnastusega.

Mis jääb samaks

Chat Completions API lõpp-punkt on identne.
System/user/assistant sõnumite rollid töötavad samamoodi.
Voogedastus (streaming), funktsioonide kutsumine (function calling) ja tööriistade kasutamine on kõik ühilduvad.
reasoning parameetri süntaks on muutmata.

Võrdlustestid lühidalt

Kiireks ülevaateks on siin GPT-5.4 tulemused arendajate jaoks olulisemates võrdlustestides:

Võrdlustest	Tulemus	Mida see mõõdab
SWE-Bench Pro	57.7%	Keeruline reaalne tarkvaratehnika
SWE-Bench Verified	~80%	Valitud GitHubi probleemide lahendamine
Terminal-Bench 2.0	75.1%	Terminalipõhised programmeerimis- ja süsteemiülesanded
OSWorld	75.0%	Lauaarvuti juhtimine (inimeste baastase: 72.4%)
GDPval	83%	Professionaalne teadmustöö 44 ametiala lõikes

Täiendavad kvaliteedinäitajad:

33% vähem faktivigu võrreldes mudeliga GPT-5.2.
18% vähem vigadega vastuseid üldiselt.

Kokkuvõte

GPT-5.4 ei ole revolutsiooniline muudatus API-s -- see on praktiline muudatus. Sama lõpp-punkt, sama sõnumivorming, samad tööriistade kasutamise mustrid. Uus on see, et teil on nüüd peenhäälestatud kontroll arutlusvõimekuse üle, natiivne computer-use ilma kolmanda osapoole tööriistadeta, piisavalt suur kontekstiaken tervete koodibaaside jaoks ja märkimisväärselt parem koodiväljund.

Kolm asja, mida kohe teha:

Määra reasoning.effort teadlikult. Ära looda igas päringus vaikimisi seadele. Vali tase vastavalt ülesande keerukusele ning oma latentsuse ja kulu eelarvele.
Eksperimenteeri computer use funktsiooniga. Kui teil on UI automatiseerimise töövooge, testige neid GPT-5.4 natiivse computer-use võimekusega. Võimalik, et saate loobuda rabelevatest Selenium skriptidest.
Auditige oma konteksti kasutust. Arvestades 272K lisatasu piiri ja 1M akent, on võimalik säästa (või raisata) päris raha sõltuvalt sellest, kuidas te oma juhiseid struktureerite.

Mudel on nüüd saadaval ID-ga gpt-5.4 Tier 1+ API kontodele. Alustage ehitamist.

GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use ja Code Examples (2026)