Jaké model ID mám použít pro GPT-5.4 v API?

Použijte 'gpt-5.4' jako model ID pro standardní model. Pro maximální výkon u komplexních úkolů použijte 'gpt-5.4-pro'. Oba jsou k dispozici přes standardní OpenAI Chat Completions API endpoint.

Jak funguje parametr reasoning effort v GPT-5.4?

Parametr reasoning.effort určuje, kolik interního compute GPT-5.4 využívá pro chain-of-thought reasoning. Akceptuje pět úrovní: none, low, medium, high a xhigh. Výchozí hodnota je medium. Nastavením na none se model chová jako non-thinking model (nejrychlejší a nejlevnější), zatímco xhigh nabízí maximální reasoning depth pro komplexní problémy.

Kolik stojí GPT-5.4 API?

GPT-5.4 stojí $2.50 za 1M input tokens a $15 za 1M output tokens. GPT-5.4 Pro stojí $30 za 1M input tokens a $180 za 1M output tokens. Input pricing se zdvojnásobuje, když překročíte 272K tokens v jednom požadavku.

Jaká je velikost GPT-5.4 context window?

GPT-5.4 podporuje 1,050,000-token context window s až 128K tokens output. To je dostatečně velké pro zpracování celých codebases v jediném požadavku. Vezměte na vědomí, že input pricing se zdvojnásobuje nad 272K tokens.

Může GPT-5.4 ovládat počítač přes API?

Ano. GPT-5.4 je první general-purpose model s vestavěnými computer-use schopnostmi. Aktivujete to zahrnutím computer_use tool type v tools array. Model může následně ovládat desktop apps, klikat na tlačítka, vyplňovat formuláře a autonomně navigovat skrze UIs. Dosahuje 75 % v OSWorld, což je více než human expert baseline na 72.4 %.

Jaké jsou požadavky na přístup k GPT-5.4 API?

Potřebujete placený OpenAI API účet s minimálně $5 v předchozích výdajích (Tier 1 access). GPT-5.4 není k dispozici ve free API tier. Pro uživatele ChatGPT je vyžadováno předplatné Plus ($20/month), Team ($25/month) nebo Pro ($200/month).

Mám používat GPT-5.4 nebo GPT-5.4 Pro?

Používejte standardní GPT-5.4 pro naprostou většinu úkolů — zvládá coding, analysis a reasoning dobře za $2.50/$15 za milion tokens. Rezervujte si GPT-5.4 Pro ($30/$180 za milion tokens) pro úkoly, kde je přesnost klíčová a náklady jsou sekundární, jako je komplexní multi-step reasoning, high-stakes code reviews nebo nuancovaný výzkum. Pro stojí 12x více, proto používejte standard jako default a upgradujte pouze tehdy, když uvidíte rozdíly v kvalitě.

Keskeiset havainnot

Viisi päättelypanoksen tasoa: reasoning.effort-parametri (none, low, medium, high, xhigh) hallitsee hinta-laatu-suhdetta pyyntökohtaisesti -- none toimii kuten ei-ajatteleva malli (nopein/halvin), kun taas xhigh tarjoaa maksimaalisen syvyyden 3-5x kustannuksella.
Natiivi tietokoneen käyttö API:n kautta: GPT-5.4 voi käyttää työpöytäsovelluksia, napsauttaa painikkeita ja navigoida käyttöliittymissä autonomisesti, saaden tulokseksi 75% OSWorld-testissä (ylittäen 72.4% asiantuntijatason perustason) -- tämä aktivoidaan välittämällä computer_use-työkalutyyppi.
1M+ token konteksti hintaan $2.50/$15: 1,050,000-tokenin syöteikkuna käsittelee kokonaisia koodikantoja yhdessä pyynnössä, vaikka syötteiden hinnoittelu kaksinkertaistuu 272K tokenin jälkeen.
GPT-5.4 Pro maksaa 12x enemmän: Varaa $30/$180 per miljoona tokenia maksava Pro-variantti kriittisiin tehtäviin, joissa tarkkuus on elintärkeää -- käytä oletuksena tavallista GPT-5.4-mallia valtaosaan työkuormista.

GPT-5.4 API -kehittäjän opas: Päättelypanos, tietokoneen käyttö ja koodiesimerkit

March 11, 2026 -- GPT-5.4 on OpenAI:n tähän mennessä kyvykkäin malli, ja se sisältää API-ominaisuuksia, jotka muuttavat merkittävästi tapaa, jolla rakennat sen avulla. Säädettävä päättelypanos, natiivi tietokoneen käyttö, 1M+ tokenin konteksti-ikkuna ja merkittävästi parannettu koodin generointi -- kaikki saman Chat Completions -päätepisteen kautta, jonka jo tunnet.

Tämä opas on tarkoitettu kehittäjille, jotka haluavat aloittaa rakentamisen GPT-5.4 API:lla tänään. Ei markkinointihöpötystä. Vain malli-ID:t, parametrit, koodiesimerkit, hinnoittelulaskelmat ja käytännön valinnat, joita joudut tekemään.

Pika-aloitus

Malli-ID:t

Malli	API ID	Soveltuu parhaiten
GPT-5.4	`gpt-5.4`	Yleiskäyttöiset tehtävät, koodaus, päättely, tietokoneen käyttö
GPT-5.4 Pro	`gpt-5.4-pro`	Maksimaalinen tarkkuus monimutkaisissa ja kriittisissä tehtävissä

Ensimmäinen API-kutsusi

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
    ]
)

print(response.choices[0].message.content)

Siinä se. Jos olet käyttänyt mitä tahansa GPT-mallia Chat Completions API:n kautta, GPT-5.4 on suora korvaaja. Erot ovat uusissa parametreissa ja ominaisuuksissa.

Hinnoittelu

Malli	Syöte	Tuloste	Huomautukset
GPT-5.4	$2.50 / 1M tokens	$15.00 / 1M tokens	Syötteen hinta tuplautuu 272K tokenin jälkeen
GPT-5.4 Pro	$30.00 / 1M tokens	$180.00 / 1M tokens	12x tavallisen mallin hinta

Konteksti-ikkuna: 1,050,000 tokenin syöte, 128,000 tokenin maksimituloste.

Käyttöoikeusvaatimukset: Maksullinen API-tili, jossa on vähintään $5 aiempaa kulutusta (Tier 1). Ei saatavilla ilmaisella tasolla.

Päättelypanos: Ajattelubudjetin hallinta

GPT-5.4:n tärkein uusi parametri on reasoning.effort. Se hallitsee sitä, kuinka paljon sisäistä laskentatehoa malli kohdentaa ajatusketju-päättelyyn (chain-of-thought) ennen vastauksen tuottamista.

Viisi tasoa

Taso	Käyttäytyminen	Milloin käyttää
`none`	Ei ajatusketjua. Nopein, halvin. Toimii kuin ei-ajatteleva malli.	Yksinkertaiset muunnokset, muotoilu, tiedonhaku
`low`	Minimaalinen päättely. Nopeat tarkistukset.	Suoraviivaiset kysymykset ja vastaukset, luokittelu, tiivistäminen
`medium`	Tasapainoinen päättely. Tämä on oletusarvo.	Yleinen koodaus, analyysi, useimmat tuotantoympäristön työkuormat
`high`	Laajennetut päättelyketjut. Perusteellisempi.	Monimutkainen vianetsintä, arkkitehtuuripäätökset, monivaiheinen logiikka
`xhigh`	Maksimaalinen päättelysyvyys. Hitain mutta tarkin.	Vaikea matematiikka, suuret refaktoroinnit, tietoturvatarkastukset, tutkimus

Koodiesimerkki: Päättelypanoksen asettaminen

from openai import OpenAI
client = OpenAI()

# Korkea päättelypanos monimutkaiseen refaktorointitehtävään
response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n    results = []\n    while url:\n        resp = requests.get(url)\n        data = resp.json()\n        results.extend(data['items'])\n        url = data.get('next')\n    return results"}
    ]
)

Käytännön ohjeita päättelytasoista

Aloita tasosta medium ja säädä tarvittaessa. Useimmissa API-työkuormissa oletusarvo on oikea valinta. Näin voit ajatella sitä:

Viiveherkät polut (automaattinen täydennys, chat, reaaliaikaiset käyttöliittymät): Käytä tasoa low tai none. Nopeusero on huomattava, ja tehtävissä kuten tekstin muotoilussa tai yksinkertaisissa hauissa ylimääräinen päättely ei tuo lisäarvoa.
Eräajo (koodikatselmoinnit, asiakirja-analyysi, tiedonhaku): Käytä tasoa high. Et estä käyttäjän toimintaa, joten ylimääräisellä viiveellä ei ole merkitystä, ja tarkkuuden parannukset kertautuvat satojen kohteiden välillä.
Kriittiset yksittäiset pyynnöt (koodikannan tietoturvatarkastus, monimutkainen migraatiosuunnittelu, uuden algoritmin suunnittelu): Käytä tasoa xhigh. Tässä 12-kertainen laskentateho maksaa itsensä takaisin.

Kustannusvaikutus: Korkeampi päättelypanos tarkoittaa, että sisäisiä tokeneita generoidaan (ja laskutetaan) enemmän. Pyyntö tasolla xhigh voi maksaa 3--5x enemmän kuin sama pyyntö tasolla low. Seuraa tokenien käyttöäsi, kun muutat tasoja.

Tietokoneen käyttö API

GPT-5.4 on ensimmäinen yleiskäyttöinen malli, jossa on natiivi tietokoneen käyttökyky. OSWorld-benchmarkissa se saa tulokseksi 75% -- ylittäen ihmisasiantuntijoiden perustason 72.4%. Tämä ei ole vain kuori kuvakaappausten ympärillä. Malli ymmärtää natiivisti työpöytäkäyttöliittymiä ja voi käyttää niitä autonomisesti.

Miten se toimii

Lähetät kehotteen, joka kuvailee mitä haluat tehtävän.
Malli ottaa kuvakaappauksia kohdeympäristöstä.
Se generoi hiiren napsautuksia, näppäimistösyötteitä ja navigointitoimintoja.
Se suorittaa build-run-verify-fix-silmukan tarkistaakseen oman työnsä.
Se palauttaa tulokset tai pyytää tarkennusta.

Koodiesimerkki: Tietokoneen käyttö

from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use"}],
    messages=[
        {"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
    ]
)

Mitä tietokoneen käyttö voi tehdä

Selainautomaatio: Täytä lomakkeita, navigoi monivaiheisissa työnkuluissa, kerää rakenteellista tietoa dynaamisilta sivuilta.
Työpöytäsovellusten käyttö: Avaa sovelluksia, vuorovaikuta natiivien käyttöliittymien kanssa, siirrä tietoa ohjelmien välillä.
Testaustyönkulut: Käy läpi käyttöliittymäpolkuja, varmista visuaaliset tilat, suorita käyttöönottosekvenssejä.
Tiedon tallennus: Siirrä tietoa taulukkolaskentaohjelmien, CRM-järjestelmien ja sisäisten työkalujen välillä.

Tunnetut rajoitukset

Viive: Jokainen toimintosykli sisältää kuvakaappauksen, mallin päättelyn ja toiminnon suorituksen. Monivaiheiset tehtävät vievät todellista aikaa.
Vaatii valvontaa: Älä aja tietokoneen käyttöä ilman valvontaa arkaluonteisissa järjestelmissä. Malli voi napsauttaa väärin, tulkita käyttöliittymäelementtejä virheellisesti tai tehdä tahattomia toimintoja.
Ympäristön asennus: Tietokoneen käyttö vaatii näyttöympäristön. Palvelinpuolen automaatiota varten tarvitset virtuaalisen näytön (esim. Xvfb Linuxissa tai virtuaalinen työpöytä).
Ei tiedostojärjestelmän pääsyä oletuksena: Tietokoneen käyttö toimii käyttöliittymän kautta, ei suorien tiedostojärjestelmäkutsujen avulla. Yhdistä se koodin suoritustyökaluihin hybridityönkulkuja varten.

Koodaus GPT-5.4:llä

GPT-5.4 perii ja parantaa GPT-5.3 Codex -mallin koodausominaisuuksia. Benchmarkit kertovat tarinan:

Benchmark	GPT-5.4 Tulos	Mitä se testaa
SWE-Bench Pro	57.7%	Todellisten GitHub-ongelmien ratkaisu
SWE-Bench Verified	~80%	Kuratoitu osajoukko SWE-Benchistä
Terminal-Bench 2.0	75.1%	Terminaalipohjaiset kehitystehtävät

Mikä on muuttunut GPT-5.3 Codexiin verrattuna

47% vähemmän tokeneita monimutkaisissa tehtävissä -- vähemmän monisanaista tulostetta, tiiviimpää koodia.
Muutokset useisiin tiedostoihin vähemmillä yrityksillä -- parempi ymmärrys tiedostojen välisistä riippuvuuksista.
Noudattaa koodikantakohtaisia malleja -- mukautuu koodikantasi käytäntöihin, kun sille annetaan kontekstia.
33% vähemmän faktavirheitä -- vähemmän hallusinaatioita API-viittauksissa, kirjastojen käytössä ja konfiguraatioissa.

Vinkkejä parempaan koodin generointiin

1. Käytä järjestelmäkehotteita (system prompts) koodausstandardien asettamiseen.

response = client.chat.completions.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    messages=[
        {"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
        {"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
    ]
)

2. Syötä sille todellinen koodisi kontekstina. GPT-5.4:n 1M tokenin konteksti-ikkuna tarkoittaa, että voit sisällyttää kokonaisia moduuleja tai jopa kokonaisia koodikantoja. Malli tuottaa huomattavasti parempaa koodia, kun se näkee olemassa olevat mallit, tyypit ja käytännöt.

3. Aseta päättelypanokseksi high tai xhigh monimutkaisiin muutoksiin. Yksinkertaiset bugikorjaukset toimivat hyvin tasolla medium, mutta arkkitehtuurin refaktoroinnit, migraatiot ja usean tiedoston muutokset hyötyvät mitattavasti korkeammasta päättelypanoksesta.

4. Käytä max_completion_tokens-paramatria estääksesi karkaavat vastaukset. Koodin generoinnissa aseta järkevä raja, jotta et joudu maksamaan monisanaisista selityksistä, joita et pyytänyt.

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[...],
    max_completion_tokens=4096
)

Strategiat suurelle kontekstille

1,050,000-tokenin konteksti-ikkuna on GPT-5.4:n hiljainen supervoima. Näin käytät sitä tehokkaasti -- ja vältät kustannusansat.

272K lisämaksu

Syötteen hinnoittelu kaksinkertaistuu, kun ylität 272K tokenia yhdessä pyynnössä. Se tarkoittaa, että 500K-tokenin pyyntö maksaa suunnilleen:

Ensimmäiset 272K tokenia: 272K x $2.50/1M = $0.68
Loput 228K tokenia: 228K x $5.00/1M = $1.14
Syötteen kokonaiskustannus: $1.82

Vertailun vuoksi, sama pyyntö vakiohinnalla maksaisi $1.25. Lisämaksu lisää tässä tapauksessa laskuun noin 46%.

Koodiesimerkki: Suuren kontekstin käyttö

from openai import OpenAI
client = OpenAI()

# Lataa koko koodikanta kontekstiin
with open("codebase_dump.txt", "r") as f:
    full_codebase_content = f.read()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": full_codebase_content},  # jopa 1M tokenia
        {"role": "user", "content": "Find all security vulnerabilities in this codebase"}
    ],
    max_completion_tokens=8192
)

Parhaat käytännöt suurille konteksteille

Tee näin:

Sijoita tärkeimmät tiedostot alkuun. Malli kiinnittää eniten huomiota kontekstin alkuun ja loppuun. Laita tehtävän kannalta tärkeimmät tiedostot ensin.
Käytä järjestelmäviestiä (system message) viitemateriaalille. Aseta koodikantasi, dokumentaatiosi tai tietosi järjestelmäviestiin. Laita varsinaiset ohjeet käyttäjäviestiin.
Aseta max_completion_tokens selkeästi. 128K maksimitulosteella rajoittamaton vastaus suuressa kontekstissa voi tulla nopeasti kalliiksi.

Älä tee näin:

Älä käytä aina koko ikkunaa. Jos tehtäväsi tarvitsee vain 50K tokenia kontekstia, älä täytä sitä 1M tokeniin asti. Maksat syötetokeneista riippumatta siitä, tarvitseeko malli niitä vai ei.
Älä sivuuta 272K rajaa. Muotoile kehotteesi pysymään alle 272K tokenin, jos mahdollista. Jos olet 280K tokenin kohdalla, katso voitko karsia 10K tokenia vähemmän tärkeää kontekstia säästääksesi lisämaksussa.
Älä odota täydellistä muistamista yli 1M tokenin matkalta. Suorituskyky heikkenee vähitellen kontekstin pituuden myötä. Parhaan tarkkuuden saavuttamiseksi pidä kriittisin tieto ensimmäisen 200K tokenin sisällä.

GPT-5.4 vs GPT-5.4 Pro: Milloin päivittää

GPT-5.4 Pro maksaa 12x enemmän kuin tavallinen GPT-5.4. Tässä tilanteet, joissa se on perusteltua.

Ulottuvuus	GPT-5.4	GPT-5.4 Pro
Syötteen hinta	$2.50 / 1M	$30.00 / 1M
Tulosteen hinta	$15.00 / 1M	$180.00 / 1M
Soveltuu parhaiten	Useimmat kehitystehtävät	Maksimaalinen tarkkuus vaikeisiin ongelmiin
Päättelysyvyys	Vahva kaikilla tasoilla	Syvempi sisäinen päättely oletuksena
Viive	Vakio	Korkeampi (enemmän laskentaa per pyyntö)

Käytä tavallista GPT-5.4-mallia, kun:

Rakennat tuotantosovelluksia, joissa kustannukset on ennakoitava.
Tehtävät ovat hyvin määriteltyjä (CRUD, muunnokset, peruskoodaus).
Tarvitset pienempää viivettä käyttäjälle näkyvissä ominaisuuksissa.
Käsittelet suuria määriä pyyntöjä.

Käytä GPT-5.4 Pro -mallia, kun:

Yksittäisen pyynnön tarkkuus merkitsee enemmän kuin kustannus (oikeudellinen analyysi, lääketieteellinen tutkimus, tietoturvatarkastukset).
Ratkaiset uudenlaisia ongelmia, joista malli ei ole nähnyt monia esimerkkejä.
Monivaiheisten päättelyketjujen on oltava aukottomia.
Teet kilpailullista vertailua tai arviointia.

Käytännön sääntö: Käytä oletuksena tavallista mallia. Aja vaikeimmat testitapauksesi molempien mallien läpi. Jos Pro tuottaa johdonmukaisesti parempia tuloksia tietyssä työkuormassa, vaihda vain kyseiset kutsut Pro-malliin ja pidä kaikki muu tavallisessa mallissa.

Migraatio GPT-5.3 Codexista

Jos käytät tällä hetkellä GPT-5.3 Codexia (tai GPT-5.2-Codexia), tässä ovat keskeiset erot suunnittelua varten.

Mikä muuttuu

Alue	GPT-5.3 Codex	GPT-5.4
Malli-ID	`gpt-5.3-codex`	`gpt-5.4`
Konteksti-ikkuna	1,000,000 tokens	1,050,000 tokens
Tietokoneen käyttö	Ei saatavilla	Natiivi tuki
Päättelypanos	Tuettu	Tuettu (sama parametri)
Hinnoittelu (syöte)	Vaihtelee varianteittain	$2.50 / 1M tokens
Hinnoittelu (tuloste)	Vaihtelee varianteittain	$15.00 / 1M tokens
Token-tehokkuus	Perustaso	47% vähemmän tokeneita monimutkaisissa tehtävissä

Migraation muistilista

Vaihda malli-ID. Muuta gpt-5.3-codex muotoon gpt-5.4 API-kutsuissasi.
Testaa päättelypanoksen asetukset. Samat tasot ovat olemassa (none - xhigh), mutta GPT-5.4 saattaa tuottaa erilaisia hinta-laatu-valintoja kullakin tasolla. Arvioi oletusarvosi uudelleen.
Tarkista tulostetokenien budjetit. GPT-5.4 on tiiviimpi (47% vähemmän tokeneita monimutkaisissa tehtävissä). Voit ehkä laskea max_completion_tokens-arvoa ja säästää tulostekustannuksissa.
Arvioi tietokoneen käyttö. Jos sinulla oli kiertoteitä käyttöliittymäautomaatioon (Selenium-skriptit, omat työkalut), GPT-5.4:n natiivi tietokoneen käyttö saattaa korvata ne.
Seuraa 272K lisämaksua. Jos Codex-työkuormasi käyttivät suuria konteksteja, mutta pysyivät Codexin hinnoittelurakenteessa, laske kustannukset uudelleen GPT-5.4:n porrastetulla syötehinnoittelulla.

Mikä pysyy samana

Chat Completions API -päätepiste on identtinen.
Järjestelmä-, käyttäjä- ja avustajaviestien roolit toimivat samalla tavalla.
Striimaus, funktioiden kutsuminen ja työkalujen käyttö ovat kaikki yhteensopivia.
reasoning-parametrin syntaksi on muuttumaton.

Benchmark-tulokset yhdellä silmäyksellä

Tässä on pikaopas siitä, miten GPT-5.4 suoriutuu kehittäjille tärkeimmissä testeissä:

Benchmark	Tulos	Mitä se mittaa
SWE-Bench Pro	57.7%	Monimutkainen todellinen ohjelmistokehitys
SWE-Bench Verified	~80%	Kuratoitu GitHub-ongelmien ratkaisu
Terminal-Bench 2.0	75.1%	Terminaalipohjainen koodaus ja järjestelmätehtävät
OSWorld	75.0%	Työpöytätietokoneen käyttö (ihmisen perustaso: 72.4%)
GDPval	83%	Ammatillinen asiantuntijatyö 44 eri ammatissa

Muita laatumittareita:

33% vähemmän faktavirheitä verrattuna GPT-5.2-malliin.
18% vähemmän virheitä sisältäviä vastauksia kaiken kaikkiaan.

Yhteenveto

GPT-5.4 ei ole vallankumouksellinen API-muutos -- se on käytännöllinen päivitys. Sama päätepiste, sama viestimuoto, samat työkalujen käyttömallit. Uutta on se, että sinulla on nyt hienojakoinen hallinta päättelyn laskentatehoon, natiivi tietokoneen käyttö ilman kolmannen osapuolen työkaluja, riittävän suuri konteksti-ikkuna kokonaisille koodikannoille ja huomattavasti parempi koodituloste.

Kolme asiaa, jotka kannattaa tehdä heti:

Aseta reasoning.effort tarkoituksella. Älä luota oletusarvoon jokaisessa kutsussa. Sovita päättelytaso tehtävän monimutkaisuuteen sekä viive- ja kustannusbudjettiisi.
Kokeile tietokoneen käyttöä. Jos sinulla on käyttöliittymän automaatiotyönkulkuja, testaa niitä GPT-5.4:n natiiveilla ominaisuuksilla. Saatat voida poistaa käytöstä hauraat Selenium-skriptit.
Auditoi kontekstin käyttösi. 272K lisämaksurajan ja 1M ikkunan myötä voit säästää (tai tuhlata) oikeaa rahaa riippuen siitä, miten muotoilet kehotteesi.

Malli on nyt saatavilla tunnisteella gpt-5.4 Tier 1+ API-tileille. Aloita rakentaminen.

GPT-5.4 API Developer Guide: Reasoning Effort, Computer Use, a Code Examples (2026)