Keskeiset havainnot
- Viisi päättelypanoksen tasoa:
reasoning.effort-parametri (none, low, medium, high, xhigh) hallitsee hinta-laatu-suhdetta pyyntökohtaisesti --nonetoimii kuten ei-ajatteleva malli (nopein/halvin), kun taasxhightarjoaa maksimaalisen syvyyden 3-5x kustannuksella. - Natiivi tietokoneen käyttö API:n kautta: GPT-5.4 voi käyttää työpöytäsovelluksia, napsauttaa painikkeita ja navigoida käyttöliittymissä autonomisesti, saaden tulokseksi 75% OSWorld-testissä (ylittäen 72.4% asiantuntijatason perustason) -- tämä aktivoidaan välittämällä
computer_use-työkalutyyppi. - 1M+ token konteksti hintaan $2.50/$15: 1,050,000-tokenin syöteikkuna käsittelee kokonaisia koodikantoja yhdessä pyynnössä, vaikka syötteiden hinnoittelu kaksinkertaistuu 272K tokenin jälkeen.
- GPT-5.4 Pro maksaa 12x enemmän: Varaa $30/$180 per miljoona tokenia maksava Pro-variantti kriittisiin tehtäviin, joissa tarkkuus on elintärkeää -- käytä oletuksena tavallista GPT-5.4-mallia valtaosaan työkuormista.
GPT-5.4 API -kehittäjän opas: Päättelypanos, tietokoneen käyttö ja koodiesimerkit
March 11, 2026 -- GPT-5.4 on OpenAI:n tähän mennessä kyvykkäin malli, ja se sisältää API-ominaisuuksia, jotka muuttavat merkittävästi tapaa, jolla rakennat sen avulla. Säädettävä päättelypanos, natiivi tietokoneen käyttö, 1M+ tokenin konteksti-ikkuna ja merkittävästi parannettu koodin generointi -- kaikki saman Chat Completions -päätepisteen kautta, jonka jo tunnet.
Tämä opas on tarkoitettu kehittäjille, jotka haluavat aloittaa rakentamisen GPT-5.4 API:lla tänään. Ei markkinointihöpötystä. Vain malli-ID:t, parametrit, koodiesimerkit, hinnoittelulaskelmat ja käytännön valinnat, joita joudut tekemään.
Pika-aloitus
Malli-ID:t
| Malli | API ID | Soveltuu parhaiten |
|---|---|---|
| GPT-5.4 | gpt-5.4 | Yleiskäyttöiset tehtävät, koodaus, päättely, tietokoneen käyttö |
| GPT-5.4 Pro | gpt-5.4-pro | Maksimaalinen tarkkuus monimutkaisissa ja kriittisissä tehtävissä |
Ensimmäinen API-kutsusi
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "user", "content": "Explain the tradeoffs between B-trees and LSM-trees for write-heavy workloads."}
]
)
print(response.choices[0].message.content)
Siinä se. Jos olet käyttänyt mitä tahansa GPT-mallia Chat Completions API:n kautta, GPT-5.4 on suora korvaaja. Erot ovat uusissa parametreissa ja ominaisuuksissa.
Hinnoittelu
| Malli | Syöte | Tuloste | Huomautukset |
|---|---|---|---|
| GPT-5.4 | $2.50 / 1M tokens | $15.00 / 1M tokens | Syötteen hinta tuplautuu 272K tokenin jälkeen |
| GPT-5.4 Pro | $30.00 / 1M tokens | $180.00 / 1M tokens | 12x tavallisen mallin hinta |
Konteksti-ikkuna: 1,050,000 tokenin syöte, 128,000 tokenin maksimituloste.
Käyttöoikeusvaatimukset: Maksullinen API-tili, jossa on vähintään $5 aiempaa kulutusta (Tier 1). Ei saatavilla ilmaisella tasolla.
Päättelypanos: Ajattelubudjetin hallinta
GPT-5.4:n tärkein uusi parametri on reasoning.effort. Se hallitsee sitä, kuinka paljon sisäistä laskentatehoa malli kohdentaa ajatusketju-päättelyyn (chain-of-thought) ennen vastauksen tuottamista.
Viisi tasoa
| Taso | Käyttäytyminen | Milloin käyttää |
|---|---|---|
none | Ei ajatusketjua. Nopein, halvin. Toimii kuin ei-ajatteleva malli. | Yksinkertaiset muunnokset, muotoilu, tiedonhaku |
low | Minimaalinen päättely. Nopeat tarkistukset. | Suoraviivaiset kysymykset ja vastaukset, luokittelu, tiivistäminen |
medium | Tasapainoinen päättely. Tämä on oletusarvo. | Yleinen koodaus, analyysi, useimmat tuotantoympäristön työkuormat |
high | Laajennetut päättelyketjut. Perusteellisempi. | Monimutkainen vianetsintä, arkkitehtuuripäätökset, monivaiheinen logiikka |
xhigh | Maksimaalinen päättelysyvyys. Hitain mutta tarkin. | Vaikea matematiikka, suuret refaktoroinnit, tietoturvatarkastukset, tutkimus |
Koodiesimerkki: Päättelypanoksen asettaminen
from openai import OpenAI
client = OpenAI()
# Korkea päättelypanos monimutkaiseen refaktorointitehtävään
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "user", "content": "Refactor this function to use async/await and handle all edge cases for network failures, timeouts, and partial responses:\n\ndef fetch_all_pages(url):\n results = []\n while url:\n resp = requests.get(url)\n data = resp.json()\n results.extend(data['items'])\n url = data.get('next')\n return results"}
]
)
Käytännön ohjeita päättelytasoista
Aloita tasosta medium ja säädä tarvittaessa. Useimmissa API-työkuormissa oletusarvo on oikea valinta. Näin voit ajatella sitä:
-
Viiveherkät polut (automaattinen täydennys, chat, reaaliaikaiset käyttöliittymät): Käytä tasoa
lowtainone. Nopeusero on huomattava, ja tehtävissä kuten tekstin muotoilussa tai yksinkertaisissa hauissa ylimääräinen päättely ei tuo lisäarvoa. -
Eräajo (koodikatselmoinnit, asiakirja-analyysi, tiedonhaku): Käytä tasoa
high. Et estä käyttäjän toimintaa, joten ylimääräisellä viiveellä ei ole merkitystä, ja tarkkuuden parannukset kertautuvat satojen kohteiden välillä. -
Kriittiset yksittäiset pyynnöt (koodikannan tietoturvatarkastus, monimutkainen migraatiosuunnittelu, uuden algoritmin suunnittelu): Käytä tasoa
xhigh. Tässä 12-kertainen laskentateho maksaa itsensä takaisin.
Kustannusvaikutus: Korkeampi päättelypanos tarkoittaa, että sisäisiä tokeneita generoidaan (ja laskutetaan) enemmän. Pyyntö tasolla xhigh voi maksaa 3--5x enemmän kuin sama pyyntö tasolla low. Seuraa tokenien käyttöäsi, kun muutat tasoja.
Tietokoneen käyttö API
GPT-5.4 on ensimmäinen yleiskäyttöinen malli, jossa on natiivi tietokoneen käyttökyky. OSWorld-benchmarkissa se saa tulokseksi 75% -- ylittäen ihmisasiantuntijoiden perustason 72.4%. Tämä ei ole vain kuori kuvakaappausten ympärillä. Malli ymmärtää natiivisti työpöytäkäyttöliittymiä ja voi käyttää niitä autonomisesti.
Miten se toimii
- Lähetät kehotteen, joka kuvailee mitä haluat tehtävän.
- Malli ottaa kuvakaappauksia kohdeympäristöstä.
- Se generoi hiiren napsautuksia, näppäimistösyötteitä ja navigointitoimintoja.
- Se suorittaa build-run-verify-fix-silmukan tarkistaakseen oman työnsä.
- Se palauttaa tulokset tai pyytää tarkennusta.
Koodiesimerkki: Tietokoneen käyttö
from openai import OpenAI
client = OpenAI()
response = client.chat.completions.create(
model="gpt-5.4",
tools=[{"type": "computer_use"}],
messages=[
{"role": "user", "content": "Open the browser, go to github.com, and create a new repository called 'my-project'"}
]
)
Mitä tietokoneen käyttö voi tehdä
- Selainautomaatio: Täytä lomakkeita, navigoi monivaiheisissa työnkuluissa, kerää rakenteellista tietoa dynaamisilta sivuilta.
- Työpöytäsovellusten käyttö: Avaa sovelluksia, vuorovaikuta natiivien käyttöliittymien kanssa, siirrä tietoa ohjelmien välillä.
- Testaustyönkulut: Käy läpi käyttöliittymäpolkuja, varmista visuaaliset tilat, suorita käyttöönottosekvenssejä.
- Tiedon tallennus: Siirrä tietoa taulukkolaskentaohjelmien, CRM-järjestelmien ja sisäisten työkalujen välillä.
Tunnetut rajoitukset
- Viive: Jokainen toimintosykli sisältää kuvakaappauksen, mallin päättelyn ja toiminnon suorituksen. Monivaiheiset tehtävät vievät todellista aikaa.
- Vaatii valvontaa: Älä aja tietokoneen käyttöä ilman valvontaa arkaluonteisissa järjestelmissä. Malli voi napsauttaa väärin, tulkita käyttöliittymäelementtejä virheellisesti tai tehdä tahattomia toimintoja.
- Ympäristön asennus: Tietokoneen käyttö vaatii näyttöympäristön. Palvelinpuolen automaatiota varten tarvitset virtuaalisen näytön (esim. Xvfb Linuxissa tai virtuaalinen työpöytä).
- Ei tiedostojärjestelmän pääsyä oletuksena: Tietokoneen käyttö toimii käyttöliittymän kautta, ei suorien tiedostojärjestelmäkutsujen avulla. Yhdistä se koodin suoritustyökaluihin hybridityönkulkuja varten.
Koodaus GPT-5.4:llä
GPT-5.4 perii ja parantaa GPT-5.3 Codex -mallin koodausominaisuuksia. Benchmarkit kertovat tarinan:
| Benchmark | GPT-5.4 Tulos | Mitä se testaa |
|---|---|---|
| SWE-Bench Pro | 57.7% | Todellisten GitHub-ongelmien ratkaisu |
| SWE-Bench Verified | ~80% | Kuratoitu osajoukko SWE-Benchistä |
| Terminal-Bench 2.0 | 75.1% | Terminaalipohjaiset kehitystehtävät |
Mikä on muuttunut GPT-5.3 Codexiin verrattuna
- 47% vähemmän tokeneita monimutkaisissa tehtävissä -- vähemmän monisanaista tulostetta, tiiviimpää koodia.
- Muutokset useisiin tiedostoihin vähemmillä yrityksillä -- parempi ymmärrys tiedostojen välisistä riippuvuuksista.
- Noudattaa koodikantakohtaisia malleja -- mukautuu koodikantasi käytäntöihin, kun sille annetaan kontekstia.
- 33% vähemmän faktavirheitä -- vähemmän hallusinaatioita API-viittauksissa, kirjastojen käytössä ja konfiguraatioissa.
Vinkkejä parempaan koodin generointiin
1. Käytä järjestelmäkehotteita (system prompts) koodausstandardien asettamiseen.
response = client.chat.completions.create(
model="gpt-5.4",
reasoning={"effort": "high"},
messages=[
{"role": "system", "content": "You are a senior Python developer. Follow PEP 8. Use type hints. Write docstrings in Google style. Prefer composition over inheritance. Use dataclasses for DTOs."},
{"role": "user", "content": "Implement a retry decorator with exponential backoff, jitter, and configurable max retries."}
]
)
2. Syötä sille todellinen koodisi kontekstina. GPT-5.4:n 1M tokenin konteksti-ikkuna tarkoittaa, että voit sisällyttää kokonaisia moduuleja tai jopa kokonaisia koodikantoja. Malli tuottaa huomattavasti parempaa koodia, kun se näkee olemassa olevat mallit, tyypit ja käytännöt.
3. Aseta päättelypanokseksi high tai xhigh monimutkaisiin muutoksiin. Yksinkertaiset bugikorjaukset toimivat hyvin tasolla medium, mutta arkkitehtuurin refaktoroinnit, migraatiot ja usean tiedoston muutokset hyötyvät mitattavasti korkeammasta päättelypanoksesta.
4. Käytä max_completion_tokens-paramatria estääksesi karkaavat vastaukset. Koodin generoinnissa aseta järkevä raja, jotta et joudu maksamaan monisanaisista selityksistä, joita et pyytänyt.
response = client.chat.completions.create(
model="gpt-5.4",
messages=[...],
max_completion_tokens=4096
)
Strategiat suurelle kontekstille
1,050,000-tokenin konteksti-ikkuna on GPT-5.4:n hiljainen supervoima. Näin käytät sitä tehokkaasti -- ja vältät kustannusansat.
272K lisämaksu
Syötteen hinnoittelu kaksinkertaistuu, kun ylität 272K tokenia yhdessä pyynnössä. Se tarkoittaa, että 500K-tokenin pyyntö maksaa suunnilleen:
- Ensimmäiset 272K tokenia: 272K x $2.50/1M = $0.68
- Loput 228K tokenia: 228K x $5.00/1M = $1.14
- Syötteen kokonaiskustannus: $1.82
Vertailun vuoksi, sama pyyntö vakiohinnalla maksaisi $1.25. Lisämaksu lisää tässä tapauksessa laskuun noin 46%.
Koodiesimerkki: Suuren kontekstin käyttö
from openai import OpenAI
client = OpenAI()
# Lataa koko koodikanta kontekstiin
with open("codebase_dump.txt", "r") as f:
full_codebase_content = f.read()
response = client.chat.completions.create(
model="gpt-5.4",
messages=[
{"role": "system", "content": full_codebase_content}, # jopa 1M tokenia
{"role": "user", "content": "Find all security vulnerabilities in this codebase"}
],
max_completion_tokens=8192
)
Parhaat käytännöt suurille konteksteille
Tee näin:
- Sijoita tärkeimmät tiedostot alkuun. Malli kiinnittää eniten huomiota kontekstin alkuun ja loppuun. Laita tehtävän kannalta tärkeimmät tiedostot ensin.
- Käytä järjestelmäviestiä (system message) viitemateriaalille. Aseta koodikantasi, dokumentaatiosi tai tietosi järjestelmäviestiin. Laita varsinaiset ohjeet käyttäjäviestiin.
- Aseta
max_completion_tokensselkeästi. 128K maksimitulosteella rajoittamaton vastaus suuressa kontekstissa voi tulla nopeasti kalliiksi.
Älä tee näin:
- Älä käytä aina koko ikkunaa. Jos tehtäväsi tarvitsee vain 50K tokenia kontekstia, älä täytä sitä 1M tokeniin asti. Maksat syötetokeneista riippumatta siitä, tarvitseeko malli niitä vai ei.
- Älä sivuuta 272K rajaa. Muotoile kehotteesi pysymään alle 272K tokenin, jos mahdollista. Jos olet 280K tokenin kohdalla, katso voitko karsia 10K tokenia vähemmän tärkeää kontekstia säästääksesi lisämaksussa.
- Älä odota täydellistä muistamista yli 1M tokenin matkalta. Suorituskyky heikkenee vähitellen kontekstin pituuden myötä. Parhaan tarkkuuden saavuttamiseksi pidä kriittisin tieto ensimmäisen 200K tokenin sisällä.
GPT-5.4 vs GPT-5.4 Pro: Milloin päivittää
GPT-5.4 Pro maksaa 12x enemmän kuin tavallinen GPT-5.4. Tässä tilanteet, joissa se on perusteltua.
| Ulottuvuus | GPT-5.4 | GPT-5.4 Pro |
|---|---|---|
| Syötteen hinta | $2.50 / 1M | $30.00 / 1M |
| Tulosteen hinta | $15.00 / 1M | $180.00 / 1M |
| Soveltuu parhaiten | Useimmat kehitystehtävät | Maksimaalinen tarkkuus vaikeisiin ongelmiin |
| Päättelysyvyys | Vahva kaikilla tasoilla | Syvempi sisäinen päättely oletuksena |
| Viive | Vakio | Korkeampi (enemmän laskentaa per pyyntö) |
Käytä tavallista GPT-5.4-mallia, kun:
- Rakennat tuotantosovelluksia, joissa kustannukset on ennakoitava.
- Tehtävät ovat hyvin määriteltyjä (CRUD, muunnokset, peruskoodaus).
- Tarvitset pienempää viivettä käyttäjälle näkyvissä ominaisuuksissa.
- Käsittelet suuria määriä pyyntöjä.
Käytä GPT-5.4 Pro -mallia, kun:
- Yksittäisen pyynnön tarkkuus merkitsee enemmän kuin kustannus (oikeudellinen analyysi, lääketieteellinen tutkimus, tietoturvatarkastukset).
- Ratkaiset uudenlaisia ongelmia, joista malli ei ole nähnyt monia esimerkkejä.
- Monivaiheisten päättelyketjujen on oltava aukottomia.
- Teet kilpailullista vertailua tai arviointia.
Käytännön sääntö: Käytä oletuksena tavallista mallia. Aja vaikeimmat testitapauksesi molempien mallien läpi. Jos Pro tuottaa johdonmukaisesti parempia tuloksia tietyssä työkuormassa, vaihda vain kyseiset kutsut Pro-malliin ja pidä kaikki muu tavallisessa mallissa.
Migraatio GPT-5.3 Codexista
Jos käytät tällä hetkellä GPT-5.3 Codexia (tai GPT-5.2-Codexia), tässä ovat keskeiset erot suunnittelua varten.
Mikä muuttuu
| Alue | GPT-5.3 Codex | GPT-5.4 |
|---|---|---|
| Malli-ID | gpt-5.3-codex | gpt-5.4 |
| Konteksti-ikkuna | 1,000,000 tokens | 1,050,000 tokens |
| Tietokoneen käyttö | Ei saatavilla | Natiivi tuki |
| Päättelypanos | Tuettu | Tuettu (sama parametri) |
| Hinnoittelu (syöte) | Vaihtelee varianteittain | $2.50 / 1M tokens |
| Hinnoittelu (tuloste) | Vaihtelee varianteittain | $15.00 / 1M tokens |
| Token-tehokkuus | Perustaso | 47% vähemmän tokeneita monimutkaisissa tehtävissä |
Migraation muistilista
- Vaihda malli-ID. Muuta
gpt-5.3-codexmuotoongpt-5.4API-kutsuissasi. - Testaa päättelypanoksen asetukset. Samat tasot ovat olemassa (
none-xhigh), mutta GPT-5.4 saattaa tuottaa erilaisia hinta-laatu-valintoja kullakin tasolla. Arvioi oletusarvosi uudelleen. - Tarkista tulostetokenien budjetit. GPT-5.4 on tiiviimpi (47% vähemmän tokeneita monimutkaisissa tehtävissä). Voit ehkä laskea
max_completion_tokens-arvoa ja säästää tulostekustannuksissa. - Arvioi tietokoneen käyttö. Jos sinulla oli kiertoteitä käyttöliittymäautomaatioon (Selenium-skriptit, omat työkalut), GPT-5.4:n natiivi tietokoneen käyttö saattaa korvata ne.
- Seuraa 272K lisämaksua. Jos Codex-työkuormasi käyttivät suuria konteksteja, mutta pysyivät Codexin hinnoittelurakenteessa, laske kustannukset uudelleen GPT-5.4:n porrastetulla syötehinnoittelulla.
Mikä pysyy samana
- Chat Completions API -päätepiste on identtinen.
- Järjestelmä-, käyttäjä- ja avustajaviestien roolit toimivat samalla tavalla.
- Striimaus, funktioiden kutsuminen ja työkalujen käyttö ovat kaikki yhteensopivia.
reasoning-parametrin syntaksi on muuttumaton.
Benchmark-tulokset yhdellä silmäyksellä
Tässä on pikaopas siitä, miten GPT-5.4 suoriutuu kehittäjille tärkeimmissä testeissä:
| Benchmark | Tulos | Mitä se mittaa |
|---|---|---|
| SWE-Bench Pro | 57.7% | Monimutkainen todellinen ohjelmistokehitys |
| SWE-Bench Verified | ~80% | Kuratoitu GitHub-ongelmien ratkaisu |
| Terminal-Bench 2.0 | 75.1% | Terminaalipohjainen koodaus ja järjestelmätehtävät |
| OSWorld | 75.0% | Työpöytätietokoneen käyttö (ihmisen perustaso: 72.4%) |
| GDPval | 83% | Ammatillinen asiantuntijatyö 44 eri ammatissa |
Muita laatumittareita:
- 33% vähemmän faktavirheitä verrattuna GPT-5.2-malliin.
- 18% vähemmän virheitä sisältäviä vastauksia kaiken kaikkiaan.
Yhteenveto
GPT-5.4 ei ole vallankumouksellinen API-muutos -- se on käytännöllinen päivitys. Sama päätepiste, sama viestimuoto, samat työkalujen käyttömallit. Uutta on se, että sinulla on nyt hienojakoinen hallinta päättelyn laskentatehoon, natiivi tietokoneen käyttö ilman kolmannen osapuolen työkaluja, riittävän suuri konteksti-ikkuna kokonaisille koodikannoille ja huomattavasti parempi koodituloste.
Kolme asiaa, jotka kannattaa tehdä heti:
- Aseta
reasoning.efforttarkoituksella. Älä luota oletusarvoon jokaisessa kutsussa. Sovita päättelytaso tehtävän monimutkaisuuteen sekä viive- ja kustannusbudjettiisi. - Kokeile tietokoneen käyttöä. Jos sinulla on käyttöliittymän automaatiotyönkulkuja, testaa niitä GPT-5.4:n natiiveilla ominaisuuksilla. Saatat voida poistaa käytöstä hauraat Selenium-skriptit.
- Auditoi kontekstin käyttösi. 272K lisämaksurajan ja 1M ikkunan myötä voit säästää (tai tuhlata) oikeaa rahaa riippuen siitä, miten muotoilet kehotteesi.
Malli on nyt saatavilla tunnisteella gpt-5.4 Tier 1+ API-tileille. Aloita rakentaminen.