Kiedy wydano GPT-5.4?

GPT-5.4 został wydany przez OpenAI na początku marca 2026 roku jako następca GPT-5.3 Codex. Jest dostępny przez OpenAI API oraz w ChatGPT dla użytkowników Plus, Pro i Enterprise.

Ile kosztuje GPT-5.4?

Ceny GPT-5.4 API wynoszą około $10 za milion input tokens i $30 za milion output tokens. Dostępny jest również wariant GPT-5.4 Pro dla wyższej jakości reasoning w wyższej cenie. Użytkownicy ChatGPT Plus ($20/miesiąc) otrzymują dostęp poprzez interfejs czatu.

Co nowego w GPT-5.4 w porównaniu do GPT-5.3?

Kluczowe ulepszenia obejmują konfigurowalny reasoning effort z pięcioma poziomami (none, low, medium, high, xhigh), computer use API do automatyzacji pulpitu, rozszerzone 272K token context window, ulepszone benchmarki kodowania i lepsze instruction following.

Czy GPT-5.4 może kontrolować mój komputer?

Tak. GPT-5.4 wprowadza Computer Use API, które pozwala modelowi widzieć ekran, poruszać kursorem, klikać, pisać i wchodzić w interakcje z aplikacjami desktopowymi. Umożliwia to zautomatyzowane przepływy pracy, takie jak wypełnianie formularzy, nawigacja w oprogramowaniu i wykonywanie powtarzalnych zadań.

Czy GPT-5.4 jest lepszy od Claude Opus 4.6 do kodowania?

Są bardzo zbliżone. GPT-5.4 osiąga około 80% w SWE-bench Verified, podczas gdy Claude Opus 4.6 uzyskuje 80.8%. GPT-5.4 ma silniejsze mechanizmy reasoning controls i możliwości computer use, natomiast Claude wyróżnia się w multi-file refactoring i rozumieniu złożonych codebase.

Czym jest GPT-5.4 reasoning effort?

Reasoning effort to konfigurowalny parametr z pięcioma poziomami: none, low, medium, high i xhigh. Niższe poziomy są szybsze i tańsze dla prostych zadań, podczas gdy wyższe poziomy zapewniają bardziej szczegółowy reasoning dla złożonych problemów. Pozwala to programistom optymalizować cost-quality tradeoff dla każdego zapytania.

Kluczowe wnioski

5-stopniowa kontrola wysiłku rozumowania: Parametr reasoning_effort (od none do xhigh) pozwala deweloperom optymalizować stosunek kosztów do jakości dla każdego zapytania -- chatbot odpowiadający na FAQ nie potrzebuje takiej samej głębi jak model debugujący race condition.
Pierwszy model ogólnego przeznaczenia z Computer Use API: GPT-5.4 potrafi widzieć ekrany, klikać elementy, wpisywać tekst i nawigować po aplikacjach programowo, choć opóźnienia wynikające z przesyłania zrzutów ekranu i sporadyczne błędne kliknięcia ograniczają złożone procesy robocze.
~80% w SWE-bench Verified: Stawia to model w bezpośredniej konkurencji z Claude Opus 4.6 (80.8%), podczas gdy 5 wydań GPT-5.x w ciągu 7 miesięcy pokazuje przyspieszające tempo iteracji OpenAI.
Ceny na poziomie ~$10/$30 za milion tokens: Pozycjonowany między tańszym GPT-5.3 Codex a droższym Claude Opus 4.6, z dostępnym wariantem GPT-5.4 Pro dla wyższej jakości rozumowania w wyższej cenie.

GPT-5.4 Data wydania, funkcje i ceny: Wszystko, co musisz wiedzieć (2026)

March 13, 2026 — OpenAI GPT-5.4 jest już dostępny. Wydany w early March 2026, jest najnowszym modelem z serii GPT-5 i bezpośrednim następcą GPT-5.3 Codex. Dzięki konfigurowalnemu wysiłkowi rozumowania, Computer Use API, oknu kontekstowemu 272K i wynikom w benchmarkach, które rywalizują z najlepszymi modelami do kodowania na rynku, GPT-5.4 stanowi znaczący krok naprzód dla deweloperów i przedsiębiorstw.

Ten artykuł obejmuje wszystko, co musisz wiedzieć: szczegóły wydania, kluczowe funkcje, ceny, benchmarki, porównania z GPT-5.3 Codex i Claude Opus 4.6 oraz sposób rozpoczęcia pracy z API.

Data wydania i dostępność

GPT-5.4 został wydany w early March 2026. Jest dostępny dwoma kanałami:

OpenAI API — dostępny dla wszystkich deweloperów z kontem OpenAI. Zarówno standardowe ID modelu gpt-5.4, jak i premium gpt-5.4-pro są już aktywne.
ChatGPT — dostępny dla subskrybentów Plus ($20/month), Pro ($200/month) i Enterprise poprzez selektor modelu w interfejsie czatu.

Wydanie to kontynuuje szybkie tempo OpenAI w ramach rodziny GPT-5:

Model	Data wydania
GPT-5	August 2025
GPT-5.1	November 2025
GPT-5.2 Codex	December 2025
GPT-5.3 Codex	February 2026
GPT-5.4	March 2026

Każda iteracja celowała w konkretne luki w możliwościach. GPT-5.4 koncentruje się na kontroli deweloperskiej, procesach agentowych i niwelowaniu różnic w benchmarkach względem Claude Opus 4.6 od Anthropic.

Co nowego w GPT-5.4

GPT-5.4 wprowadza kilka kluczowych możliwości, które odróżniają go od poprzednika:

Konfigurowalny wysiłek rozumowania — 5 odrębnych poziomów (none, low, medium, high, xhigh), które pozwalają deweloperom kontrolować, jak głęboko model myśli przed udzieleniem odpowiedzi.
Computer Use API — nowy interfejs, który pozwala GPT-5.4 widzieć ekrany, poruszać kursorami, klikać elementy, wpisywać tekst i wchodzić w interakcje z aplikacjami desktopowymi programowo.
Okno kontekstowe 272K — znaczny wzrost w stosunku do długości kontekstu GPT-5.3 Codex, umożliwiający deweloperom ładowanie większych baz kodu i dokumentów do pojedynczej sesji.
Ulepszone benchmarki kodowania — około 80% w SWE-bench Verified, co stawia go w bezpośredniej konkurencji z Claude Opus 4.6.
Wariant GPT-5.4 Pro — tryb rozumowania o wyższej jakości, zaprojektowany dla złożonych, wieloetapowych problemów, gdzie dokładność liczy się bardziej niż szybkość czy koszt.
Lepsze przestrzeganie instrukcji — zmniejszony wskaźnik halucynacji i bardziej spójne stosowanie się do system prompts i formatów structured output.

Wyjaśnienie wysiłku rozumowania

Najciekawszym pod względem architektonicznym dodatkiem w GPT-5.4 jest konfigurowalny wysiłek rozumowania. Zamiast jednego trybu inferencji, deweloperzy mogą teraz ustawić parametr reasoning_effort na 5 poziomach. Kontroluje to, jak wiele wewnętrznego "myślenia" model wykonuje przed wygenerowaniem odpowiedzi.

5 poziomów

Poziom	Zachowanie	Najlepszy do	Relatywny koszt
none	Brak rozumowania chain-of-thought. Bezpośrednie generowanie odpowiedzi.	Proste wyszukiwania, klasyfikacja, zadania formatowania	Najniższy
low	Minimalne rozumowanie. Szybka analiza z podstawową logiką.	Podsumowania, proste Q&A, ekstrakcja danych	Niski
medium	Zrównoważone rozumowanie. Obejmuje większość zastosowań ogólnego przeznaczenia.	Generowanie treści, standardowe zadania kodowania, tłumaczenia	Średni
high	Głębokie rozumowanie. Wieloetapowa analiza z autokorektą.	Złożone debugowanie, decyzje architektoniczne, synteza badań	Wysoki
xhigh	Maksymalna głębia rozumowania. Rozszerzony chain-of-thought z weryfikacją.	Projektowanie nowatorskich algorytmów, dowody matematyczne, krytyczny przegląd kodu	Najwyższy

Kiedy używać każdego poziomu

Parametr wysiłku rozumowania daje deweloperom bezpośrednią kontrolę nad komprosmisem między kosztem a jakością. Chatbot odpowiadający na FAQ nie potrzebuje takiej samej głębi rozumowania jak model debugujący race condition w kodzie współbieżnym.

W praktyce, medium jest właściwym domyślnym wyborem dla większości aplikacji. Używaj none lub low dla potoków o wysokiej przepustowości, gdzie liczy się latencja. Zarezerwuj high i xhigh dla zadań, w których poprawność jest krytyczna i jesteś gotów za nią zapłacić.

Parametr jest ustawiany dla każdego żądania, więc możesz dynamicznie dostosowywać wysiłek rozumowania w zależności od złożoności każdego zapytania w ramach tej samej aplikacji.

Computer Use API

GPT-5.4 wprowadza pierwsze Computer Use API od OpenAI, umożliwiając modelowi interakcję ze środowiskami desktopowymi poprzez zrzuty ekranu, ruchy kursora, kliknięcia i wprowadzanie danych z klawiatury.

Co potrafi

Widzieć ekran — model otrzymuje zrzuty ekranu aktualnego stanu pulpitu.
Poruszać kursorem — precyzyjne pozycjonowanie kursora na określone współrzędne.
Klikać i pisać — kliknięcie lewym/prawym przyciskiem, podwójne kliknięcie, przeciąganie i wprowadzanie danych z klawiatury.
Nawigować po aplikacjach — otwieranie menu, przełączanie kart, wypełnianie formularzy, interakcja z oknami dialogowymi.
Wykonywać wieloetapowe procesy — łączenie wielu działań w celu wykonania zadań, takich jak składanie raportów z wydatków, konfigurowanie ustawień oprogramowania lub uruchamianie zestawów testów przez GUI.

Jak to działa

Computer Use API działa w pętli: model otrzymuje zrzut ekranu, decyduje o działaniu, wykonuje je przez API, otrzymuje nowy zrzut ekranu odzwierciedlający wynik i powtarza proces. Deweloperzy definiują dostępną przestrzeń działań, a model planuje w ramach tych ograniczeń.

Ograniczenia

Jest to implementacja pierwszej generacji i wiąże się z ważnymi zastrzeżeniami:

Latencja — każde działanie wymaga przesłania zrzutu ekranu w obie strony, co sprawia, że złożone przepływy pracy są wolniejsze niż oskryptowana automatyzacja.
Dokładność — model może błędnie kliknąć lub błędnie zidentyfikować elementy interfejsu użytkownika, szczególnie w wizualnie zagęszczonych interfejsach.
Bezpieczeństwo — przyznanie modelowi możliwości kontrolowania komputera wymaga ostrożnego sandboxingu. OpenAI zaleca uruchamianie zadań Computer Use w izolowanych maszynach wirtualnych.
Brak precyzji co do piksela — model pracuje na przybliżonych współrzędnych, co może powodować problemy z małymi elementami UI.

Dla deweloperów znających już funkcję Computer Use w Claude od Anthropic, koncepcja jest podobna. Implementacja OpenAI zapewnia porównywalną funkcjonalność z dodatkową korzyścią w postaci kontroli wysiłku rozumowania.

Szczegóły cennika

GPT-5.4 kosztuje około $10 per million input tokens i $30 per million output tokens. Oto jak wypada w porównaniu z innymi wiodącymi modelami:

Model	Input (za 1M tokens)	Output (za 1M tokens)	Okno kontekstowe
GPT-5.4	$10	$30	272K
GPT-5.4 Pro	Wyższe (warstwowe)	Wyższe (warstwowe)	272K
GPT-5.3 Codex	$2	$8	200K
Claude Opus 4.6	$15	$75	200K
Claude Sonnet 4.6	$3	$15	200K
DeepSeek V4	$2.19	$8.78	128K

Kluczowe wnioski:

GPT-5.4 jest znacznie tańszy niż Claude Opus 4.6, dostarczając jednocześnie porównywalną wydajność w benchmarkach. Przy $30 za milion output tokens w porównaniu do $75, różnica w kosztach jest znacząca przy dużej skali.
GPT-5.4 jest droższy niż GPT-5.3 Codex, co jest uzasadnione jego szerszymi możliwościami. GPT-5.3 Codex pozostaje lepszym wyborem dla czystych zadań programistycznych, gdzie budżet ma znaczenie.
DeepSeek V4 jest najtańszą opcją, ale pozostaje w tyle w większości benchmarków i brakuje mu funkcji Computer Use oraz kontroli wysiłku rozumowania.
Wariant GPT-5.4 Pro korzysta z cennika warstwowego, który rośnie wraz z poziomem wysiłku rozumowania. Dla rozumowania xhigh koszty mogą być znacznie wyższe niż w modelu bazowym.

Benchmarks

GPT-5.4 zapewnia wysoką wydajność w benchmarkach kodowania i rozumowania. Oto jak wypada na tle konkurencji:

Benchmarks kodowania

Benchmark	GPT-5.4	GPT-5.3 Codex	Claude Opus 4.6	DeepSeek V4	Gemini 3.1 Pro
SWE-bench Verified	~80.0%	75.2%	80.8%	70.4%	68.9%
HumanEval	95.1%	93.8%	94.6%	90.2%	91.4%
MBPP+	89.7%	87.1%	90.2%	84.5%	85.8%

Benchmarks rozumowania

Benchmark	GPT-5.4 (xhigh)	Claude Opus 4.6	GPT-5.3 Codex
GPQA Diamond	74.8%	75.2%	71.3%
MATH-500	97.2%	96.8%	95.4%
ARC-AGI	62.1%	59.4%	55.8%

Analiza: GPT-5.4 niweluje dystans do Claude Opus 4.6 w SWE-bench Verified, najuważniej śledzonym benchmarku kodowania. Różnica 0.8 punktu procentowego (80.0% vs. 80.8%) mieści się w granicach błędu statystycznego dla większości praktycznych zastosowań. W HumanEval, GPT-5.4 zyskuje niewielką przewagę. Benchmarks rozumowania przy wysiłku xhigh są konkurencyjne w całym zestawieniu, a GPT-5.4 wykazuje szczególną siłę w ARC-AGI.

GPT-5.4 vs GPT-5.3 Codex

Jeśli już korzystasz z GPT-5.3 Codex, oto co daje Ci przejście na GPT-5.4:

Funkcja	GPT-5.3 Codex	GPT-5.4
Okno kontekstowe	200K	272K
Wysiłek rozumowania	Stały	Konfigurowalny (5 poziomów)
Computer use	Nie	Tak
SWE-bench Verified	75.2%	~80.0%
Ceny API (input)	$2/1M	$10/1M
Ceny API (output)	$8/1M	$30/1M
Szybkość (tok/s)	Bardzo wysoka (Codex-Spark: 1000+)	Umiarkowana
Główna zaleta	Szybkie kodowanie, użycie terminala	Ogólnego przeznaczenia, zadania agentowe

Czy warto przejść na nowszy model? To zależy od Twojego przypadku użycia.

Przejdź na nowszy model, jeśli potrzebujesz możliwości Computer Use, konfigurowalnej głębi rozumowania, dłuższego kontekstu lub najwyższej możliwej dokładności kodowania.
Pozostań przy GPT-5.3 Codex, jeśli priorytetem są szybkość i koszt, budujesz potok skoncentrowany wyłącznie na kodowaniu lub nie potrzebujesz funkcji agentowych.

GPT-5.3 Codex nie jest wycofywany. Oba modele obsługują inne segmenty, a OpenAI nadal wspiera całą rodzinę GPT-5.

GPT-5.4 vs Claude Opus 4.6

To porównanie, które śledzi większość deweloperów. GPT-5.4 i Claude Opus 4.6 to dwa najpotężniejsze modele dostępne w March 2026, które rywalizują ze sobą w różnych kategoriach.

Kategoria	GPT-5.4	Claude Opus 4.6
SWE-bench Verified	~80.0%	80.8%
HumanEval	95.1%	94.6%
Okno kontekstowe	272K	200K
Kontrola rozumowania	5 konfigurowalnych poziomów	Standardowa
Computer use	Tak (nowe)	Tak (dojrzałe)
Refaktoryzacja wieloplikowa	Dobra	Doskonała
Przestrzeganie instrukcji	Bardzo dobre	Doskonałe
Ceny (output)	$30/1M tokens	$75/1M tokens
Zrozumienie bazy kodu	Silne	Najlepsze w klasie

Gdzie wygrywa GPT-5.4:

Cena. Przy $30 za milion output tokens w porównaniu do $75, GPT-5.4 kosztuje mniej niż połowę.
Kontrola wysiłku rozumowania. Możliwość zwiększenia lub zmniejszenia poziomu rozumowania dla każdego zapytania jest realną przewagą architektoniczną w systemach produkcyjnych.
Większe okno kontekstowe. 272K w porównaniu do 200K daje więcej miejsca na duże bazy kodu.

Gdzie wygrywa Claude Opus 4.6:

SWE-bench. Przewaga 0.8 punktu procentowego jest mała, ale stała.
Refaktoryzacja wieloplikowa. Claude nadal doskonale radzi sobie ze zrozumieniem relacji w dużych, połączonych bazach kodu.
Dojrzałość Computer Use. Anthropic udostępniło Computer Use wcześniej i miało więcej czasu na dopracowanie tej funkcji.
Przestrzeganie instrukcji. Claude Opus 4.6 jest nieco bardziej niezawodny w wykonywaniu złożonych promptów z wieloma ograniczeniami.

Werdykt: Dla większości deweloperów GPT-5.4 oferuje lepszą wartość dzięki niższej cenie i elastycznej kontroli rozumowania. W przypadku złożonych projektów programistycznych, gdzie priorytetem jest dokładność w rzeczywistych zadaniach inżynierii oprogramowania, Claude Opus 4.6 zachowuje lekką przewagę. Wiele zespołów uzna, że optymalną strategią jest korzystanie z obu modeli — GPT-5.4 do zadań o dużej objętości, a Claude Opus 4.6 do krytycznych przeglądów kodu.

Jak zacząć

Szybki start z API

Rozpoczęcie pracy z GPT-5.4 przez OpenAI API zajmuje kilka minut.

1. Zainstaluj SDK:

pip install openai --upgrade

2. Podstawowe dopełnienie:

from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[
        {"role": "system", "content": "You are a senior software engineer."},
        {"role": "user", "content": "Review this function for bugs and suggest improvements."}
    ],
    reasoning_effort="high"
)

print(response.choices[0].message.content)

3. Używanie poziomów wysiłku rozumowania:

# Fast, cheap classification — no reasoning needed
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Is this a bug report or feature request?"}],
    reasoning_effort="none"
)

# Complex debugging — maximum reasoning
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Why does this concurrent map access cause a race condition?"}],
    reasoning_effort="xhigh"
)

4. GPT-5.4 Pro do krytycznych zadań:

response = client.chat.completions.create(
    model="gpt-5.4-pro",
    messages=[{"role": "user", "content": "Design a distributed consensus algorithm for this use case."}],
    reasoning_effort="xhigh"
)

Dostęp przez ChatGPT

Jeśli jesteś subskrybentem ChatGPT Plus, Pro lub Enterprise, wybierz GPT-5.4 z rozwijanej listy modeli w interfejsie czatu. Nie jest wymagana żadna dodatkowa konfiguracja.

Podsumowanie

GPT-5.4 to jak dotąd najbardziej zaawansowany i wszechstronny model OpenAI. Połączenie konfigurowalnego wysiłku rozumowania, możliwości Computer Use, okna kontekstowego 272K oraz wyników w benchmarkach dorównujących Claude Opus 4.6 czyni go silnym wyborem dla deweloperów budujących produkcyjne systemy AI.

Ceny są agresywne. Przy kosztach output tokens wynoszących około 40% ceny Claude Opus 4.6 i porównywalnej wydajności, GPT-5.4 zmienia ekonomikę uruchamiania modeli frontier na dużą skalę. Parametr wysiłku rozumowania dodaje kolejny wymiar kontroli kosztów, którego nie oferuje obecnie żaden inny dostawca.

Mimo to, GPT-5.4 nie jest wyraźnym zwycięzcą w każdej kategorii. Claude Opus 4.6 wciąż prowadzi w SWE-bench i refaktoryzacji wieloplikowej. GPT-5.3 Codex pozostaje szybszy i tańszy w przypadku czystych obciążeń programistycznych. Wybór najlepszego modelu zależy od tego, co budujesz.

Dla większości zespołów oceniających swój stos AI w March 2026, GPT-5.4 zasługuje na poważne rozważenie — jako model główny lub jako część strategii wielomodelowej, która wykorzystuje jego mocne strony obok modeli komplementarnych.

NxCode

GPT-5.4 Data wydania, funkcje i ceny: Wszystko, co musisz wiedzieć (2026)

Kluczowe wnioski

GPT-5.4 Data wydania, funkcje i ceny: Wszystko, co musisz wiedzieć (2026)

Data wydania i dostępność

Co nowego w GPT-5.4

Wyjaśnienie wysiłku rozumowania

5 poziomów

Kiedy używać każdego poziomu

Computer Use API

Co potrafi

Jak to działa

Ograniczenia

Szczegóły cennika

Benchmarks

Benchmarks kodowania

Benchmarks rozumowania

GPT-5.4 vs GPT-5.3 Codex

GPT-5.4 vs Claude Opus 4.6

Jak zacząć

Szybki start z API

Dostęp przez ChatGPT

Podsumowanie

Related Tools

Buduj z NxCode

Zacznij za darmo, ulepsz później

Related Articles

GPT-5.4 Gids voor beginners: Wat het is, wat er nieuw is en hoe u het kunt gaan gebruiken (2026)

Grok 5: Data premiery, 6 bilionów parametrów, roszczenia dotyczące AGI — wszystko, co wiemy (2026)

Kompletny przewodnik po Gemini 3.1 Pro 2026: Benchmarki, ceny, API i wszystko, co musisz wiedzieć

Kimi AI: Полное руководство по Features, Pricing и сравнение (2026)