Qual é a diferença entre o GPT-5.4 e o GPT-5.2?

O GPT-5.4 adiciona Computer Use (controle de tela), uma context window de 1M de tokens (aumentada de 128K), geração de imagens nativa e reasoning aprimorado. Ele também introduz uma nova Responses API substituindo o formato antigo Chat Completions para novos recursos.

O GPT-5.4 é mais rápido que o GPT-5.2?

O GPT-5.4 é comparável em velocidade ao GPT-5.2 para consultas padrão. No entanto, com os controles de reasoning effort (low/medium/high), o GPT-5.4 permite trocar velocidade por profundidade — low effort é mais rápido que o GPT-5.2, enquanto high effort é mais lento, porém mais preciso.

O GPT-5.4 custa mais que o GPT-5.2?

O preço da API é semelhante: o GPT-5.4 custa aproximadamente $10/$30 por milhão de tokens de input/output. As assinaturas do ChatGPT Plus ($20/month) e Pro ($200/month) incluem acesso a ambos os modelos, portanto não há custo extra para usuários Plus/Pro.

Devo fazer o upgrade do GPT-5.2 para o GPT-5.4?

Sim, para a maioria dos casos de uso. O Computer Use do GPT-5.4, a context window maior e o reasoning aprimorado o tornam estritamente melhor. O único motivo para permanecer no GPT-5.2 é se você tiver código de produção fortemente acoplado ao formato de API antigo e ainda não puder migrar.

O GPT-5.4 pode substituir o GPT-5.2 como um drop-in?

Para chamadas de Chat Completions API, sim — basta alterar o nome do modelo. Para novos recursos como Computer Use, você precisa da Responses API. O código existente do GPT-5.2 continuará funcionando com o GPT-5.4 sem alterações.

Основные выводы

Computer Use — главное обновление: GPT-5.4 может автономно управлять десктопными приложениями, заполнять формы и выполнять многоэтапные рабочие процессы — GPT-5.2 этого не умеет, а показатель 75% в OSWorld превосходит экспертов-людей (72.4%).
Окно контекста увеличивается с 400K до 1M tokens: Если вы работаете с большими кодовыми базами, длинными документами или многоходовыми сессиями агентов, это существенное улучшение, хотя стоимость input удваивается при превышении 272K tokens.
На 47% эффективнее в использовании tokens: GPT-5.4 генерирует более лаконичные ответы в сложных задачах, что может компенсировать его чуть более высокую стоимость за token ($2.50 против $1.75 за миллион input tokens).
Прямая замена для Chat Completions: Просто измените название модели в существующем коде GPT-5.2 — однако новые функции, такие как Computer Use и Tool Search, требуют Responses API.
GPT-5.2 Thinking выводится из эксплуатации June 5, 2026: Планируйте миграцию сейчас, так как GPT-5.4 однозначно лучше для всех сценариев использования, за исключением продакшн-кода, тесно связанного со старым форматом API.

GPT-5.4 против GPT-5.2: Что изменилось и стоит ли обновляться?

March 2026 — OpenAI выпустила GPT-5.4 в начале March 2026, всего через три месяца после GPT-5.2. Если вы разработчик или продвинутый пользователь, уже использующий GPT-5.2, вопрос прост: стоит ли переходить на GPT-5.4 или это незначительное обновление, которое можно пропустить?

Краткий ответ: обновляйтесь. GPT-5.4 — это не инкрементальное обновление. Это первая модель общего назначения с нативной поддержкой Computer Use, расширенным контекстом до 1M tokens, превосходящая людей-экспертов в бенчмарке автоматизации десктопа OSWorld. Ниже приведено все необходимое, чтобы принять решение и выполнить миграцию.

Краткий ответ

Да, вам стоит обновиться. Вот три основные причины:

Computer Use — это новая категория возможностей. GPT-5.4 может видеть экран, нажимать кнопки, заполнять формы и автономно перемещаться по приложениям. GPT-5.2 этого не умеет.
Окно контекста увеличивается с 400K до 1M tokens (экспериментально). Если вы работаете с большими кодовыми базами, длинными документами или многоходовыми сессиями агентов, это существенное улучшение.
Реальный рост показателей в бенчмарках. GPT-5.4 набирает 75.0% в OSWorld (люди набирают 72.4%), 57.7% в SWE-Bench Pro (по сравнению с 55.6%) и 92.8% в GPQA Diamond (по сравнению с 92.4%).

Даже если ваш рабочий процесс не требует Computer Use или длинного контекста, GPT-5.4 все равно лучше — она эффективнее в использовании tokens (на 47% меньше tokens в сложных задачах) и включает в себя передовые возможности кодинга от GPT-5.3-codex.

Что нового в GPT-5.4

Вот полный список новых и улучшенных возможностей по сравнению с GPT-5.2:

Нативный Computer Use. Автономное управление экраном — просмотр веб-страниц, работа в десктопных приложениях, заполнение форм и выполнение многоэтапных рабочих процессов без специальных инструментов. Результат 75.0% в OSWorld превосходит показатели людей-экспертов (72.4%).
Окно контекста 1M Token. Доступно экспериментально в Codex и через API (272K стандартно, 1M при настройке). GPT-5.2 ограничивался 400K.
Tool Search. Для приложений с большими экосистемами инструментов GPT-5.4 интеллектуально ищет и выбирает нужный инструмент вместо сканирования описаний каждого из них. Это сократило общее использование tokens на 47% в тестах OpenAI при сохранении точности.
Coding DNA от GPT-5.3-codex. GPT-5.4 — первая основная модель с Reasoning, вобравшая в себя передовые возможности кодинга от GPT-5.3-codex, специализированной модели OpenAI для написания кода.
Улучшенный Deep Web Research. Более качественная обработка узкоспециализированных запросов с лучшим удержанием контекста во время длительного процесса мышления.
Управление Reasoning Effort. Точная настройка уровней усилий от none до xhigh, позволяющая балансировать между задержкой и глубиной проработки для каждого отдельного запроса.
Лучшая эффективность tokens. GPT-5.4 более лаконична — на 47% меньше tokens в сложных задачах — что может компенсировать ее чуть более высокую стоимость за token.

Таблица прямого сравнения

Характеристика	GPT-5.2	GPT-5.4
Дата выпуска	December 2025	March 2026
Окно контекста	400K tokens	272K standard / 1M experimental
Computer Use	Нет	Да (нативно)
Tool Search	Нет	Да
Наследование кодинга	Базовая GPT-5	Интеграция GPT-5.3-codex
SWE-Bench Pro	55.6%	57.7%
SWE-Bench Verified	--	80.0%
GPQA Diamond	92.4% (Thinking)	92.8%
OSWorld	N/A	75.0% (суперчеловеческий)
ARC-AGI-2	52.9% (Thinking)	73.3%
AIME 2025	100%	100%
GDPval	70.9% наравне/выше экспертов	83.0%
Terminal-Bench 2.0	--	75.1%
API Input Price	$1.75 / 1M tokens	$2.50 / 1M tokens
API Output Price	$14.00 / 1M tokens	$15.00 / 1M tokens
Pro Input Price	--	$30.00 / 1M tokens
Pro Output Price	--	$180.00 / 1M tokens
Скорость Output	~68 tokens/sec	Сопоставимая
Reasoning Effort	от none до xhigh	от none до xhigh
Доступность в ChatGPT	Plus, Team, Pro (legacy после June 2026)	Plus, Team, Pro (по умолчанию)

Подробный разбор: Что на самом деле изменилось

Computer Use

Это главная функция и причина, по которой GPT-5.4 — это не просто минорное обновление. Computer Use означает, что модель может автономно взаимодействовать с экраном компьютера — нажимать кнопки, печатать, прокручивать и перемещаться между приложениями.

На практике это позволяет выполнять такие рабочие процессы, как: "Зайди на корпоративный HR-портал, скачай мой последний расчетный листок и отправь его моему бухгалтеру по электронной почте". GPT-5.2 могла составить черновик письма, но не могла ориентироваться на портале или скачивать файл.

В бенчмарке OSWorld, который измеряет автономное выполнение задач на рабочем столе, GPT-5.4 набирает 75.0%. Люди-эксперты набирают 72.4%. Это первый случай, когда какая-либо модель AI превзошла людей в этом тесте. Для разработчиков, создающих AI-агентов, Computer Use устраняет целые категории хрупких скриптов автоматизации браузера и кастомных интеграций.

Computer Use доступен через Responses API — он не поддерживается через старый эндпоинт Chat Completions.

Окно контекста 1M Token

GPT-5.2 поддерживала до 400K tokens контекста. GPT-5.4 по умолчанию использует 272K, но может быть настроена до 1M tokens экспериментально в Codex и через API.

Практический эффект: вы можете загрузить всю кодовую базу среднего размера в один prompt, поддерживать многочасовые сессии агентов без потери контекста или обрабатывать документы объемом с книгу за один проход. Обратите внимание, что надбавка за длинный контекст удваивает тариф за input tokens до $5.00 за 1M tokens, как только вы переходите порог в 272K.

Улучшения в Reasoning

Рост Reasoning в GPT-5.4 измерим, но не является драматическим в стандартных бенчмарках. GPQA Diamond вырос с 92.4% до 92.8%. Улучшение более заметно в ARC-AGI-2 (с 52.9% до 73.3%), который измеряет общие способности к рассуждению, и GDPval (с 70.9% до 83.0%), который тестирует профессиональную интеллектуальную работу в 44 профессиях.

Элементы управления Reasoning Effort (none, low, medium, high, xhigh) позволяют проводить калибровку для каждого запроса. Простая задача классификации может выполняться с уровнем low для быстрых и дешевых ответов, в то время как сложное архитектурное решение может потребовать xhigh для максимальной глубины.

Генерация изображений

GPT-5.4 включает нативные возможности генерации изображений. В то время как GPT-5.2 могла обрабатывать визуальные данные (vision), GPT-5.4 может как понимать, так и генерировать изображения внутри одной модели, устраняя необходимость в отдельном вызове DALL-E во многих рабочих процессах.

Responses API и Tool Search

GPT-5.4 спроектирована под Responses API, который заменяет старый формат Chat Completions для новых функций. Chat Completions по-прежнему работает для базовой генерации текста, но Computer Use, Tool Search и расширенные функции Reasoning требуют Responses API.

Tool Search особенно важен для разработчиков, создающих агентов с большим количеством инструментов. Вместо того чтобы включать описание каждого инструмента в prompt (что расходует tokens и может запутать модель), Tool Search позволяет GPT-5.4 интеллектуально запрашивать и выбирать подходящие инструменты из большого реестра. OpenAI сообщает о сокращении использования tokens на 47% при сохранении точности.

Сравнение бенчмарков

Ниже представлено сравнение GPT-5.4 и GPT-5.2 в ключевых бенчмарках с учетом показателей конкурирующих моделей.

Кодинг

Бенчмарк	GPT-5.2 (Thinking)	GPT-5.4	Примечания
SWE-Bench Pro	55.6%	57.7%	Решение реальных проблем GitHub
SWE-Bench Verified	--	80.0%	Проверенная подвыборка
Terminal-Bench 2.0	--	75.1%	Задачи кодинга в терминале

Улучшения кодинга в GPT-5.4 напрямую связаны с интеграцией возможностей GPT-5.3-codex. Рост SWE-Bench Pro с 55.6% до 57.7% представляет собой значимое улучшение в реальных условиях — каждый процент соответствует десяткам дополнительных корректно решенных реальных проблем на GitHub.

Reasoning и знания

Бенчмарк	GPT-5.2 (Thinking)	GPT-5.4	Примечания
GPQA Diamond	92.4%	92.8%	Вопросы и ответы уровня аспирантуры
ARC-AGI-2	52.9%	73.3%	Общие способности к рассуждению
GDPval	70.9%	83.0%	Профессиональная интеллектуальная работа

Скачок в ARC-AGI-2 с 52.9% до 73.3% является наиболее значимым улучшением в отдельном бенчмарке, что указывает на существенный прогресс в абстрактном и общем логическом мышлении.

Математика

Бенчмарк	GPT-5.2 (Thinking)	GPT-5.4	Примечания
AIME 2025	100%	100%	Олимпиадная математика (достигнут потолок)
FrontierMath (T1-3)	40.3%	--	Математика экспертного уровня

Обе модели достигают идеальных результатов в AIME 2025. GPT-5.2 уже достигла потолка в олимпиадной математике, поэтому улучшения GPT-5.4 в математике более заметны в более сложных, менее насыщенных бенчмарках.

Computer Use (Новая категория)

Бенчмарк	GPT-5.2	GPT-5.4	Примечания
OSWorld	N/A	75.0%	Эксперты-люди: 72.4%

Эта категория бенчмарков не существовала для GPT-5.2, так как у модели полностью отсутствовали возможности Computer Use.

Сравнение цен

API Pricing

Уровень	GPT-5.2	GPT-5.4	Разница
Input (standard)	$1.75 / 1M tokens	$2.50 / 1M tokens	+43%
Output	$14.00 / 1M tokens	$15.00 / 1M tokens	+7%
Cached Input	$0.175 / 1M tokens	$1.25 / 1M tokens	Выше
Long-context Input (>272K)	N/A	$5.00 / 1M tokens	Новая надбавка
Pro Input	--	$30.00 / 1M tokens	Премиум-уровень
Pro Output	--	$180.00 / 1M tokens	Премиум-уровень

GPT-5.4 примерно в 1.1 раза дороже в пересчете на один token. Однако, поскольку GPT-5.4 генерирует на 47% меньше tokens в сложных задачах, общая стоимость одной задачи может фактически оказаться ниже. Если вы выполняете инференс в больших объемах, протестируйте свои конкретные рабочие нагрузки, прежде чем предполагать рост затрат.

Стоимость подписки ChatGPT

План	Цена	Доступ к GPT-5.2	Доступ к GPT-5.4
Free	$0/month	Ограничен	Ограничен
Plus	$20/month	Да (legacy)	Да (по умолчанию)
Team	$25/user/month	Да (legacy)	Да (по умолчанию)
Pro	$200/month	Да (legacy)	Да (по умолчанию, макс. лимиты)

Для подписчиков ChatGPT дополнительная плата не взимается. GPT-5.4 заменяет GPT-5.2 в качестве модели по умолчанию. GPT-5.2 остается доступной в разделе Legacy Models до June 5, 2026, после чего она будет выведена из эксплуатации.

Руководство по миграции: Как перейти с GPT-5.2 на GPT-5.4

Шаг 1: Измените название модели

Для базовых вызовов Chat Completions API замените идентификатор модели:

# До
response = client.chat.completions.create(
    model="gpt-5.2",
    messages=[{"role": "user", "content": "Hello"}]
)

# После
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Hello"}]
)

Это работает как прямая замена. Ваш существующий код будет выдавать результаты без каких-либо других изменений.

Шаг 2: Внедрите Responses API для новых функций

Computer Use, Tool Search и расширенные функции Reasoning требуют использования Responses API. Если вам нужны эти возможности, переведите ваши вызовы API:

# Responses API с Computer Use
response = client.responses.create(
    model="gpt-5.4",
    tools=[{"type": "computer_use_preview"}],
    input="Navigate to github.com and star the repo"
)

OpenAI предоставляет подробное руководство по миграции на platform.openai.com/docs/guides/migrate-to-responses.

Шаг 3: Настройте Reasoning Effort

Протестируйте настройки Reasoning Effort. GPT-5.4 может предлагать другие компромиссы по качеству на каждом уровне по сравнению с GPT-5.2:

response = client.responses.create(
    model="gpt-5.4",
    reasoning={"effort": "high"},
    input="Analyze this architecture for potential race conditions..."
)

Используйте low для простых задач (классификация, извлечение данных), medium для общих запросов и high или xhigh для сложных задач рассуждения.

Шаг 4: Сохраняйте Phase Metadata

Это критически важная деталь для продакшн-систем. При использовании Responses API с GPT-5.4 вы должны корректно сохранять поле phase в сообщениях ассистента при восстановлении истории диалога. Потеря Phase Metadata приводит к значительному снижению производительности. В GPT-5.2 об этом можно было не беспокоиться.

Шаг 5: Оптимизируйте бюджеты tokens

GPT-5.4 более лаконична. Возможно, вы сможете снизить значение max_completion_tokens и сэкономить на затратах на output. Протестируйте это на своих реальных prompts и внесите соответствующие коррективы.

Когда стоит остаться на GPT-5.2

Есть несколько веских причин отложить миграцию:

Критически важный для продакшена код без бюджета на тестирование. Если у вас есть системы с тщательно настроенными prompts, работающие на GPT-5.2, и вы не можете позволить себе регрессионное тестирование, оставайтесь на старой модели, пока не проведете тесты. GPT-5.4 подходит для простых вызовов, но характеристики ответов будут отличаться.
Оптимизация затрат на старых, более дешевых моделях. Если вы выполняете задачи с большим объемом данных и низкой сложностью (классификация, извлечение, саммаризация), где важна каждая доля цента, более низкая цена input в GPT-5.2 ($1.75 против $2.50 за 1M tokens) может быть предпочтительнее. Тем не менее, эффективность GPT-5.4 в использовании tokens часто компенсирует наценку за token.
Обработка Phase Metadata. Если ваше промежуточное ПО удаляет или изменяет метаданные сообщений ассистента и вы не можете быстро обновить его, производительность GPT-5.4 упадет. Сначала исправьте промежуточное ПО, а затем проводите миграцию.
Давление жестких дедлайнов. GPT-5.2 никуда не денется до June 5, 2026. Если вы находитесь в окне критического запуска, нет причин рисковать. Мигрируйте после дедлайна.

Для всех остальных причин оставаться на GPT-5.2 нет. Она переводится в категорию Legacy Models и будет отключена в June 2026.

Итог

GPT-5.4 — это не минорное обновление версии. Она вводит совершенно новую возможность (Computer Use), значительно расширяет контекст (1M tokens), обеспечивает измеримые улучшения в бенчмарках по кодингу и Reasoning, а также повышает эффективность использования tokens почти на 50% в сложных задачах.

Для разработчиков путь миграции прост: измените название модели для мгновенной совместимости, внедрите Responses API для новых функций и настройте Reasoning Effort под свою нагрузку. Увеличение цены умеренное (примерно в 1.1 раза за token) и, скорее всего, будет компенсировано эффективностью tokens в большинстве сценариев использования.

GPT-5.2 будет выведена из эксплуатации June 5, 2026. Вопрос не в том, стоит ли мигрировать, а в том, когда. Для большинства команд ответ — сейчас.

NxCode

GPT-5.4 vs GPT-5.2: O que mudou e você deve fazer o upgrade? (2026)