2026 年有哪些 GPT-5 模型可用？

截至 2026 年 3 月，主要的 GPT-5 模型包括：GPT-5.3 Instant（快速日常使用）、GPT-5.2 Thinking（深度推理）、GPT-5.2-Codex（代理式編碼）、GPT-5.3-Codex（進階編碼）以及 GPT-5.3-Codex-Spark（在 Cerebras 上的實時編碼）。GPT-5.4 已經被洩漏，但尚未正式發佈。

GPT-5.2 和 GPT-5.3 有什麼區別？

GPT-5.2 是功能更強大的推理模型（Thinking 等級），最適合複雜任務、研究和分析。GPT-5.3 Instant 則針對速度和日常任務進行了優化，並減少了幻覺。ChatGPT 的自動 (Auto) 模式會根據任務複雜程度在兩者之間切換。

哪款 GPT-5 模型最適合編碼？

對於編碼，複雜工程任務請使用 GPT-5.2-Codex 或 GPT-5.3-Codex；若需每秒 1000+ token 的實時編碼，則使用 GPT-5.3-Codex-Spark。Codex 模型支援 xHigh 推理強度，以在困難問題上獲得最大準確度。

透過 API 使用 GPT-5 模型的費用是多少？

價格各異：GPT-5.3 Instant 每 100 萬輸入 Token 約 0.30 美元起。GPT-5.2 每 100 萬輸入為 1.75 美元，每 100 萬輸出為 14 美元。GPT-5.2-Codex 每 100 萬輸入為 1.75 美元。GPT-5.3-Codex-Spark 為高速推理提供具競爭力的價格。快取輸入 Token 可獲得高達 90% 的折扣。

GPT-5.4 何時發佈？

GPT-5.4 已因 Codex 代碼提交中引用「5.4 或更新版本」而不慎洩漏。OpenAI 於 2026 年 3 月 3 日發文稱「5.4 比你想像的更早」。預期功能包括 2M Token 的上下文視窗和全解析度圖像處理。目前尚無官方發佈日期。

OpenAI GPT-5 模型指南：GPT-5.2 vs 5.3 vs 5.4 — 您應該使用哪一個？ (2026)

2026 年 3 月 4 日 — 自 GPT-5.0 於 2025 年年中推出以來，OpenAI 的 GPT-5 系列迅速擴張。在不到八個月的時間裡，該陣容已從單一模型發展成為一個龐大的專業變體生態系統：日常助手、深度推理器、代理式編碼器和實時推理引擎。

問題在於？選擇正確的模型不再是一件顯而易見的事。 GPT-5.2 Thinking、GPT-5.3 Instant、GPT-5.2-Codex、GPT-5.3-Codex、GPT-5.3-Codex-Spark — 每個模型在不同的任務中表現出色，且價格各異。隨著 GPT-5.4 在幾天前被洩漏，形勢即將再次發生變化。

本指南將解析目前可用的所有 GPT-5 模型，對它們進行全面比較，並根據您的使用情境和預算提供明確的決策框架。

GPT-5 模型系列一覽

模型	發佈日期	最適合	上下文視窗	速度	推理能力
GPT-5.3 Instant	2026/3/3	日常任務、寫作、翻譯	400K	快	標準
GPT-5.2 Thinking	2025/12/11	複雜研究、分析、技術寫作	256K	中等	深度 (xHigh)
GPT-5.2-Codex	2026/1/14	代理式編碼、網路安全、軟體工程	400K	中等	深度 (xHigh)
GPT-5.3-Codex	2026/2	下一代代理式編碼	1M	中等	深度 (xHigh)
GPT-5.3-Codex-Spark	2026/2/12	實時編碼、即時回饋	128K	極快 (1000+ tok/s)	標準
GPT-5.4 (洩漏)	待定	通用旗艦模型	2M (預期)	未知	未知

GPT-5.3 Instant：日常工作的主力

GPT-5.3 Instant 於 2026 年 3 月 3 日發佈，取代 GPT-5.2 Instant 成為所有 ChatGPT 用戶的預設模型。API 模型名稱為 gpt-5.3-chat-latest。它具備 400K Token 的上下文視窗 — 這是從之前 128K 版本的巨大升級。

它的優勢

與 GPT-5.2 Instant 相比，配合網頁搜尋時的幻覺減少了 26.8%（不含搜尋則減少 19.7%）
反「尷尬」調優 — OpenAI 專門解決了曾困擾 GPT-5.2 Instant 的過度口語化風格（例如：「停下來。深呼吸。」）
減少不必要的拒絕 — 較不容易拒絕安全的問題或添加防禦性的免責聲明
更好的網頁綜合能力 — 提供更豐富、更具背景資訊的網頁搜尋結果，而非單純的連結堆砌
400K Token 上下文視窗 — 比上一代大 3 倍

誰應該使用它

GPT-5.3 Instant 是 大多數日常任務 的正確選擇：撰寫郵件、構思創意、總結文件、回答問題、翻譯內容以及一般寫作。它對所有 ChatGPT 方案開放（免費版：每 5 小時 10 條訊息，Plus 版：每 3 小時 160 條訊息）。GPT-5.2 Instant 將在「舊版模型 (Legacy Models)」下保留至 2026 年 6 月 3 日。

何時升級

如果您的任務需要深度的多步驟推理、處理複雜的試算表或持續的分析工作，GPT-5.2 Thinking 的表現將優於 GPT-5.3 Instant。好消息是：ChatGPT 的自動 (Auto) 模式會為您處理這種路由（詳見下文）。

GPT-5.2 Thinking：深度推理器

GPT-5.2 於 2025 年 12 月 11 日發佈，是 OpenAI 的旗艦推理模型。它分為三個等級運作 — Instant、Thinking 和 Pro — 每個等級代表不同的推理深度。

基準測試表現

GPT-5.2 在對現實世界推理最重要的基準測試中領先於競爭模型：

基準測試	GPT-5.2	Claude Opus 4.5	Gemini 3 Pro
GDPval (通用偏好)	70.9% 勝/平	59.6%	53.6%
ARC-AGI-2 (新穎推理)	52.9%	37.6%	31.1%
SWE-Bench Pro (軟體工程)	55.6%	—	—
MRCRv2 (256K 長上下文)	近乎完美	—	—

關鍵規格

上下文視窗： 256K Token，在整個視窗內具有近乎完美的召回率
知識截止日期： 2025 年 8 月 31 日
推理強度： 支援標準 (standard)、高 (high) 和 極高 (xHigh) 以獲得最大深度
定價： 每 100 萬輸入 Token 1.75 美元，每 100 萬輸出 Token 14.00 美元

誰應該使用它

GPT-5.2 Thinking 是以下情境的正確選擇：

研究與分析 — 綜合大型文件、比較數據集、識別模式
複雜技術寫作 — 白皮書、說明文件、深度指南
試算表與數據工作 — 財務建模、多步驟計算
法律與合規審查 — 需要仔細、逐步推理的任務
困難問題解決 — 任何需要模型「更深入思考」的情況

GPT-5.2-Codex：代理式編碼器

GPT-5.2-Codex 於 2026 年 1 月 14 日發佈，專為軟體工程打造。它不僅僅是一個編碼助手，更是一個代理式編碼模型 (Agentic coding model)，能夠自主規劃、執行並迭代多步驟工程任務。

它的獨特之處

上下文壓縮 (Context compaction) — 在長時間的編碼對話中智慧地壓縮上下文，使其能在擴展任務中保持工作連貫性
400K Token 上下文視窗 — 足以將整個代碼庫放入上下文中
網路安全焦點 — 專門針對漏洞分析和補救進行了訓練

基準測試表現

基準測試	GPT-5.2-Codex
SWE-Bench Verified	80.0%
CVE-Bench (漏洞偵測)	87.0%

模型變體

GPT-5.2-Codex 提供多種變體，針對不同的成本-速度-品質權衡進行了優化：

變體	優化方向
Codex (標準)	平衡表現
Codex Mini	較低成本，簡單任務
Codex Max	最高品質
Codex Max High	擴展推理深度
Codex Max Extra High	最深推理 (xHigh)
Codex Low Fast	速度優化
Codex Medium Fast	平衡速度與品質

定價

輸入： 每 100 萬 Token 1.75 美元
輸出： 每 100 萬 Token 14.00 美元
快取輸入： 重複提示可享最高 90% 的折扣

GPT-5.3-Codex 與 Codex-Spark：下一代編碼

GPT-5.3-Codex

GPT-5.3-Codex 於 2026 年 2 月發佈，是 GPT-5.2-Codex 的繼承者。最重大的升級是：100 萬 Token 的上下文視窗 — 足以在單個對話中容納大多數完整規模的生產代碼庫。

初步結果顯示，它在 SWE-Bench Pro 和 Terminal-Bench 2.0（最能反映現實軟體工程表現的基準測試）上比其前身有所進步。這是最嚴苛的代理式編碼工作流的首選模型。

GPT-5.3-Codex-Spark

Codex-Spark 於 2026 年 2 月 12 日發佈，採取了截然不同的方法。它與 Cerebras 合作構建，提供 每秒 1,000+ 個 Token 的速度 — 使其成為 GPT-5 系列中迄今為止最快的編碼模型。

功能	GPT-5.3-Codex	GPT-5.3-Codex-Spark
速度	標準推理	1,000+ tokens/秒
上下文視窗	100 萬 Token	128K Token
目標使用情境	深度代理式編碼	實時編碼回饋
可用性	API 與 ChatGPT	研究預覽 (Pro 用戶)
硬體	標準 GPU 叢集	Cerebras 晶圓級晶片

何時使用哪一個

GPT-5.3-Codex — 上下文大小至關平台的長期工程任務：大型重構、全代碼庫分析、複雜的多檔案更改
GPT-5.3-Codex-Spark — 速度至關重要的互動式編碼：代碼審查、快速原型設計、實時結對編程、快速迭代週期

Spark 在 SWE-Bench Pro 上取得了強勁的結果，且其花費的時間僅為標準 Codex 模型的一小部分 — 當您需要快速回答而又不想犧牲太多品質時，它是理想之選。

GPT-5.4：未來展望

GPT-5.4 尚未正式宣佈，但在 2026 年 3 月初已透過多次洩漏意外曝光。

證據

Codex 代碼提交 (2026 年 3 月 1-2 日)： 一位 OpenAI 工程師的拉取請求 (Pull Request) 中引用了「GPT-5.4 或更新版本」，隨後被匆忙編輯
OpenAI 社群貼文 (2026 年 3 月 3 日)： OpenAI 發文稱「5.4 比你想像的更早」 — 這是迄今為止最明確的官方暗示
API 端點現身： 「alpha-gpt-5.4」短暫出現在公開模型端點中

預期功能

根據洩漏的代碼和可靠報告：

200 萬 Token 上下文視窗 — 當前最大容量（GPT-5.3-Codex 的 1M）的 2 倍
全解析度圖像處理 — 新的 detail: original API 參數，可完全跳過圖像壓縮
增強的代理能力 — 更強的多步驟任務完成能力和自主工作流

發佈時間表

預測市場目前估計：

時間框架	機率
2026 年 4 月前	55%
2026 年 6 月前	74%

考慮到 OpenAI 加速的發佈節奏 — GPT-5.0 (2025/8)、GPT-5.1 (2025/11)、GPT-5.2 (2025/12)、GPT-5.3-Codex (2026/2) — 2026 年春季發佈是合理的。

您應該使用哪款 GPT-5 模型？

使用此決策矩陣為您的任務挑選正確的模型：

使用情境	推薦模型	原因
快速提問與聊天	GPT-5.3 Instant	最快、成本最低，在免費層可用
郵件草擬與寫作	GPT-5.3 Instant	寫作品質強，語氣溫暖
翻譯	GPT-5.3 Instant	專門針對翻譯任務進行了改進
研究與分析	GPT-5.2 Thinking	深度推理，256K 上下文，近乎完美的召回率
財務建模	GPT-5.2 Thinking (xHigh)	多步驟計算需要深度的推理能力
技術文件	GPT-5.2 Thinking	最擅長結構化、準確的長篇內容
Bug 修復與代碼審查	GPT-5.2-Codex	80% SWE-Bench，擅長理解現有代碼
大型代碼庫重構	GPT-5.3-Codex	1M 上下文視窗可容納整個代碼庫
安全審計	GPT-5.2-Codex	87% CVE-Bench，接受過漏洞模式訓練
實時結對編程	GPT-5.3-Codex-Spark	1000+ tok/s 意味著即時回饋
快速原型設計	GPT-5.3-Codex-Spark	迭代開發中速度優於深度
帶圖像的多模態	等待 GPT-5.4	預期支援全解析度圖像處理
2M+ Token 文件	等待 GPT-5.4	2M 上下文視窗尚未推出

簡單原則

速度最重要 → GPT-5.3 Instant 或 Codex-Spark
品質最重要 → GPT-5.2 Thinking (xHigh)
編碼任務 → 根據上下文大小和速度需求選擇 GPT-5.2-Codex、GPT-5.3-Codex 或 Codex-Spark
不確定 → 使用 ChatGPT 的自動 (Auto) 模式，讓 OpenAI 為您路由

價格比較

模型	輸入（每 100 萬 Token）	輸出（每 100 萬 Token）	快取輸入折扣
GPT-5.3 Instant	~$0.30	~$1.20	最高 75%
GPT-5.2 Thinking	$1.75	$14.00	最高 90%
GPT-5.2-Codex	$1.75	$14.00	最高 90%
GPT-5.3-Codex	待定	待定	待定
GPT-5.3-Codex-Spark	具競爭力	具競爭力	可用

成本優化技巧

使用快取輸入 — 如果您重複發送相似的提示，快取 Token 可以降低高達 90% 的成本
模型與任務匹配 — 不要將 GPT-5.2 Thinking 用於簡單問題；GPT-5.3 Instant 便宜 5-6 倍
簡單編碼使用 Codex Mini — Mini 變體能以顯著更低的成本處理例行編碼任務
批量 API 調用 — OpenAI 對於延遲不敏感的批量操作提供更低的價格

ChatGPT 自動 (Auto) 模式的工作原理

當您在 ChatGPT 中選擇**「自動 (Auto)」**時（大多數用戶的預設設置），OpenAI 會根據您請求的複雜程度，在 GPT-5.3 Instant 和 GPT-5.2 Thinking 之間動態路由。

路由邏輯

您的請求	選擇的模型	原因
「東京的天氣如何？」	GPT-5.3 Instant	簡單事實查詢
「總結這篇文章」	GPT-5.3 Instant	任務簡單直接
「分析此試算表並找出異常」	GPT-5.2 Thinking	需要多步驟分析
「逐條比較這兩份法律合約」	GPT-5.2 Thinking	需要深度推理
「寫一首關於春天的俳句」	GPT-5.3 Instant	具創意但簡單
「調試這個遞迴函數」	GPT-5.2 Thinking	技術問題解決

這對您意味著什麼

對於大多數 ChatGPT 用戶來說，自動模式是正確的選擇。您可以獲得 GPT-5.3 Instant 處理簡單任務的速度，以及 GPT-5.2 Thinking 在任務需求時的推理能力 — 無需手動切換模型。

如果您是透過 API 進行構建，則需要明確選擇。請參考上方的決策矩陣。

開始使用

GPT-5 模型系列功能強大，但選擇模型只是成功的一半。構建真正的應用程式需要正確的工具。

NxCode 讓您可以使用自然語言構建 AI 驅動的 Web 應用程式 — 無需手動選擇模型或設置基礎設施。描述您的需求，NxCode 即可生成具備正確 AI 集成功能的生產就緒代碼。

免費試用 NxCode — 更聰明地構建，更快速地交付。

OpenAI GPT-5 模型指南：GPT-5.2 vs 5.3 vs 5.4 — 您應該使用哪一個？ (2026)

OpenAI GPT-5 模型指南：GPT-5.2 vs 5.3 vs 5.4 — 您應該使用哪一個？ (2026)

GPT-5 模型系列一覽

GPT-5.3 Instant：日常工作的主力

它的優勢

誰應該使用它

何時升級

GPT-5.2 Thinking：深度推理器

基準測試表現

關鍵規格

誰應該使用它

GPT-5.2-Codex：代理式編碼器

它的獨特之處

基準測試表現

模型變體

定價

GPT-5.3-Codex 與 Codex-Spark：下一代編碼

GPT-5.3-Codex

GPT-5.3-Codex-Spark

何時使用哪一個

GPT-5.4：未來展望

證據

預期功能

發佈時間表

您應該使用哪款 GPT-5 模型？

簡單原則

價格比較

成本優化技巧

ChatGPT 自動 (Auto) 模式的工作原理

路由邏輯

這對您意味著什麼

開始使用

資料來源

相關資源

Related Tools

用 NxCode 建構

現在自己試試

Related Articles

GPT-5.4 vs GPT-5.2：有什麼變化？值得升級嗎？(2026)

OpenAI Codex vs Cursor 2026：你應該使用哪個 AI 程式設計代理？

OpenAI Arena 代號詳解：Zenith、Summit、Vortex、Zephyr —— OpenAI 如何秘密測試 GPT 模型

GPT-5.3-Codex-Spark 指南：OpenAI 於 Cerebras 運行的 1000 tok/s 即時編碼模型 (2026)