2026-03-08 02:29:56

#OpenAIReleasesGPT-5.4

OpenAI 發布 GPT-5.4：2026年3月在專業 AI 能力方面的重大飛躍
OpenAI 在2026年3月5日宣布推出 GPT-5.4，標誌著其前沿模型系列的重要更新。公司將 GPT-5.4 描述為其最具能力和效率的專為專業工作量身定制的模型。此次發布緊隨 GPT-5 家族的快速迭代，該系列始於2025年8月的初始 GPT-5 推出。GPT-5.4 直接基於先前版本如 GPT-5.3 Codex 和 GPT-5.2 Thinking 的進步，將推理、編碼和代理工作流程的改進整合為一個統一系統。該模型旨在滿足複雜企業任務的需求，這些任務對可靠性、效率和多步執行能力有著極高的要求。
此次發布包括兩個主要版本，以滿足不同用戶需求。GPT-5.4 Thinking 作為預設的推理專用版本，在 ChatGPT 中提供，強調深度問題解決和結構化思考流程。用戶現在可以在完整回應生成前，先看到模型推理的預先計劃，若方向需要修正，還可以在過程中進行調整。此功能提升了透明度和控制力，特別適合專業人士反覆優化輸出。GPT-5.4 Pro 則提供最大性能，針對需要在複雜高風險任務中達到巔峰能力的用戶。兩個版本都代表 OpenAI 推向更實用、可用於生產的 AI 工具的努力。
自2026年3月5日起逐步推出。ChatGPT 中，GPT-5.4 Thinking 取代了之前的 GPT-5.2 Thinking，適用於 Plus、Team 和 Pro 訂閱用戶。遺留的 GPT-5.2 Thinking 存取權在模型選擇器中保留三個月，直到2026年6月5日，之後將停止支援。企業和教育計劃用戶可以通過管理員設置提前啟用訪問權。API 也提供即時存取 GPT-5.4，識別碼為 gpt-5.4，而 GPT-5.4 Pro 則使用 gpt-5.4-pro。Codex，OpenAI 的編碼環境，也整合了新模型。ChatGPT 中的上下文窗口保持與先前 Thinking 模型一致，但 API 版本支持高達一百萬個標記，這是一次大幅擴展，可處理非常長的文件、代碼庫或數據集，無需截斷。
主要技術改進集中在效率和可靠性。OpenAI 報告稱，GPT-5.4 在某些任務中使用的標記數明顯較少，某些情況下比早期模型降低了多達47%。這降低了計算成本，加快了代理工作流程的回應速度。幻覺率顯著降低：單個聲明出錯的可能性降低33%，整體回應中的不準確性較 GPT-5.2 下降18%。這些改進來自於更精細的訓練技術、更好的近期推理進展整合，以及針對專業場景中常見失誤模式的針對性緩解措施。
一個突出的新增功能是原生電腦操作能力，使 GPT-5.4 成為 OpenAI 首個內建自主操作電腦和軟體的通用模型。這包括與應用程式互動、導航界面、處理文件，以及在電子表格、簡報和文檔等工具中執行多步操作。此功能推進 AI 代理在現實環境中可靠完成任務的能力，支持自動化應用，如數據分析、報告生成和軟體測試。模型融合了 GPT-5.3 Codex 的行業領先編碼技術，同時提升工具使用和在多種軟體環境中的性能。
基準測試顯示在專業領域取得了顯著進展。在涉及複雜推理、編碼挑戰和代理模擬的任務中，GPT-5.4 表現優於前代，並在某些領域接近甚至超越人類水平。例如，在需要持續執行的環境中，如操作系統模擬或基於網頁的交互，展現出強勁的結果。這些指標使該模型在與 Anthropic 的 Claude 系列和 Google 的 Gemini 等競爭對手中具有競爭力，尤其是在企業應用中，穩定性比純速度更為重要。
安全性方面在開發過程中受到特別關注。OpenAI 維持與 GPT-5.3 Codex 相似的高網絡風險等級，並實施全面的緩解措施，以防止在網絡安全方面的濫用。GPT-5.4 Thinking 的系統卡詳細說明了多層保護措施，包括拒絕機制、對有害輸出的監控，以及在能力閾值上的評估。儘管如此，該發布伴隨著對 OpenAI 合作夥伴關係和內部決策的更廣泛審查，但公司強調將繼續遵循負責任部署的原則。
定價反映了模型的先進性和分層存取。標準 GPT-5.4 的 API 收費為每百萬輸入標記2.50美元，輸出部分收費更高，長上下文會話中超過272,000標記的提示則收取雙倍費用。GPT-5.4 Pro 則收取高端費率，以滿足高性能需求。在微軟的整合中，如 Foundry，也採用類似的結構，並提供快取輸入折扣以鼓勵高效使用。這些成本主要針對專業人士和開發者，用戶能從增強的能力中獲益，而免費層的 ChatGPT 用戶則繼續使用較早或較輕的模型。
此次發布的時機與 OpenAI 越來越頻繁的漸進式更新策略一致。在 GPT-5.3 Instant 僅幾天前推出後，GPT-5.4 展示了加快迭代的步伐，以保持在前沿 AI 領域的領導地位。分析師認為這是對競爭壓力和用戶反饋的戰略回應，旨在解決先前模型在實務工作流程中的局限性。企業採用仍是重點，並推出了如 Excel 和 Google Sheets 的財務插件、改進的文檔處理和代理可靠性等功能，旨在幫助商業用戶提升生產力。
市場反響在早期測試的開發者和專業人士中大多為正面。報告指出，代碼輸出更流暢，知識工作更精緻，代理行為在受控演示中也更有效。有些批評則集中在定價的可及性和在極端情況下的可靠性問題，但基準測試和初步實測都顯示出顯著進步。此次發布彰顯了2026年 AI 進展的快速步伐，月度或雙月的改進不斷重塑大型語言模型在專業環境中的應用預期。
展望未來，GPT-5.4 為 GPT-5 系列的進一步優化奠定了基礎。OpenAI 表示，Thinking 和 Instant 類模型可能會以不同的節奏演進，實現專業化而不破壞用戶體驗。隨著上下文窗口的擴大和代理功能的成熟，該模型家族或將推動更多自主系統在軟體開發、金融分析等行業的應用。目前，GPT-5.4 提供了一個專注於效率、準確性和實用性的升級版本，適合處理複雜工作的用戶。
這一發展鞏固了 OpenAI 在不斷演變的 AI 領域中的地位，專業級性能日益成為競爭優勢的標誌。擁有存取權的用戶可以直接在 ChatGPT 或通過 API 探索這些變化，而對生產力、自動化和創新的更廣泛影響則將在2026年3月5日公告後的數週內逐步展開。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

內容包含 AI 生成部分

4人按讚了這條動態

讚賞
4
2
轉發
分享

留言

0/400

ybaser

· 59分鐘前

婦女節快樂！❤️

查看原文回復0

楚老魔

· 1小時前

2026衝衝衝 👊

查看原文回復0

熱門話題
查看更多
#
2月非農意外負增長
90.15萬熱度
#
加密市場小幅下跌
470.09萬熱度
#
原油價格飆升
49.71萬熱度
#
美伊局勢影響
24.31萬熱度
#
黃金白銀走高
18.27萬熱度

熱門 Gate Fun
查看更多

1
666
666
市值:$2396.55持有人數:1
0.00%
2
arg
argentina
市值:$2420.68持有人數:1
0.00%
3
yisis
yisus
市值:$0.1持有人數:0
0.00%
4
SHIT
SHIT
市值:$0.1持有人數:1
0.00%
5
PTRX
PETRO EXCHANGE
市值:$2406.89持有人數:1
0.00%

#OpenAIReleasesGPT-5.4

熱門話題

2月非農意外負增長

加密市場小幅下跌

原油價格飆升

美伊局勢影響

黃金白銀走高

熱門 Gate Fun

666

666

arg

argentina

yisis

yisus

SHIT

SHIT

PTRX

PETRO EXCHANGE

置頂