#OpenAIReleasesGPT-5.4


OpenAI 發布 GPT-5.4:2026年3月在專業 AI 能力方面的重大飛躍
OpenAI 在2026年3月5日宣布推出 GPT-5.4,標誌著其前沿模型系列的重要更新。公司將 GPT-5.4 描述為其最具能力和效率的專為專業工作量身定制的模型。此次發布緊隨 GPT-5 家族的快速迭代,該系列始於2025年8月的初始 GPT-5 推出。GPT-5.4 直接基於先前版本如 GPT-5.3 Codex 和 GPT-5.2 Thinking 的進步,將推理、編碼和代理工作流程的改進整合為一個統一系統。該模型旨在滿足複雜企業任務的需求,這些任務對可靠性、效率和多步執行能力有著極高的要求。
此次發布包括兩個主要版本,以滿足不同用戶需求。GPT-5.4 Thinking 作為預設的推理專用版本,在 ChatGPT 中提供,強調深度問題解決和結構化思考流程。用戶現在可以在完整回應生成前,先看到模型推理的預先計劃,若方向需要修正,還可以在過程中進行調整。此功能提升了透明度和控制力,特別適合專業人士反覆優化輸出。GPT-5.4 Pro 則提供最大性能,針對需要在複雜高風險任務中達到巔峰能力的用戶。兩個版本都代表 OpenAI 推向更實用、可用於生產的 AI 工具的努力。
自2026年3月5日起逐步推出。ChatGPT 中,GPT-5.4 Thinking 取代了之前的 GPT-5.2 Thinking,適用於 Plus、Team 和 Pro 訂閱用戶。遺留的 GPT-5.2 Thinking 存取權在模型選擇器中保留三個月,直到2026年6月5日,之後將停止支援。企業和教育計劃用戶可以通過管理員設置提前啟用訪問權。API 也提供即時存取 GPT-5.4,識別碼為 gpt-5.4,而 GPT-5.4 Pro 則使用 gpt-5.4-pro。Codex,OpenAI 的編碼環境,也整合了新模型。ChatGPT 中的上下文窗口保持與先前 Thinking 模型一致,但 API 版本支持高達一百萬個標記,這是一次大幅擴展,可處理非常長的文件、代碼庫或數據集,無需截斷。
主要技術改進集中在效率和可靠性。OpenAI 報告稱,GPT-5.4 在某些任務中使用的標記數明顯較少,某些情況下比早期模型降低了多達47%。這降低了計算成本,加快了代理工作流程的回應速度。幻覺率顯著降低:單個聲明出錯的可能性降低33%,整體回應中的不準確性較 GPT-5.2 下降18%。這些改進來自於更精細的訓練技術、更好的近期推理進展整合,以及針對專業場景中常見失誤模式的針對性緩解措施。
一個突出的新增功能是原生電腦操作能力,使 GPT-5.4 成為 OpenAI 首個內建自主操作電腦和軟體的通用模型。這包括與應用程式互動、導航界面、處理文件,以及在電子表格、簡報和文檔等工具中執行多步操作。此功能推進 AI 代理在現實環境中可靠完成任務的能力,支持自動化應用,如數據分析、報告生成和軟體測試。模型融合了 GPT-5.3 Codex 的行業領先編碼技術,同時提升工具使用和在多種軟體環境中的性能。
基準測試顯示在專業領域取得了顯著進展。在涉及複雜推理、編碼挑戰和代理模擬的任務中,GPT-5.4 表現優於前代,並在某些領域接近甚至超越人類水平。例如,在需要持續執行的環境中,如操作系統模擬或基於網頁的交互,展現出強勁的結果。這些指標使該模型在與 Anthropic 的 Claude 系列和 Google 的 Gemini 等競爭對手中具有競爭力,尤其是在企業應用中,穩定性比純速度更為重要。
安全性方面在開發過程中受到特別關注。OpenAI 維持與 GPT-5.3 Codex 相似的高網絡風險等級,並實施全面的緩解措施,以防止在網絡安全方面的濫用。GPT-5.4 Thinking 的系統卡詳細說明了多層保護措施,包括拒絕機制、對有害輸出的監控,以及在能力閾值上的評估。儘管如此,該發布伴隨著對 OpenAI 合作夥伴關係和內部決策的更廣泛審查,但公司強調將繼續遵循負責任部署的原則。
定價反映了模型的先進性和分層存取。標準 GPT-5.4 的 API 收費為每百萬輸入標記2.50美元,輸出部分收費更高,長上下文會話中超過272,000標記的提示則收取雙倍費用。GPT-5.4 Pro 則收取高端費率,以滿足高性能需求。在微軟的整合中,如 Foundry,也採用類似的結構,並提供快取輸入折扣以鼓勵高效使用。這些成本主要針對專業人士和開發者,用戶能從增強的能力中獲益,而免費層的 ChatGPT 用戶則繼續使用較早或較輕的模型。
此次發布的時機與 OpenAI 越來越頻繁的漸進式更新策略一致。在 GPT-5.3 Instant 僅幾天前推出後,GPT-5.4 展示了加快迭代的步伐,以保持在前沿 AI 領域的領導地位。分析師認為這是對競爭壓力和用戶反饋的戰略回應,旨在解決先前模型在實務工作流程中的局限性。企業採用仍是重點,並推出了如 Excel 和 Google Sheets 的財務插件、改進的文檔處理和代理可靠性等功能,旨在幫助商業用戶提升生產力。
市場反響在早期測試的開發者和專業人士中大多為正面。報告指出,代碼輸出更流暢,知識工作更精緻,代理行為在受控演示中也更有效。有些批評則集中在定價的可及性和在極端情況下的可靠性問題,但基準測試和初步實測都顯示出顯著進步。此次發布彰顯了2026年 AI 進展的快速步伐,月度或雙月的改進不斷重塑大型語言模型在專業環境中的應用預期。
展望未來,GPT-5.4 為 GPT-5 系列的進一步優化奠定了基礎。OpenAI 表示,Thinking 和 Instant 類模型可能會以不同的節奏演進,實現專業化而不破壞用戶體驗。隨著上下文窗口的擴大和代理功能的成熟,該模型家族或將推動更多自主系統在軟體開發、金融分析等行業的應用。目前,GPT-5.4 提供了一個專注於效率、準確性和實用性的升級版本,適合處理複雜工作的用戶。
這一發展鞏固了 OpenAI 在不斷演變的 AI 領域中的地位,專業級性能日益成為競爭優勢的標誌。擁有存取權的用戶可以直接在 ChatGPT 或通過 API 探索這些變化,而對生產力、自動化和創新的更廣泛影響則將在2026年3月5日公告後的數週內逐步展開。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
內容包含 AI 生成部分
  • 讚賞
  • 2
  • 轉發
  • 分享
留言
0/400
ybaservip
· 59分鐘前
婦女節快樂!❤️
查看原文回復0
楚老魔vip
· 1小時前
2026衝衝衝 👊
查看原文回復0