2026-04-24 21:27:25

#OpenAIReleasesGPT-5.5

代理智能 AI 時代已經開始
在2026年4月23日，OpenAI宣布向所有付費用戶推出“GPT-5.5”。內部代號“Spud”，這個版本以其“代理”架構而脫穎而出，不僅能聊天，還能規劃並完成從頭到尾的指定目標。這次發布僅在Anthropic的Mythos模型推出一週後，顯示2026年的AI競賽已進入更高的階段。
什麼是GPT-5.5，它能做什麼？
OpenAI描述GPT-5.5為“一種用於實際工作的新型智能”。與之前的版本不同，該模型能在模糊、多步驟的任務上前進，無需用戶逐步指示。它會規劃、使用工具、檢查自己的工作、在需要時運行代碼、創建文件、進行線上研究，並在不同應用間切換。

OpenAI聯合創始人Greg Brockman總結該模型的定位：“這不是一個漸進式更新，而是一個全新的智能類別。這是邁向更具代理性和直觀計算的重要一步。”
在編碼和計算機應用方面的突破
GPT-5.5在代理編碼和計算機應用方面取得了最大飛躍。
• Terminal-Bench 2.0：在測試複雜命令行工作流程的基準中，達到82.7%的準確率——創下新紀錄。 • SWE-Bench Pro：在測量實際GitHub問題解決能力的測試中，得分58.6%，在一次通過中解決了比以前模型更多的任務。 • OSWorld-Verified：在衡量模型是否能獨立操作電腦的基準中，達到78.7%。GPT-5.4得分75%，Anthropic Opus 4.7得分78%。
它在使用更少的tokens的情況下完成所有這些任務。根據Artificial Analysis的Coding Index，GPT-5.5以大約一半的成本提供前沿水平的智能。
誰可以使用，價格如何？
GPT-5.5在發布當天已向ChatGPT Plus、Pro、Business和Enterprise用戶開放。API於4月24日開放。還有一個更大的“GPT-5.5 Pro”版本，適用於每月100美元的Pro計劃和商業/企業帳戶。

目前尚未向免費層用戶開放。OpenAI表示，API延遲一天開放是因為需要“不同的安全措施”。
為什麼叫“Spud”？開發過程
該模型的代號為“Spud”。預訓練於2026年3月完成。Sam Altman向員工描述該模型為“一個非常強大的模型，實際上可以加速經濟”。Greg Brockman表示Spud是“兩年研究的產物”，代表著“不是一個漸進的步伐，而是我們對模型開發思路的重大轉變”。
企業應用：聲稱每周節省10小時
擁有早期訪問權的團隊表示，他們可以審查數千份額外的文件，捕捉快速編寫的代碼中的錯誤，並每周節省最多10小時的工作時間。該模型在辦公任務中表現出色，如創建文件、電子表格、演示文稿、數據分析和運行軟件。
競爭：與Anthropic和Google的比較
GPT-5.5在編碼基準測試中超越了Anthropic的Opus 4.7和Google的Gemini 3.1 Pro。尤其在代理任務方面——需要多步規劃和工具使用的場景——它領先不少。與GPT-5.4相比，它被定位為“更快、更敏銳的思考者，使用更少的tokens”。
安全性與“代理”風險
OpenAI表示，GPT-5.5是邁向“能在沒有人工指導下完成複雜、多步驟任務的AI系統”的第一步。為此，該模型被定義為“代理性AI”，配備更嚴格的安全防護措施。公司強調，該模型能自我糾錯並應對模糊性。
未來：GPT-6即將來臨
行業消息人士認為，GPT-5.5是通往GPT-6的橋樑，預計將帶來“無限上下文”、先進的記憶管理和新的代理模式。還有傳言稱OpenAI正在開發一款“超級應用”，整合ChatGPT、Codex和Atlas瀏覽器。

總結：#OpenAIReleasesGPT-5.5 標誌著AI從“問答”階段向“端到端完成工作”階段的轉變。以82.7%的Terminal-Bench分數、以半價達到前沿性能、每周節省10小時的承諾，GPT-5.5在編碼、研究和企業自動化方面樹立了新標準。代理時代正式開始，競爭不僅僅是“更好的答案”，而是“完成更多工作”。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

3人按讚了這條動態

打賞
3
5
轉發
分享

留言

請輸入留言內容

Seyyidetünnisa

· 2小時前

到月球 🌕

查看原文回復0

Seyyidetünnisa

· 2小時前

2026 GOGOGO 👊

回復0

User_any

· 2小時前

LFG 🔥

回復0

User_any

· 2小時前

直達月球 🌕

查看原文回復0

User_any

· 2小時前

2026 GOGOGO 👊

回復0

熱門話題
查看更多
#
WCTC交易王PK
17.11萬熱度
#
加密市場行情震盪
23.37萬熱度
#
rsETH攻擊事件後續進展
7.54萬熱度
#
美伊談判陷入僵局
18.83萬熱度
#
ETH鏈Meme幣FLORK拉升
4.04萬熱度

#OpenAIReleasesGPT-5.5

熱門話題

WCTC交易王PK

加密市場行情震盪

rsETH攻擊事件後續進展

美伊談判陷入僵局

ETH鏈Meme幣FLORK拉升

置頂