🔥 WCTC S8 全球交易賽正式開賽!
8,000,000 USDT 超級獎池解鎖開啟
🏆 團隊賽:上半場正式開啟,預報名階段 5,500+ 戰隊現已集結
交易量收益額雙重比拼,解鎖上半場 1,800,000 USDT 獎池
🏆 個人賽:現貨、合約、TradFi、ETF、閃兌、跟單齊上陣
全場交易量比拼,瓜分 2,000,000 USDT 獎池
🏆 王者 PK 賽:零門檻參與,實時匹配享受戰鬥快感
收益率即時 PK,瓜分 1,600,000 USDT 獎池
活動時間:2026 年 4 月 23 日 16:00:00 - 2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即參與:https://www.gate.com/competition/wctc-s8
#WCTCS8
#OpenAIReleasesGPT-5.5
代理智能 AI 時代已經開始
在2026年4月23日,OpenAI宣布向所有付費用戶推出“GPT-5.5”。內部代號“Spud”,這個版本以其“代理”架構而脫穎而出,不僅能聊天,還能規劃並完成從頭到尾的指定目標。這次發布僅在Anthropic的Mythos模型推出一週後,顯示2026年的AI競賽已進入更高的階段。
什麼是GPT-5.5,它能做什麼?
OpenAI描述GPT-5.5為“一種用於實際工作的新型智能”。與之前的版本不同,該模型能在模糊、多步驟的任務上前進,無需用戶逐步指示。它會規劃、使用工具、檢查自己的工作、在需要時運行代碼、創建文件、進行線上研究,並在不同應用間切換。
OpenAI聯合創始人Greg Brockman總結該模型的定位:“這不是一個漸進式更新,而是一個全新的智能類別。這是邁向更具代理性和直觀計算的重要一步。”
在編碼和計算機應用方面的突破
GPT-5.5在代理編碼和計算機應用方面取得了最大飛躍。
• Terminal-Bench 2.0:在測試複雜命令行工作流程的基準中,達到82.7%的準確率——創下新紀錄。 • SWE-Bench Pro:在測量實際GitHub問題解決能力的測試中,得分58.6%,在一次通過中解決了比以前模型更多的任務。 • OSWorld-Verified:在衡量模型是否能獨立操作電腦的基準中,達到78.7%。GPT-5.4得分75%,Anthropic Opus 4.7得分78%。
它在使用更少的tokens的情況下完成所有這些任務。根據Artificial Analysis的Coding Index,GPT-5.5以大約一半的成本提供前沿水平的智能。
誰可以使用,價格如何?
GPT-5.5在發布當天已向ChatGPT Plus、Pro、Business和Enterprise用戶開放。API於4月24日開放。還有一個更大的“GPT-5.5 Pro”版本,適用於每月100美元的Pro計劃和商業/企業帳戶。
目前尚未向免費層用戶開放。OpenAI表示,API延遲一天開放是因為需要“不同的安全措施”。
為什麼叫“Spud”?開發過程
該模型的代號為“Spud”。預訓練於2026年3月完成。Sam Altman向員工描述該模型為“一個非常強大的模型,實際上可以加速經濟”。Greg Brockman表示Spud是“兩年研究的產物”,代表著“不是一個漸進的步伐,而是我們對模型開發思路的重大轉變”。
企業應用:聲稱每周節省10小時
擁有早期訪問權的團隊表示,他們可以審查數千份額外的文件,捕捉快速編寫的代碼中的錯誤,並每周節省最多10小時的工作時間。該模型在辦公任務中表現出色,如創建文件、電子表格、演示文稿、數據分析和運行軟件。
競爭:與Anthropic和Google的比較
GPT-5.5在編碼基準測試中超越了Anthropic的Opus 4.7和Google的Gemini 3.1 Pro。尤其在代理任務方面——需要多步規劃和工具使用的場景——它領先不少。與GPT-5.4相比,它被定位為“更快、更敏銳的思考者,使用更少的tokens”。
安全性與“代理”風險
OpenAI表示,GPT-5.5是邁向“能在沒有人工指導下完成複雜、多步驟任務的AI系統”的第一步。為此,該模型被定義為“代理性AI”,配備更嚴格的安全防護措施。公司強調,該模型能自我糾錯並應對模糊性。
未來:GPT-6即將來臨
行業消息人士認為,GPT-5.5是通往GPT-6的橋樑,預計將帶來“無限上下文”、先進的記憶管理和新的代理模式。還有傳言稱OpenAI正在開發一款“超級應用”,整合ChatGPT、Codex和Atlas瀏覽器。
總結:#OpenAIReleasesGPT-5.5 標誌著AI從“問答”階段向“端到端完成工作”階段的轉變。以82.7%的Terminal-Bench分數、以半價達到前沿性能、每周節省10小時的承諾,GPT-5.5在編碼、研究和企業自動化方面樹立了新標準。代理時代正式開始,競爭不僅僅是“更好的答案”,而是“完成更多工作”。