✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
GLM-5.1 跑分好看,落地另一回事:硬體門檻和驗證差距依然存在
Demo 和實際部署是兩回事
Z.ai 的 GLM-5.1 在長時任務上打"開源替代"牌,聲勢很大,但熱度跑在了實際可用性前面。官方說它在 SWE-Bench Pro(58.4%)、Terminal-Bench(63.5%)和 NL2Repo(42.7%)上是開源第一、全球第三,還在 SWE-Bench 上超過了 GPT-5.4 的 57.7%。但獨立測試講的是另一個故事——Claude Opus 4.6 在可驗證子集上能到 75–80%。Z.ai 挑的基準更像是揚長避短,不能說明模型在生產環境中穩不穩。
Twitter 上到處是 GLM-5.1 在 Claude Code 等工具裡的演示。但大家沒提的是:硬體要求很高。大多數獨立開發者跑不起,這就帶出一個尷尬的問題:需要企業級算力才能用的模型,"開源"到底意味著什麼?
硬體門檻逼出艱難選擇
圍繞 GLM-5.1 的討論兩極分化,意料之中。AI 工程師展示迭代求解的演示;DeepMind 的研究者指出它在長對話中處理跨文件依賴有困難。
Z.ai 明顯在工程上偏向高性價比推理——支持華為 Ascend 芯片、兼容 vLLM——但 754B 參數至少需要 FP8 量化。如果你是國內資金充足的實驗室,沒問題;其他地方就不一定了。
融資也在講故事。Prosperity7 參與意味著地緣政治對沖,但 2025 年被列入實體清單限制了 Z.ai 的國際擴張。更像是"本土冠軍"而不是"全球挑戰者"。
底線: 如果你把全部籌碼押在"開源顛覆"上,現在可能還太早。閉源模型在可靠性上仍佔優。對企業來說:能用開放權重省錢的就用,生產環境保留閉源 API。對投資者來說:Z.ai 的亞洲定位值得關注,但前提是你緊盯算力地緣政治。
重要性: 高
分類: 模型發布、技術洞察、市場影響
結論: 對"開源即將全面取代閉源"的說法,現在還是偏早階段;短期優勢更多在閉源 API 供應商和算力充足的頭部實驗室。不同角色的受益情況: