Microsoft Fara-7B превосходит GPT-4o по производительности: как модель с 7 миллиардами параметров обеспечивает мгновенные вычисления на локальной стороне
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
Microsoft Fara-7B превосходит GPT-4o по производительности: как модель с 7 миллиардами параметров обеспечивает мгновенные вычисления на локальной стороне
微軟最新推出的 Fara-7B 不只是又一款 AI 模型,它用實際數據打臉了「模型越大越聰明」的傳統認知。這款僅有 70 億參數的「電腦使用代理」在多項基準測試中反超 OpenAI 的 GPT-4o,同時還能直接在你的個人電腦上跑起來,完全無需依賴雲端。
性能數據說話:小模型憑什麼贏了
在 WebVoyager 基準測試中,Fara-7B 達成了 73.5% 的任務完成率,直接超越 GPT-4o 的 65.1%。更誇張的是效率指標——完成同樣的操作僅需 16 步,而同級別的 UI-TARS-1.5-7B 則需要 41 步,足足少了 60% 的冗餘步驟。
這不是偶然,而是源於微軟採用了 知識蒸餾 的訓練方法。透過整合多代理系統 Magentic-One 生成的 14.5 萬筆導航範例,微軟成功將大模型的能力壓縮至單一精簡模型中。底層基於 Qwen2.5-VL-7B,配備 128,000 token 的超長上下文窗口,讓視覺理解能力達到新高度。
看螢幕、點滑鼠:像素級推理重新定義自動化
Fara-7B 的殺手鐧在於採用「看螢幕操作」的邏輯。傳統方式依賴瀏覽器結構化代碼,而 Fara-7B 完全基於像素級數據進行推理——讀取螢幕截圖,預測滑鼠點擊、文字輸入、頁面滾動等動作,就算面對代碼混亂的網站也能正常運作。
微軟研究院產品經理 Yash Lara 稱這為「像素主權」,讓醫療、金融等高監管產業也能安心部署在本地。這意味著企業的敏感資訊再也不用上傳到雲端,延遲大幅降低,資料隱私有了真正的保障。
安全機制:自動暫停防線守護關鍵操作
值得一提的是 Fara-7B 內建的「關鍵確認點」機制。當遇到涉及用戶個資或不可逆操作時(如發送信件、金錢轉移),模型會自動暫停並請求人工確認,搭配 Magentic-UI 互動介面,形成真正的人機協作防線。
開源釋出,但還不是生產級別
11 月 24 日,微軟正式將 Fara-7B 以 MIT 授權開源,已在 Hugging Face 與微軟 Foundry 平台上線,支持商業應用。不過微軟也坦白——模型目前還 尚未達到生產環境部署標準,主要適合開發者用於原型測試與功能驗證。
這次發布反映了一個重要轉向:微軟明確表示未來不會盲目追求更大的模型,而是致力於打造「小而聰明、安全」的解決方案。後續還計劃導入強化學習在沙箱環境中進行自訓練,進一步提升模型的自主學習潛力。