🔥 WCTC S8 全球交易赛正式开赛!
8,000,000 USDT 超级奖池解锁开启
🏆 团队赛:上半场正式开启,预报名阶段 5,500+ 战队现已集结
交易量收益额双重比拼,解锁上半场 1,800,000 USDT 奖池
🏆 个人赛:现货、合约、TradFi、ETF、闪兑、跟单齐上阵
全场交易量比拼,瓜分 2,000,000 USDT 奖池
🏆 王者 PK 赛:零门槛参与,实时匹配享受战斗快感
收益率即时 PK,瓜分 1,600,000 USDT 奖池
活动时间:2026 年 4月 23 日 16:00:00 -2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即参与:https://www.gate.com/competition/wctc-s8
#WCTCS8
谷歌,Gemini本地部署扩展…企业AI基础设施“控制权vs性能”矛盾能否化解
html
超越生成型AI,能夠自行執行任務的「代理型AI」時代已然來臨,企業基礎設施的設計標準也正在迅速改變。特別是監管行業、政府機構以及對數據主權有強烈要求的企業,正要求一種「AI就緒型」基礎設施,使其能夠在內部環境中運行最新的AI模型,同時又無需將敏感數據傳送至外部。
為了滿足此類需求,Google正在擴展其基礎設施策略,使企業能在本地端環境中也能運用自家的AI模型與雲端技術。Google網路與安全部門副總裁兼總經理Muninder Sambi在最近的Google Cloud Next活動中表示:「企業一直以來都面臨著要嘛遵守主權與法規,要嘛放棄這些原則轉向雲端的選擇。Google分散式雲端正是將Gemini和Google的AI能力帶入本地端環境的解決方案」。
Gemini攜手NVIDIA、Dell,擴展至內部網路
Google與NVIDIA($NVDA)及Dell Technologies($DELL)合作,支援在與公共網路隔離的「氣隙」環境以及連網型本地端環境中,都能運行基於Gemini的模型。特別是Gemini Flash模型,現已支援基於NVIDIA Blackwell B200及B300 GPU的本地端部署。對企業而言,這意味著可以在數據不外流的情況下,運行「主權型AI」工作負載。
Sambi副總裁強調,這不僅僅是提供一個「AI工廠」,而是提供一個能讓企業建立自身AI生產體系的「AI引擎」。對於使用雲端有困難的金融、醫療、國防及公共部門而言,這無疑是一項值得關注的變革。
Kubernetes崛起為AI時代的實質作業系統
隨著本地端AI基礎設施的擴張,Kubernetes的角色也日益重要。Google Kubernetes及Google Compute Engine部門的資深產品總監Drew Bradstock評價道,Kubernetes如今正扮演著涵蓋訓練、推論乃至強化學習等AI任務的「作業系統」角色。
他解釋說,在大型語言模型普及初期,Kubernetes是否能成為AI的核心控制層尚不明確,但隨著開源生態系統迅速朝對AI友善的方向演進,它已成為在混合雲環境中運行代理的基礎。在企業欲跨多種環境部署AI服務的背景下,Kubernetes的標準化效益再次凸顯。
現在,使用者也不僅限於人類
代理型AI的擴散不僅改變了基礎設施的運作方式,也正在改變產品設計的哲學。Bradstock總監指出,開發者體驗的中心現在不一定非得是人類。隨著AI代理大幅取代程式碼撰寫與營運工作,文件、介面乃至工具本身,都開始被重新設計為「便於AI代理閱讀和使用的結構」。
他表示:「新的DevOps正利用Claude和Gemini來處理工作」,並指出使用者環境、文件及各類工具都正圍繞著「技能」為中心進行重組。這暗示了未來企業用軟體可能超越為人類設計的UI,發展成能讓AI代理直接呼叫並執行的結構。
核心目標:同時達成「維持控制權」與「確保效能」
此次變革的核心在於,企業不再願意在數據控制權與AI效能之間只能二選一。AI就緒型基礎設施如今已不僅是單純的伺服器擴充,而是轉變為一個將數據主權、GPU運算資源、模型部署、治理及編排整合為一的綜合性設計課題。
從市場角度來看,Google這項策略顯示雲端企業正再次深入耕耘本地端與混合雲領域。隨著企業導入AI的進程正式啟動,勝負關鍵已不僅僅在於模型本身的效能,而是轉向能否在確保安全與靈活性的前提下,將其部署於實際運作環境中。
TP AI注意事項 本文是使用基於TokenPost.ai的語言模型所進行的摘要。文中可能遺漏主要內容或與事實有所出入。