Google secara terbuka menargetkan jaringan pusat data berukuran sangat besar 'Vergo' yang berfungsi sebagai 'AI proxy'... memperkuat kemampuan penanganan latensi dan gangguan

robot
Pembuatan abstrak sedang berlangsung

Google mengumumkan jaringan pusat data berukuran sangat besar dan infrastruktur lintas cloud untuk era ‘AI Agenik (Agentic AI)’. Seiring semakin umum lingkungan di mana kecerdasan buatan memanggil alat eksternal dalam hitungan milidetik, kompetisi untuk infrastruktur yang mengurangi latensi dan secara stabil memproses komputasi skala besar sedang berkembang secara menyeluruh.

Google merilis sistem jaringan infrastruktur AI terbaru mereka ‘Virgo Network’ pada tanggal 24. Sistem ini bertujuan meningkatkan kecepatan komunikasi keseluruhan pusat data, baik di dalam klaster akselerator maupun antar sumber daya memori, komputasi, dan penyimpanan.

Inti dari sistem ini adalah struktur jaringan ‘datar’. Metode ini mengurangi jumlah lapisan yang dilalui selama transmisi data untuk menurunkan hambatan. Menurut Google, Virgo Network dapat menghubungkan hingga 134.000 chip, termasuk prosesor TPU generasi kedelapan 8t untuk pelatihan. Bandwidth dua arah mencapai maksimum 47 petabit per detik (Pbps). Perusahaan menyatakan bahwa, dibandingkan generasi sebelumnya, bandwidth per akselerator meningkat lebih dari 4 kali lipat.

Bagian yang patut diperhatikan dari pengumuman ini adalah, selain kompetisi kecepatan murni, juga penekanan secara menyeluruh pada ‘daya tahan’. Dalam klaster AI skala sangat besar, kegagalan, latensi, dan penurunan kecepatan sebagian perangkat hampir tak terhindarkan. Google menyatakan bahwa untuk mengatasi hal ini, mereka menggabungkan fungsi ‘visibilitas’ yang memantau kondisi jaringan secara rinci dengan perangkat lunak otomatis untuk menghindar dan memulihkan gangguan. Fitur ini juga mencakup penerapan bidang pertukaran yang independen, untuk memastikan bahwa bahkan jika terjadi latensi atau kegagalan jaringan, throughput keseluruhan tidak akan melonjak secara drastis.

Google menggambarkan Virgo Network bukan sebagai perluasan sederhana dari pusat data yang ada, melainkan sebagai produk infrastruktur independen yang dirancang dengan filosofi ‘mengatur seluruh taman seperti superkomputer’. Perusahaan berpendapat bahwa dengan memonitor kondisi sistem dalam satuan waktu kurang dari satu milidetik, mereka dapat mengoptimalkan masalah kemacetan dan manajemen buffer secara real-time di seluruh perangkat keras dan perangkat lunak. Hal ini sangat penting dalam lingkungan di mana AI agenik harus melakukan panggilan alat, penalaran, dan tugas peningkatan pencarian (RAG) secara bersamaan.

Selain itu, mereka juga merilis lapisan koneksi dan keamanan yang memecah batas cloud.

Selain jaringan pusat data, Google juga meluncurkan lapisan koneksi cloud dan keamanan yang ditujukan untuk beban kerja AI agenik. Perusahaan merangkum pembaruan ini dalam empat pilar: ‘komputasi elastis’, ‘koneksi lintas cloud yang aman’, ‘lapisan data terpadu’, dan ‘kedaulatan digital’.

Pertama, ‘komputasi elastis’ adalah arsitektur yang dirancang untuk menangani fluktuasi kebutuhan agen AI secara lebih efisien. Layanan AI sering mengalami lonjakan permintaan secara mendadak, Google menjelaskan bahwa mereka meningkatkan aksesibilitas CPU agar dapat merespons kebutuhan ini lebih cepat dan lebih hemat biaya. Khususnya, desain ini menyediakan sumber daya CPU yang dioptimalkan untuk tugas-tugas seperti penalaran, orkestrasi agen, dan peningkatan pencarian, sebagai pelengkap kekurangan GPU.

Untuk itu, Google menerapkan CPU C4N dan M4N pada mesin virtual (VM) berbasis Google Compute Engine dan Google Kubernetes Service. Google menyatakan bahwa sistem ini mampu memproses hingga 95 juta paket data per detik, paling cepat 40% dibandingkan penyedia cloud skala besar utama.

Dalam bidang koneksi lintas cloud yang aman, ‘gateway agen’ ditempatkan di pusatnya. Pengontrol ini bertanggung jawab memantau hak akses agen AI dan secara fundamental mengendalikan serta mengelola protokol seperti Model Context Protocol (MCP) dan Protocol antar Agen (A2A). Penjelasannya menunjukkan bahwa gateway ini mampu memastikan bahwa data yang mengalir antar jaringan di lingkungan multi-cloud memiliki visibilitas dan dilindungi.

‘AI menuju data di tempat data berada’ bukan ‘memindahkan data’

Lapisan data terpadu berfokus agar AI dapat langsung memahami dan memanfaatkan data yang tersebar di berbagai repositori perusahaan. Google menyatakan bahwa ‘penyimpanan cerdas’ menyisipkan metadata ke objek data, mengubah ‘data statis’ tradisional menjadi aset pengetahuan yang dapat dibaca AI.

Setelah arsitektur ini terbentuk, AI dapat menerapkan pencarian berbasis semantik pada berbagai format informasi seperti spreadsheet, dokumen, PDF, gambar, dan lainnya, serta melakukan anotasi otomatis dan ekstraksi wawasan. Pendekatan ini bertujuan mengurangi fenomena ‘pulau data’ yang terkunci di repositori tertentu, membantu agen AI menemukan informasi yang dibutuhkan lebih cepat.

‘Direktori pengetahuan’ yang dipublikasikan secara bersamaan menghubungkan pengetahuan internal perusahaan dalam bentuk grafis, membantu agen AI memahami proses bisnis dan konteksnya dengan lebih baik. Google menekankan bahwa melalui metode ini, tidak perlu memindahkan data secara terpisah untuk mengoptimalkan pembelajaran dan respons AI. Dengan kata lain, pendekatannya bukan memindahkan data ke lokasi pusat, melainkan membiarkan model AI berjalan di lingkungan ‘privat’ tempat data berada.

Pengumuman ini menunjukkan bahwa fokus kompetisi AI kini beralih dari performa model ke infrastruktur jaringan, keamanan, dan data yang mendukung operasinya. Terutama, dengan pengenalan resmi AI agenik dalam bisnis perusahaan, latensi rendah, daya tahan tinggi, dan pengelolaan multi-cloud kemungkinan besar akan menjadi keunggulan kompetitif utama. Langkah Google ini dipandang sebagai sinyal bahwa persaingan antar perusahaan teknologi besar dalam menguasai infrastruktur AI semakin intensif.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan