Google DeepMind merilis model dasar robot terbaru Gemini Robotics ER 1.6, di mana ER adalah singkatan dari Embodied Reasoning (penalaran berbasis fisik). Model ini mencapai level terbaik saat ini (SOTA) dalam penalaran visual dan spasial, serta sudah tersedia melalui Gemini API. Logan Kilpatrick, petugas hubungan pengembang AI di Google, mengumumkan kabar ini di media sosial. (Sumber)

Apa itu Embodied Reasoning?

Embodied Reasoning adalah kemampuan model AI untuk memahami dan bernalar tentang dunia fisik. Berbeda dari model bahasa tradisional, model penalaran berbasis fisik perlu memproses posisi, bentuk, material, serta hubungan interaksi fisik objek dalam ruang tiga dimensi. Gemini Robotics ER 1.6 dioptimalkan khusus untuk tugas-tugas seperti ini, sehingga robot dapat memahami lingkungan sekitar dengan lebih akurat dan membuat keputusan tindakan yang tepat.

Kemampuan inti

Keunggulan utama Gemini Robotics ER 1.6 berfokus pada dua aspek:

Kemampuan Keterangan Penalaran visual Dapat mengenali objek dari gambar dan video, memahami struktur situasi, lalu membuat keputusan berdasarkan hal tersebut Penalaran spasial Memahami posisi relatif, jarak, dan arah objek dalam ruang tiga dimensi, serta mendukung perencanaan operasi yang kompleks

Kombinasi dua kemampuan ini memungkinkan robot menangani tugas dunia nyata yang lebih kompleks. Misalnya, di lingkungan gudang, robot perlu mengenali berbagai jenis barang dengan bentuk yang berbeda, serta menghitung sudut pengambilan dan posisi penempatan terbaik — ini adalah skenario yang menjadi keahlian Gemini Robotics ER 1.6.

Menggunakan Gemini API

Berbeda dari banyak model robot di masa lalu yang hanya berhenti pada tahap paper, Gemini Robotics ER 1.6 sudah menyediakan akses melalui Gemini API. Artinya, pengembang dan vendor perangkat keras dapat langsung mengintegrasikan model ini ke sistem robot mereka sendiri, tanpa perlu melatih model dari nol.

Keterbukaan API juga menurunkan ambang batas pengembangan AI robot. Di masa lalu, mengembangkan sistem robot yang memiliki kemampuan penalaran visual dan spasial membutuhkan pengumpulan data yang besar serta pekerjaan pelatihan model. Sekarang, pengembang dapat fokus pada pengembangan desain perangkat keras dan skenario penerapannya, sementara kemampuan penalaran tingkat dasar diserahkan untuk ditangani oleh Gemini Robotics ER 1.6.

Tata letak AI robot dari Google

Gemini Robotics ER 1.6 adalah hasil terbaru Google DeepMind di bidang robotika. Dari RT-2 di awal hingga rangkaian Gemini Robotics saat ini, Google terus memperluas kemampuan model bahasa besar ke interaksi dunia fisik. Versi ER 1.6 meningkatkan akurasi penalaran lebih jauh dibanding pendahulunya, terutama tampil lebih baik pada skenario yang membutuhkan operasi presisi.

Seiring industri robot memasuki fase pertumbuhan baru, model dasar dengan kemampuan penalaran visual dan spasial yang kuat akan menjadi infrastruktur kunci. Untuk mengetahui lebih lanjut perkembangan ekosistem Gemini, Anda dapat merujuk ke panduan lengkap Gemini.

Artikel ini Google meluncurkan Gemini Robotics ER 1.6: model robot SOTA yang unggul dalam penalaran visual dan spasial pertama kali muncul di Jaringan Berita ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Dua Startup AI Afrika Selatan Terpilih untuk Google for Startups Accelerator Africa Kelas 10

Berita Industri AI

Dua startup SA, Loop dan Vambo AI, bergabung dengan cohort ke-10 Google’s Accelerator Africa mulai 2.600 aplikasi; Loop meningkatkan mobilitas/pembayaran, Vambo AI menghadirkan AI multibahasa; program berlangsung Apr–Jun 2026 dengan mentor dan lokakarya AI. Abstrak: Dua startup Afrika Selatan, Loop dan Vambo AI, telah terpilih untuk cohort ke-10 Google for Startups Accelerator Africa, dipilih dari sekitar 2.600 pendaftaran dan salah satu dari 15 peserta asal Afrika. Loop mendigitalkan mobilitas dan pembayaran, sementara Vambo AI menyediakan infrastruktur AI multibahasa untuk terjemahan, ucapan, dan generatif AI di berbagai bahasa Afrika. Program 2026 berlangsung 13 April–19 Juni dan menawarkan pendampingan serta lokakarya praktik langsung yang berfokus pada AI/ML. Sejak 2018, akselerator ini telah mendukung 106 startup dari 17 negara di Afrika, membantu mereka mengumpulkan lebih dari $263 juta dan menciptakan lebih dari 2.800 pekerjaan.

GateNews30menit yang lalu

Daftar Forbes AI 50 Menampilkan 20 Perusahaan Baru; OpenAI dan Anthropic Menguasai 80% dari Total Pendanaan

Berita Industri AI

Gerbang Berita, 21 April — Forbes merilis daftar AI 50 edisi kedelapan tahun 2026, yang menampilkan 20 perusahaan baru yang masuk. OpenAI dan Anthropic terus memimpin peringkat, menarik modal besar dari para pemodal ventura papan atas di Silicon Valley serta perusahaan teknologi besar. Total pendanaan gabungan untuk semua perusahaan dalam daftar mencapai $305,6 miliar, dengan OpenAI dan Anthropic menyumbang $242,6 miliar—sekitar 80% dari total.

GateNews40menit yang lalu

Zi Variabel Meluncurkan Model Embodied AI WALL-B; Robot Masuk ke Rumah Nyata dalam 35 Hari

Berita Industri AI

Berita Gate, 21 April — Zibianliang (自变量), sebuah perusahaan robotika asal Tiongkok, mengadakan konferensi pers pada 21 April untuk meluncurkan model fondasi embodied AI generasi terbarunya, WALL-B. Perusahaan tersebut mengumumkan bahwa robot yang ditenagai oleh WALL-B akan masuk ke rumah tangga nyata dalam 35 hari. Menurut pendiri Zibianliang

GateNews1jam yang lalu

OpenAI Menyiapkan Fitur Agents untuk ChatGPT, dengan Kode Nama Hermes

Agen AI Berita Industri AI

Pesan Gate News, 21 April — OpenAI sedang menyiapkan fitur Agents baru untuk ChatGPT, dengan kode nama "Hermes," menurut Tibor Blaho, yang memantau pembaruan produk AI. Fitur ini mencakup pembuat agen baru bernama "studio" yang memungkinkan pengguna membuat agen dari templat, menjadwalkan eksekusi, dan

GateNews2jam yang lalu

SpaceX Memulai Roadshow IPO dengan Pertemuan Analis di Starbase dan Memphis

Saham Berita Industri AI

Pesan Gate News, 21 April — SpaceX telah memulai roadshow pra-IPO minggu ini, mengadakan pertemuan privat untuk analis papan atas dari Wall Street yang berasal dari sektor dirgantara dan teknologi di Texas dan Tennessee, sambil berupaya menuju debut di pasar saham pada akhir Juni. Perusahaan menargetkan pendanaan sebesar $75 miliar, dengan

GateNews2jam yang lalu

OpenAI Meluncurkan Codex Labs

Berita Industri AI

Pesan Gate News, 21 April — OpenAI telah meluncurkan Codex Labs, sebuah platform eksperimental baru.

GateNews2jam yang lalu

Komentar

0/400

Tidak ada komentar