Kecerdasan berwujud (Embodied AI) sedang memasuki titik balik yang krusial. Baru-baru ini, robot humanoid asal China, Zhi Yuan Robotics, merilis Genie Envisioner World Simulator 2.0 (GE-Sim 2.0), mencoba mendorong World Model (model dunia) dari sekadar alat untuk memahami lingkungan menjadi simulator dunia (World Simulator) yang dapat langsung menjalankan, melatih, dan mengoptimalkan robot.

Jika Anda belum memahami seberapa penting hal ini, mari lihat dulu “cacat bawaan” pada arsitektur LLM: secara logis, LLM yang ada saat ini hanya memprediksi konteks berdasarkan kumpulan data teks yang sangat besar. LLM dapat mengetahui bahwa kata-kata “apel jatuh” sering muncul bersama, tetapi ia tidak benar-benar memahami hubungan kausal gravitasi atau dunia fisik.

Inilah sebabnya ilmuwan seperti Yang LeCun dan Li Fei-Fei terjun ke jalur World Model. Setelah AI memiliki kemampuan untuk memahami lingkungan 3D dan memprediksi fisika, teknologi ini akan menjadi “otak digital” bagi “Physical AI” (AI Berwujud) seperti robot otonom, kendaraan otonom, dan manufaktur cerdas. Karena itu, jalur World Model menegaskan bahwa robot akan menjadi pembawa yang sangat penting. Kini, perusahaan robot humanoid—Zhi Yuan Robotics—masuk ke arena, yang melambangkan pionir dari kebangkitan China dari sisi perangkat keras.

Sebelumnya, Ketua Dewan TSMC, Wei Zhejia, pernah menyatakan: jika melihat China daratan terus membuat robot yang bisa meloncat-loncat melompat-lompat, itu tidak berguna; hanya sekadar tampak bagus saja. Ia menekaskan kuncinya adalah membuat “otak” robot dapat berfungsi. Siapa yang membuat “otak” itu, yaitu Nvidia (Nvidia), AMD (AMD), dan banyak perusahaan Amerika, tetapi 95% “otak” diproduksi oleh TSMC. Hambatan pengembangan GE-Sim 2.0 masih ada, dan perkembangannya sangat terikat pada perkembangan model dari China.

Jalur World Model menyatakan, robot adalah pembawa yang kunci

LLM arus utama saat ini mengandalkan kumpulan data yang besar dan hubungan statistik untuk memahami konteks, serta memprediksi kata berikutnya. Ia bisa mengetahui bahwa kata-kata “apel jatuh” biasanya muncul bersama, tetapi tidak benar-benar memahami hubungan kausal gravitasi atau dunia fisik.

Pola ini tampil sangat baik dalam tugas seperti generasi teks, bantuan pemrograman, atau tanya jawab, namun masih memiliki keterbatasan mendasar pada skenario yang membutuhkan pemahaman struktur dunia nyata, penalaran hubungan kausal, dan perencanaan jangka panjang. Masalah yang lebih besar adalah sumber data yang perlahan mulai menipis. Pelatihan LLM sangat bergantung pada data manusia berkualitas tinggi, dan dalam beberapa tahun terakhir industri sudah mulai memperingatkan bahwa data teks manusia yang tersedia mungkin akan habis dalam beberapa tahun ke depan. Saat itu, seperti inbreeding yang berpotensi menurunkan cacat genetik, pada akhirnya membuat model semakin menjauh dari kenyataan dan mengalami penurunan performa.

(Analisis mendalam: Apakah LLM punya kekurangan? Mengapa Yang LeCun bertaruh pada AMI untuk jalur World Model)

Itulah mengapa dalam beberapa tahun terakhir, dua tokoh besar di bidang riset AI—Yang LeCun dan Li Fei-Fei yang disebut “Ibu kandung AI”—keduanya memilih untuk bertaruh pada arsitektur AI generasi baru yang dikenal sebagai World Model (model dunia).

Saat itu, penulis pernah menyatakan: jika dilihat lebih jauh, setelah AI memiliki kemampuan untuk memahami lingkungan 3D dan kemampuan prediksi fisik, teknologi ini akan menjadi “otak digital” bagi “Physical AI” (AI Berwujud) seperti robot otonom, kendaraan otonom, dan manufaktur cerdas. Oleh karena itu, jalur World Model menegaskan bahwa robot akan menjadi pembawa yang sangat penting. Kini, perusahaan robot humanoid Zhi Yuan Robotics masuk ke industri, yang melambangkan pionir kebangkitan China dari sisi perangkat keras.

Sebelumnya, Ketua TSMC Wei Zhejia, saat membahas perkembangan robot dan semikonduktor, terus terang mengatakan bahwa jika melihat China daratan terus membuat robot yang bisa lompat-lompat melompat-lompat, itu tidak ada gunanya, hanya sekadar tampak bagus. Ia menunjukkan bahwa kuncinya ada pada kemampuan agar “otak” robot bisa bekerja; dan soal “otak” itu dibuat oleh siapa, yaitu Nvidia (Nvidia), AMD (AMD), dan banyak perusahaan Amerika, tetapi 95% “otak” diproduksi oleh TSMC.

(Wei Zhejia dari TSMC mengkritik: Robot China cuma bisa loncat-loncat, itu cuma tampak bagus—tidak ada gunanya! Kuncinya tetap dari Nvidia)

Evolusi World Model: dari memahami dunia, hingga belajar di dalam dunia

Dalam beberapa tahun terakhir, World Model selalu dianggap sebagai teknologi kunci untuk memahami dunia nyata dalam AI. Melalui citra, bahasa, dan data sensor, model dapat memprediksi perubahan lingkungan, sehingga memberi robot kemampuan pengambilan keputusan dasar.

Namun, terobosan inti GE-Sim 2.0 bukan sekadar memahami dunia, melainkan belajar dan sistem bertindak langsung di “dunia yang dihasilkan oleh model”. Variabel utama memasukkan Action (aksi) ke dalam inti, meningkatkan dari prediksi status tradisional menjadi siklus penuh:

State

Action

State Evolution

Artinya, robot tidak lagi hanya mengamati dan merespons, melainkan bisa secara aktif mencoba-coba, mengoptimasi sendiri, dan terus belajar di lingkungan simulasi. Pergantian ini membuat World Model berevolusi dari “model kognitif” menjadi “infrastruktur pelatihan”.

GE-Sim 2.0: Membuat robot “berevolusi” di dunia virtual

GE-Sim 2.0 didefinisikan sebagai seperangkat “simulator dunia berwujud”. Sasaran utamanya adalah memecahkan tiga hambatan utama pelatihan di dunia nyata: biaya yang terlalu tinggi, data yang tidak cukup, dan sulit untuk diskalakan. Melalui lingkungan yang dihasilkan oleh model, sistem dapat melatih robot dalam skala besar tanpa bergantung pada dunia nyata.

Secara teknis, GE-Sim 2.0 mengintegrasikan tiga kemampuan kunci: pertama adalah “pembuatan citra yang digerakkan oleh tindakan” (action-driven image generation). Model dapat menghasilkan gambar masa depan yang sesuai berdasarkan aksi robot, sambil mempertahankan konsistensi multi-sudut pandang, termasuk sudut pandang kepala dan sudut pandang operasi tangan kiri dan tangan kanan.

Kedua adalah pemodelan proprioception (proprioception). Tidak hanya mensimulasikan tampilan eksternal, tetapi juga memprediksi kondisi sendi dan status gerakan robot sendiri, sehingga pengambilan keputusan lebih mendekati dunia fisik yang sebenarnya.

Ketiga adalah “evaluasi tugas otomatis”. Melalui reward model (model hadiah) bawaan, sistem dapat menilai secara otomatis apakah sebuah tugas telah selesai—misalnya “menempatkan benda biru ke dalam kotak merah”—dan memberikan umpan balik, yang langsung digunakan untuk reinforcement learning. Ini membuat robot dapat menyelesaikan siklus tertutup penuh di lingkungan simulasi:

GE-Sim 2.0 sudah dapat mewujudkan pembuatan video yang stabil pada tingkat “menit”

Dibandingkan model-model awal yang hanya mampu menghasilkan cuplikan singkat, GE-Sim 2.0 sudah dapat menghasilkan video yang stabil pada tingkat “menit”, serta mendukung simulasi tugas dalam jangka waktu lama. Pada saat yang sama, melalui pelatihan menggunakan data nyata dalam skala besar (data operasi jarak jauh, deployment, dan interaksi), model memiliki kemampuan generalisasi yang lebih kuat di antara skenario dan tugas yang berbeda. Ini sangat penting untuk robot humanoid, karena operasi di dunia nyata sangat beragam, sehingga tidak bisa hanya dilatih pada skenario yang tetap.

Kemunculan World Simulator berarti robot bisa “latihan tanpa batas” di dunia virtual. Ini akan membawa dua perubahan struktural: pertama, biaya pelatihan turun secara signifikan. Kedua, kecepatan iterasi kemampuan meningkat secara eksponensial.

Zhi Yuan Robotics: Kekuatan baru robot humanoid dari China

Zhi Yuan Robotics didirikan pada 2023 oleh Peng Zhihui, “anak jenius” dari Huawei, dengan fokus pada bidang kecerdasan berwujud yang menggabungkan AI dan robot.

Produk inti perusahaan meliputi:

Robot humanoid seri “Yuan Zheng”

Sistem robot “Lingxi”

Model general GO-1

Saat ini telah menyelesaikan beberapa putaran pendanaan, dan memperoleh investasi dari lembaga seperti Sequoia China dan Hillhouse Capital. Perusahaan ini dianggap sebagai pemain penting dalam industri robot humanoid China, dengan persaingan yang membentuk peta kompetisi bersama Unitree Technology.

Artikel ini Zhi Yuan GE-Sim 2.0: menggunakan World Model untuk menghasilkan dunia, rival kuat Unitree mendorong robot humanoid menuju self-evolution pertama kali muncul di Chain News ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Ekonom menyebutkan peluang kerja setelah gelombang pengangguran akibat AI: nilai kelangkaan beralih ke “layanan emosional”

Berita Industri AI

Imas menunjukkan bahwa AI tidak akan sepenuhnya menggantikan tenaga manusia, melainkan memindahkan kelangkaan menjadi ekonomi yang berpusat pada emosi dan relasi. Eksperimen Starbucks mengungkap kelemahan otomatisasi, dan retensi pelanggan bergantung pada cara memperlakukan tamu serta suasana. Transformasi struktur historis dan fenomena Baumol menjelaskan bahwa AI menurunkan harga produk berbasis standardisasi, sehingga kelangkaan bergeser menuju nilai persepsi tinggi yang memerlukan interaksi interpersonal. Titik fokus di masa depan ada pada layanan emosional dan bidang seperti buatan tangan, tetapi isu distribusi global dan pendapatan dasar masih perlu diselesaikan.

ChainNewsAbmedia6menit yang lalu

Artefak Claude Live: Dasbor terhubung langsung ke Aplikasi, pembaruan otomatis secara real-time

Berita Industri AI

Berdasarkan pengumuman resmi X dari Claude, Anthropic meluncurkan fitur Live Artifacts di Cowork aplikasi desktop Claude pada 20 April, memungkinkan grafik, dasbor, dan pelacak yang dihasilkan AI untuk langsung terhubung dengan aplikasi dan file pengguna, serta otomatis diperbarui dengan data terbaru saat dibuka. Live Artifacts dibuka untuk pengguna Cowork dari semua paket berbayar Claude (Pro, Max, Team, Enterprise). Fitur inti Live Artifacts: dari output statis hingga keterhubungan secara real-time Di masa lalu, setelah Claude Artifacts dihasilkan, keduanya langsung terlepas dari kenyataan—jika pengguna ingin memperbarui data, satu-satunya cara adalah menempelkan ulang data, lalu meminta Claude menghasilkan ulang. L

ChainNewsAbmedia26menit yang lalu

Startup Penyimpanan AI Korea Selatan Dnotitia Menggalang Pendanaan Seri A Senilai $61.2M

Berita Industri AI

Pesan dari Gate News, 21 April — startup penyimpanan AI asal Korea Selatan Dnotitia menggalang 90 miliar won (US$61.2 juta) dalam putaran pendanaan Seri A yang dipimpin oleh Elohim Partners. Kiwoom Investment dan Shinhan Venture Investment juga ikut berpartisipasi dalam putaran tersebut. Produk utama Dnotitia adalah database vektor Seahorse

GateNews29menit yang lalu

Pendirian Pi Network 7 Mei membahas identifikasi identitas manusia di era AI pada Consensus 2026

pi network news Kemitraan & Ekosistem Berita Industri AI

Pendiri Pi Network, Nicolas Kokkalis, akan menghadiri konferensi Consensus 2026 yang diadakan di Miami pada 7 Mei, dengan bergabung dalam panel ahli yang membahas isu identitas manusia dalam era kecerdasan buatan (AI) secara daring. Berdasarkan susunan acara resmi, diskusi panel kali ini akan menghadirkan para ahli di bidang identitas, privasi, dan kepercayaan digital.

MarketWhisper1jam yang lalu

DeepX dan Hyundai Motor Group Mengembangkan Platform Chip AI Berdaya Rendah untuk Robot

Berita Industri AI AI Tools & Aplikasi

DeepX asal Korea Selatan dan Lab Robotika milik Hyundai Motor Group berkolaborasi untuk mengembangkan platform komputasi AI berdaya rendah bagi aplikasi robotik real-time. Dengan memanfaatkan chip DX-M2 dari DeepX, kemitraan ini bertujuan mengoptimalkan robotika dengan biaya dan konsumsi daya yang lebih rendah, mencerminkan tren penggunaan chip khusus di industri.

GateNews1jam yang lalu

Playdate Melarang Seni, Musik, dan Teks yang Dibuat AI; Asisten Pengodean Masih Diizinkan

Berita Industri AI

Panic Inc. mengumumkan larangan penggunaan alat AI generatif untuk seni, musik, penulisan, dan dialog dalam game untuk konsol Playdate-nya. Asisten penulisan kode berbasis AI diperbolehkan dengan pengungkapan. Keputusan ini mengikuti reaksi balik atas game yang dikembangkan oleh AI.

GateNews2jam yang lalu

Komentar

0/400

Tidak ada komentar