Karpathy: Pengenalan kemampuan AI mengalami kegagalan yang serius, versi gratis dan Agent terdepan adalah "produk yang sepenuhnya berbeda"

Mantan Kepala AI Tesla dan salah satu pendiri OpenAI, Andrej Karpathy, pada 9 April memublikasikan sebuah tulisan panjang di X, dengan mengatakan bahwa pemahaman publik tentang kemampuan AI sedang mengalami perpecahan yang serius. Ia berpendapat bahwa orang yang menggunakan ChatGPT versi gratis dan teknisi yang setiap hari menggunakan alat agent mutakhir seperti Codex dan Claude Code, sebenarnya sedang membahas “produk yang sepenuhnya berbeda”, tetapi kedua pihak sama-sama merasa bahwa yang mereka lihat adalah gambaran utuh dari AI.

Dua dunia, dua jenis pemahaman AI

Karpathy membagi pengguna AI saat ini menjadi dua kelompok.

Kelompok pertama adalah orang yang pada suatu titik tahun lalu mencoba ChatGPT versi gratis, lalu membentuk kesan mereka secara keseluruhan tentang AI dari sana. Yang mereka lihat adalah berbagai kesalahan model—halusinasi, hasil pencarian yang tidak masuk akal, dan bahkan pola suara yang membuat kesalahan pada pertanyaan sederhana seperti “mengemudi atau berjalan pergi mencuci mobil”. Karpathy mengakui bahwa masalah-masalah ini memang ada, tetapi menekankan bahwa versi gratis dan model yang ketinggalan zaman tidak dapat mewakili kemampuan sebenarnya dari model agent mutakhir sebelum tahun 2026.

Kelompok kedua memenuhi dua syarat sekaligus: menggunakan model agent mutakhir terbaru berbayar (seperti OpenAI Codex atau Claude Code), dan menggunakan secara profesional di bidang-bidang teknis seperti pengembangan perangkat lunak, matematika, dan penelitian. Karpathy menyebut bahwa kelompok ini sedang mengalami “dampak psikologis AI” yang sangat tinggi (AI Psychosis), karena kemajuan terbaru model-model ini di bidang teknis “hanya bisa digambarkan sebagai menakjubkan”—Anda bisa benar-benar menyaksikan mereka menyelesaikan masalah arsitektur perangkat lunak yang semula memerlukan waktu berhari-hari bahkan berminggu-minggu dalam waktu kurang dari satu jam.

Mengapa kemajuan terkonsentrasi di bidang teknis

Karpathy menjelaskan mengapa peningkatan kemampuan AI tampak khususnya signifikan di bidang teknis seperti pengembangan perangkat lunak, tetapi tidak begitu menonjol pada penggunaan umum seperti pencarian, penulisan, dan pemberian saran.

Ada dua penyebab: pertama, bidang teknis menyediakan fungsi penghargaan yang dapat diverifikasi (misalnya, apakah unit test lulus), yang membuat pelatihan reinforcement learning dapat berjalan secara efektif; sementara itu, kualitas tulisan sulit untuk dinilai secara jelas. Kedua, dalam skenario B2B bidang teknis lebih bernilai secara komersial, sehingga perusahaan-perusahaan AI menginvestasikan proporsi terbesar sumber daya tim mereka ke arah-arah tersebut.

Kedua kelompok saling tidak mengerti apa yang dibicarakan pihak lain

Karpathy menyimpulkan bahwa kedua kelompok ini sedang “berbicara pada jalurnya masing-masing”. Mode suara dari versi gratis OpenAI yang membuat masalah sehari-hari berantakan, sementara Codex versi berbayar tingkat tertinggi dari OpenAI dapat, dalam satu jam, merestrukturisasi seluruh basis kode atau menemukan celah sistem—dua hal ini sama-sama benar.

Dalam balasan lanjutan, ia menambahkan bahwa ada orang yang mengajukan pandangan kepadanya: insiden OpenClaw mendapat perhatian sosial yang begitu besar karena insiden itu membuat banyak non-teknisi untuk pertama kalinya berkenalan dengan model agent mutakhir, sementara selama ini mereka hanya tahu bahwa AI itu sama dengan ChatGPT versi web.

Artikel ini Karpathy: Pemahaman tentang kemampuan AI mengalami kesenjangan serius, versi gratis dan Agent mutakhir adalah “produk yang sepenuhnya berbeda” pertama kali muncul di media ABMedia.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Protokol MCP Diserang Kerentanan RCE Tingkat Rancangan; Anthropic Menolak Perubahan Arsitektur

Pesan Gate News, 21 April — Perusahaan keamanan OX Security telah mengungkap kerentanan (RCE) eksekusi kode jarak jauh pada tingkat rancangan dalam MCP (Model Context Protocol), standar terbuka bagi agen AI untuk memanggil alat eksternal, yang dipimpin oleh Anthropic. Penyerang dapat menjalankan perintah sewenang-wenang pada sistem apa pun yang menjalankan implementasi MCP yang rentan, sehingga mendapatkan akses ke data pengguna, basis data internal, kunci API, dan riwayat percakapan apa pun

GateNews51menit yang lalu

0G Foundation Bermitra dengan Alibaba Cloud untuk Membawa LLM Qwen On-Chain bagi AI Agents

Pesan Gate News, 21 April — Yayasan 0G telah bermitra dengan Alibaba Cloud untuk mengintegrasikan rangkaian model bahasa besar Qwen secara on-chain. Melalui mekanisme tokenisasi, pengembang dapat menyematkan akses Qwen langsung ke dalam infrastruktur mereka,

GateNews1jam yang lalu

Nvidia Rilis OpenShell v0.0.33 dengan Driver MicroVM libkrun untuk Penjagaan Sandbox Agen AI

Pesan Gate News, 21 April — runtime sandbox Agen AI open-source Nvidia, OpenShell, baru-baru ini merilis versi v0.0.33, menurut pemantauan oleh Beating. Pembaruan ini memperkenalkan libkrun, driver microVM ringan berbasis KVM, di samping fitur keamanan yang ditingkatkan

GateNews1jam yang lalu

ProCap Financial Bermitra dengan Kalshi untuk Meluncurkan Layanan Riset Pasar Prediksi Berbasis AI

Pesan Berita Gate, 21 April — ProCap Financial, yang didirikan oleh pengusaha kripto Anthony Pompliano, telah bermitra dengan Kalshi, operator pasar prediksi, untuk meluncurkan layanan riset yang berfokus pada analisis pasar prediksi. Layanan ini memanfaatkan pipeline data Kalshi dan agen AI ProCap untuk

GateNews1jam yang lalu

Justin Sun Menyoroti Agen AI sebagai Penggerak Utama Evolusi Kecerdasan Web3

Justin Sun mendesak bahwa Agen AI akan menggantikan interaksi Web3 manual, memungkinkan DApps otonom yang digerakkan oleh niat untuk merencanakan dan mengeksekusi tugas-tugas di rantai, membuka produktivitas, dan mendorong adopsi massal di Genesis Hackathon. Abstrak: Pernyataan Justin Sun dalam Genesis Hackathon menegaskan Agen AI sebagai katalis untuk Web3, menggeser dari operasi manual ke proses otonom yang digerakkan oleh niat yang mengelola tugas-tugas di rantai dan perdagangan lintas rantai, mengatasi hambatan pertumbuhan pengguna, serta merangsang adopsi di seluruh ekosistem.

GateNews1jam yang lalu

Alipay Meluncurkan Pembayaran Agen AI di Hangzhou, Menjangkau 100 Juta Pengguna

Berita Gate, 21 April — Alipay telah meluncurkan layanan pembayaran agen AI di Hangzhou yang memungkinkan agen AI tipe OpenClaw melakukan pembelian dan memproses pembayaran atas nama pengguna. Fitur ini memerlukan pengguna untuk mengaktifkannya, memverifikasi identitas mereka, dan menyetujui setiap transaksi, dengan kontrol risiko dan mekanisme kompensasi yang tersedia.

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar