Pengalaman Seorang "Petambak Udang": AI Agent Tidak Semulus yang Dibayangkan

robot
Pembuatan abstrak sedang berlangsung

Ditulis oleh: Haotian

Sebagai seorang “peternak udang”, setelah mengalami penderitaan yang terus-menerus selama beberapa minggu, saya bagikan beberapa pengalaman dan pemahaman tentang peternakan udang ini, semoga bermanfaat:

1)Semua orang tahu bahwa memelihara udang adalah untuk “meningkatkan efisiensi”, tetapi kenyataannya, saat ini sebagian besar orang biasa memelihara udang hanyalah “membuang waktu”. Banyak masalah tak terduga muncul, seperti akun Claude diblokir, kuota API dibatasi, Openclaw tiba-tiba upgrade dan “memori” hilang, dan sebagainya. Hal ini akan menghabiskan sebagian besar waktu, dan peningkatan efisiensi yang didapat jauh dari sepadan;

2)Di timeline Twitter sering muncul berbagai posting tentang kecemasan AI, lihat saja, apa satu perintah bisa membuat Claude mengendalikan seluruh komputer Anda, apa satu Prompt bisa membuat AI mengambil alih pekerjaan Anda secara permanen dan langsung santai, dan sebagainya. Faktanya, tidak hanya tidak santai, sering kali harus coding hingga larut malam untuk satu fitur, memperbaiki bug ini, muncul bug itu, sulit dibayangkan orang yang bahkan tidak mau melakukan sedikit pun selama 5 menit, bisa dengan percaya diri berseru bahwa AGI akan datang, AI akan mengubah segalanya;

3)Memelihara lobster memang bisa mewujudkan banyak mimpi OPC (One Person Company), tetapi batas kemampuan model besar adalah sama untuk semua orang, namun tingkat pemahaman orang berbeda jauh dalam mengendalikan model besar tersebut. Jangan anggap semua orang bisa menjadi Peter Steinberger, Matt Schlicht, dan Andrej Karpathy. Seorang developer hebat dan orang biasa dalam hal pemikiran, kerangka kerja, pengalaman iterasi, tingkat kemampuan, dan hasil yang diberikan, benar-benar bisa berbeda jauh;

4)Pada dasarnya, memelihara lobster adalah membangun OS AI khusus sendiri. Secara teori, semakin banyak jenis model besar yang diintegrasikan secara paralel, jumlah digital employee yang dikelola, tingkat kolaborasi aktif dan pasif, tingkat nested Skills dan penggabungan tugas, semakin besar peluang konflik dan tantangan optimisasi. Harus diingat, memelihara udang bukan masalah “kemampuan model”, melainkan masalah “optimalisasi rekayasa”;

5)Memberikan Opus 4.6 dan Gemini 2.5 Flash lite kepada semua digital employee mungkin bisa melakukan hal yang sama, tetapi yang pertama adalah merekrut elite Wall Street berpengalaman, yang kedua lebih seperti mempekerjakan budak hitam dari daerah kumuh. Mungkin keduanya bisa menyelesaikan fungsi yang sama, tetapi biaya dan hasilnya tidak bisa dibandingkan. Faktanya, waktu yang Anda habiskan untuk memperbaiki bug bisa saja digantikan oleh orang lain dengan “kemampuan finansial”. Memelihara udang memang sangat boros, yang menakutkan adalah, sebagian besar orang menyadari ini, tetapi tetap harus kompromi menggunakan model yang kurang baik dan terus melakukan optimisasi;

6)Memelihara digital employee dan menumpuk LEGO sama seperti menumpuk karyawan, semakin banyak Skills dan Jobs, semakin kompleks skenario yang dihadapi, dan peluang keruntuhan mendadak semakin tinggi. Untuk beberapa tugas, cukup dengan kemampuan yang ada, jangan menuntut lebih dari batas pemahaman sendiri. Disarankan untuk lebih fokus pada rekayasa memori, desain versi Git, dan menghilangkan ilusi model, jika tidak, akan banyak momen yang membuat orang hampir mengalami keruntuhan. Mungkin satu detik sebelumnya merasa sangat puas karena berhasil menyelesaikan permintaan keren, tetapi detik berikutnya bisa langsung runtuh dan menangis. Jangan tanya bagaimana saya tahu;

Itu saja.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan