CEO Google DeepMind, pemenang Nobel Kimia Demis Hassabis, mengunjungi Y Combinator, membahas kemajuan kunci menuju AGI, memberi saran kepada pengusaha tentang bagaimana tetap unggul, serta di mana kemungkinan munculnya terobosan ilmiah besar berikutnya.

Judgment paling praktis bagi pengusaha teknologi mendalam adalah, jika Anda memulai proyek teknologi mendalam jangka sepuluh tahun hari ini, Anda harus memasukkan munculnya AGI ke dalam perencanaan. Selain itu, dia juga mengungkapkan bahwa Isomorphic Labs (perusahaan farmasi AI yang dipisahkan dari DeepMind) akan mengumumkan berita besar dalam waktu dekat.

Kutipan Paling Berkesan

Rencana dan garis waktu AGI

·「Komponen teknologi yang ada saat ini hampir pasti akan menjadi bagian dari arsitektur akhir AGI.」

·「Pembelajaran berkelanjutan, penalaran jangka panjang, dan beberapa aspek memori masih belum terselesaikan, AGI harus mengatasi semuanya.」

·「Jika garis waktu AGI Anda sekitar tahun 2030 seperti saya, dan Anda memulai proyek teknologi mendalam hari ini, Anda harus mempertimbangkan bahwa AGI akan muncul di tengah jalan.」

Memori dan jendela konteks

·「Jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Tapi masalahnya, kita memasukkan semua hal ke dalamnya, termasuk informasi yang tidak penting dan salah, dan saat ini cara ini cukup kasar.」

·「Jika harus memproses aliran video real-time dan menyimpan semua token, satu juta token sebenarnya cukup untuk sekitar 20 menit.」

Kekurangan dalam penalaran

·「Saya suka bermain catur dengan Gemini. Kadang-kadang dia sadar ini langkah buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya dia jalanin saja langkah buruk itu. Tapi sistem penalaran yang akurat seharusnya tidak seperti itu.」

·「Di satu sisi dia bisa menyelesaikan soal setingkat medali emas IMO, di sisi lain, jika ditanya dengan cara berbeda, dia bisa melakukan kesalahan matematika dasar. Dalam introspeksi proses berpikirnya, sepertinya masih kurang sesuatu.」

Agent dan kreativitas

·「Untuk mencapai AGI, Anda harus memiliki sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Agent adalah jalur itu, saya rasa kita baru mulai.」

·「Saya belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak peringkat toko aplikasi. Dengan usaha saat ini, itu mungkin, tapi belum terjadi. Ini menunjukkan alat atau prosesnya masih kurang sesuatu.」

Distilasi dan model kecil

·「Asumsi kami adalah, setelah model Pro terbaru dirilis selama setengah tahun sampai satu tahun, kemampuannya bisa dikompresi ke model yang sangat kecil dan bisa dijalankan di perangkat edge. Sampai sekarang, kami belum menemui batas densitas informasi secara teori.」

Penemuan ilmiah dan “Tes Einstein”

·「Kadang-kadang saya menyebutnya ‘Tes Einstein’, yaitu apakah bisa melatih sistem dengan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil yang dibuat Einstein pada tahun 1905, termasuk relativitas khusus. Jika bisa, sistem ini tidak jauh dari penemuan sesuatu yang benar-benar baru.」

·「Menyelesaikan satu masalah hadiah Millennium Prize sudah luar biasa. Tapi yang lebih sulit adalah, apakah bisa mengajukan satu set masalah Millennium Prize baru yang dianggap oleh matematikawan top sama mendalam dan layak dipelajari seumur hidup.」

Saran untuk startup teknologi mendalam

·「Mengikuti masalah yang sulit dan yang sederhana sebenarnya mirip, hanya caranya berbeda. Hidup ini singkat, lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain.」

Jalur Realisasi AGI

Gary Tan: Anda telah memikirkan AGI hampir lebih lama dari semua orang. Melihat paradigma saat ini, menurut Anda, berapa banyak arsitektur akhir AGI yang sudah kita miliki? Apa yang secara fundamental masih hilang?

Demis Hassabis: Pre-training skala besar, RLHF, chain of thought, saya yakin semuanya akan menjadi bagian dari arsitektur akhir AGI. Teknologi ini sudah terbukti banyak hal. Saya sulit membayangkan dalam dua tahun ke depan kita akan menemukan jalan buntu, itu tidak masuk akal bagi saya. Tapi di atas apa yang sudah ada, mungkin masih kurang satu atau dua hal. Continual learning, reasoning jangka panjang, dan beberapa aspek memori, masih ada masalah yang belum terselesaikan.

AGI harus semua diselesaikan. Mungkin teknologi yang ada ditambah inovasi bertahap bisa mencapai tingkat itu, tapi juga mungkin masih ada satu atau dua kunci utama yang perlu ditembus. Saya rasa tidak lebih dari satu atau dua. Penilaian pribadi saya, peluang adanya masalah utama yang belum terpecahkan itu sekitar 50:50. Jadi di Google DeepMind, kami sedang mengembangkan kedua jalur tersebut.

Gary Tan: Saya berinteraksi dengan banyak sistem Agent, yang paling mengejutkan saya adalah, dasar-dasarnya selalu sama, berulang-ulang dengan bobot yang sama. Jadi konsep pembelajaran berkelanjutan sangat menarik, karena saat ini kita hampir menempelkan semuanya secara temporer, seperti yang dilakukan dalam siklus mimpi malam hari.

Demis Hassabis: Betul, siklus mimpi itu keren. Kami pernah memikirkan ini dalam integrasi memori situasional. Saya meneliti tentang bagaimana hippocampus secara elegan mengintegrasikan pengetahuan baru ke dalam sistem pengetahuan yang sudah ada. Otak sangat hebat dalam hal ini.

Proses ini dilakukan saat tidur, terutama selama tidur REM, dengan memutar ulang pengalaman penting untuk belajar. Program Atari awal kami, DQN (DeepMind 2013, jaringan Q deep yang pertama kali menggunakan reinforcement learning untuk mencapai level manusia di game Atari), mampu menguasai game Atari dengan metode replay pengalaman.

Ini belajar dari neuroscience, memutar ulang jalur keberhasilan. Itu sudah tahun 2013, di bidang AI termasuk kuno, tapi saat itu sangat penting.

Saya setuju, saat ini kita memang menambal dengan lem. Memasukkan semua ke dalam jendela konteks. Rasanya tidak benar. Secara teori, kita bisa punya jendela konteks jutaan atau puluhan juta token, dan memori yang sempurna, tapi biaya pencarian dan retrieval tetap ada. Dalam pengambilan keputusan saat ini, menemukan informasi yang benar-benar relevan tidak mudah, meskipun semua data tersimpan. Jadi saya rasa bidang memori masih punya ruang inovasi besar.

Gary Tan: Jujur saja, jendela konteks satu juta token sudah jauh lebih besar dari yang saya bayangkan, dan bisa melakukan banyak hal.

Demis Hassabis: Untuk sebagian besar skenario penggunaannya, itu sudah cukup besar. Tapi bayangkan, jendela konteks kira-kira setara dengan memori kerja. Memori kerja manusia rata-rata hanya tujuh angka, kita punya jendela konteks jutaan bahkan puluhan juta token. Masalahnya, kita memasukkan semua, termasuk yang tidak penting dan salah, dan cara ini cukup kasar. Kalau harus memproses aliran video real-time dan menyimpan semua token, satu juta token hanya cukup untuk sekitar 20 menit. Tapi jika ingin sistem memahami kehidupan Anda selama satu atau dua bulan, itu jauh dari cukup.

Gary Tan: DeepMind selalu sangat fokus pada reinforcement learning dan pencarian, filosofi ini sangat tertanam dalam pembangunan Gemini. Seberapa dalam Anda mengintegrasikan filosofi ini ke dalam proses? Apakah reinforcement learning masih diremehkan?

Demis Hassabis: Mungkin memang masih diremehkan. Perhatian terhadapnya naik turun. Sejak hari pertama di DeepMind, kami sudah mengerjakan sistem Agent. Semua pekerjaan di Atari dan AlphaGo, pada dasarnya adalah reinforcement learning Agent, sistem yang mampu secara mandiri mencapai tujuan, membuat keputusan, dan merencanakan. Tentu saja waktu itu kami memilih bidang game karena kompleksitasnya bisa dikendalikan, lalu secara bertahap mengerjakan game yang lebih kompleks, seperti AlphaGo, kemudian AlphaStar, dan seterusnya.

Pertanyaan berikutnya adalah, apakah model ini bisa digeneralisasi menjadi model dunia atau bahasa, bukan hanya model game. Kami sudah mengerjakan ini selama beberapa tahun terakhir. Saat ini, pola pikir dan chain of thought dari model-model terdepan sebenarnya adalah kembalinya dari apa yang AlphaGo mulai dulu.

Saya rasa banyak pekerjaan yang kami lakukan dulu sangat relevan dengan apa yang kita lakukan sekarang, kita sedang meninjau kembali ide-ide lama dengan skala lebih besar dan lebih umum, termasuk Monte Carlo tree search dan berbagai metode reinforcement learning lainnya. Ide-ide dari AlphaGo dan AlphaZero sangat terkait dengan model dasar saat ini, dan saya rasa banyak kemajuan dalam beberapa tahun ke depan akan berasal dari sini.

Distilasi dan model kecil

Gary Tan: Sekarang untuk menjadi lebih pintar, kita membutuhkan model yang lebih besar, tapi di saat yang sama, teknik distilasi juga berkembang, sehingga model kecil bisa menjadi cukup cepat. Model Flash kalian sangat kuat, mampu mencapai sekitar 95% dari performa model terdepan, tapi harganya hanya sepersepuluhnya. Benar begitu?

Demis Hassabis: Saya rasa ini salah satu keunggulan utama kami. Anda harus membangun model terbesar dulu untuk mendapatkan kemampuan terdepan. Salah satu keunggulan kami adalah mampu dengan cepat mendistilasi dan mengompresi kemampuan tersebut ke model yang semakin kecil. Metode distilasi ini sebenarnya kami yang ciptakan, dan kami masih menjadi yang terdepan di dunia. Selain itu, ada motivasi bisnis yang kuat untuk melakukan ini. Kami mungkin adalah platform aplikasi AI terbesar di dunia.

Dengan AI Overviews dan AI Mode, serta Gemini, sekarang setiap produk Google, termasuk Maps, YouTube, dan lain-lain, mengintegrasikan Gemini atau teknologi terkait. Ini menyentuh miliaran pengguna dan puluhan produk dengan miliaran pengguna. Mereka harus sangat cepat, efisien, biaya rendah, dan latensi rendah. Ini memberi kami motivasi besar untuk mengoptimalkan Flash dan model Flash-Lite yang lebih kecil agar sangat efisien, dan saya berharap ini akhirnya bisa melayani berbagai kebutuhan pengguna.

Gary Tan: Saya penasaran, seberapa pintar model kecil ini sebenarnya? Apakah distilasi memiliki batas? Apakah model 50B atau 400B bisa secerdas model terdepan saat ini?

Demis Hassabis: Saya rasa kita belum mencapai batas teori informasi, setidaknya saat ini tidak ada yang tahu. Mungkin suatu saat akan menemui batas densitas informasi tertentu, tapi asumsi kami saat ini adalah, setelah model Pro terbaru dirilis selama setengah tahun sampai satu tahun, kemampuannya bisa dikompresi ke model yang sangat kecil dan bisa dijalankan di perangkat edge.

Kita juga bisa melihat ini di model Gemma, di mana Gemma 4 menunjukkan performa sangat kuat dengan ukuran yang sama. Ini berkat banyak teknik distilasi dan optimisasi efisiensi model kecil. Jadi saya benar-benar tidak melihat batas teori, dan saya rasa kita masih jauh dari batas itu.

Gary Tan: Saat ini ada fenomena yang cukup luar biasa, yaitu jumlah pekerjaan yang bisa dilakukan engineer meningkat sekitar 500 sampai 1000 kali dibandingkan enam bulan lalu. Ada orang di ruangan ini yang melakukan pekerjaan setara dengan 1000 engineer Google dari tahun 2000-an. Steve Yegge pernah membahas ini.

Demis Hassabis: Saya merasa sangat antusias. Model kecil punya banyak kegunaan. Salah satunya biaya rendah dan kecepatan tinggi, yang juga membawa manfaat. Dalam coding atau tugas lain, Anda bisa beriterasi lebih cepat, terutama saat berkolaborasi dengan sistem. Sistem yang cepat, meskipun tidak paling canggih, misalnya hanya 90-95% dari kemampuan terdepan, sudah cukup, dan kecepatan iterasi yang lebih tinggi akan memberi keuntungan jauh melebihi 10% tambahan kemampuan itu.

Selain itu, ada arah besar untuk menjalankan model ini di perangkat edge, bukan hanya demi efisiensi, tapi juga untuk privasi dan keamanan. Bayangkan berbagai perangkat yang menangani data pribadi, dan robot. Untuk robot di rumah, Anda ingin menjalankan model yang efisien dan kuat secara lokal, hanya mengandalkan cloud untuk tugas tertentu. Audio dan video diproses secara lokal, data tetap di tempat. Saya membayangkan ini akan menjadi kondisi ideal.

Memori dan penalaran

Gary Tan: Kembali ke konteks dan memori. Saat ini model bersifat stateless, jika ada kemampuan belajar berkelanjutan, seperti apa pengalaman pengembang? Bagaimana Anda mengarahkan model seperti itu?

Demis Hassabis: Pertanyaan ini sangat menarik. Kurangnya pembelajaran berkelanjutan adalah salah satu hambatan utama bagi Agent saat ini untuk menyelesaikan tugas lengkap. Agent saat ini sangat berguna untuk bagian-bagian lokal dari tugas, Anda bisa menggabungkan mereka untuk melakukan hal-hal keren, tapi mereka tidak mampu beradaptasi dengan lingkungan spesifik Anda. Inilah mengapa mereka belum bisa benar-benar “dilepaskan dan tidak dipantau”, mereka perlu belajar dari konteks spesifik Anda. Untuk mencapai kecerdasan umum yang benar-benar, masalah ini harus diselesaikan.

Gary Tan: Kemajuan dalam penalaran sampai di mana? Saat ini, chain of thought mereka cukup kuat, tapi mereka masih melakukan kesalahan yang seharusnya tidak dilakukan oleh mahasiswa cerdas. Apa yang perlu diubah? Apa prediksi Anda tentang kemajuan penalaran?

Demis Hassabis: Masih banyak ruang inovasi dalam paradigma berpikir. Apa yang kita lakukan masih cukup kasar dan brutal. Banyak arah perbaikan, seperti memonitor proses chain of thought dan melakukan intervensi di tengah proses berpikir. Saya sering merasa, baik sistem kita maupun kompetitor, kadang terlalu banyak berpikir, terjebak dalam siklus.

Saya suka menggunakan Gemini untuk bermain catur sebagai contoh. Semua model dasar terdepan sebenarnya cukup buruk dalam catur, ini menarik.

Melihat jalur pikir mereka sangat berharga, karena catur adalah domain yang sangat dipahami, saya bisa dengan cepat menilai apakah mereka menyimpang, apakah penalaran mereka valid. Yang saya lihat, kadang mereka mempertimbangkan langkah buruk, sadar itu buruk, tapi tidak bisa menemukan yang lebih baik, akhirnya jalanin saja langkah buruk itu. Sistem penalaran yang akurat seharusnya tidak seperti itu.

Perbedaan besar ini masih ada, tapi memperbaikinya mungkin hanya butuh satu atau dua penyesuaian. Itulah mengapa muncul istilah “kecerdasan bergelombang” (jagged intelligence), yang bisa menyelesaikan soal medali emas IMO, tapi jika ditanya dengan cara berbeda, bisa melakukan kesalahan matematika dasar. Dalam introspeksi proses berpikirnya, sepertinya masih kurang sesuatu.

Kemampuan Agent yang sebenarnya

Gary Tan: Agent adalah topik besar. Ada yang bilang ini hype. Saya pribadi rasa kita baru mulai. Penilaian internal di DeepMind tentang kemampuan Agent yang sebenarnya, dan seberapa jauh berbeda dari promosi eksternal?

Demis Hassabis: Saya setuju, kita baru mulai. Untuk mencapai AGI, Anda harus punya sistem yang mampu secara aktif menyelesaikan masalah untuk Anda. Ini sudah jelas bagi kami sejak awal. Agent adalah jalur itu, saya rasa kita baru mulai.

Semua orang sedang bereksperimen bagaimana membuat Agent lebih baik dalam bekerja sama, banyak yang sudah dilakukan dalam eksperimen pribadi, dan banyak orang di sini pasti juga. Bagaimana membuat Agent terintegrasi dalam alur kerja, bukan sekadar pelengkap, tapi benar-benar melakukan hal-hal fundamental. Saat ini kita masih dalam tahap eksperimen. Baru dalam dua atau tiga bulan terakhir kita mulai menemukan skenario yang sangat berharga. Teknologi ini mungkin sudah cukup matang, bukan lagi main-main, tapi benar-benar memberi nilai tambah dalam efisiensi dan waktu.

Sering saya lihat orang menjalankan puluhan Agent selama puluhan jam, tapi saya belum yakin hasilnya sepadan dengan usaha tersebut.

Kami juga belum melihat ada yang menggunakan vibe coding untuk membuat game AAA yang menduduki puncak toko aplikasi. Saya sendiri pernah membuat prototipe, banyak yang lain juga pernah membuat demo kecil yang bagus. Saya bisa membuat prototipe “Theme Park” dalam setengah jam, sedangkan dulu waktu saya 17 tahun, butuh enam bulan.

Saya merasa, jika menghabiskan satu musim panas penuh, bisa menghasilkan sesuatu yang benar-benar luar biasa. Tapi tetap butuh craftsmanship dan jiwa manusia, selera, memastikan hal-hal ini masuk ke produk yang kita bangun. Saat ini, belum ada anak muda yang menjual game blockbuster lebih dari sejuta kopi, padahal dengan alat dan usaha saat ini, itu seharusnya bisa. Jadi, ada yang kurang, mungkin prosesnya, mungkin alatnya. Saya prediksi dalam 6 sampai 12 bulan ke depan, kita akan melihat hasil seperti itu.

Gary Tan: Seberapa besar kemungkinan semuanya akan otomatis sepenuhnya? Saya rasa tidak akan langsung otomatis penuh. Kemungkinan besar, orang di sini akan mencapai efisiensi 1000 kali lipat dulu, lalu muncul orang yang menggunakan alat ini untuk membuat aplikasi dan game populer, dan baru kemudian otomatisasi di bagian lain.

Demis Hassabis: Betul, itu yang harus Anda lihat dulu.

Gary Tan: Ada juga yang melakukan itu, tapi mereka enggan mengungkapkan seberapa banyak Agent membantu.

Demis Hassabis: Mungkin begitu. Tapi saya ingin bahas tentang kreativitas. Saya sering memakai contoh AlphaGo, terutama langkah ke-37 di pertandingan kedua. Bagi saya, saya menunggu momen seperti itu muncul, dan setelah itu saya mulai proyek ilmiah seperti AlphaFold. Kami mulai mengerjakan AlphaFold sehari setelah kembali dari Seoul, itu sekitar sepuluh tahun lalu. Saya ke Korea untuk merayakan ulang tahun ke-10 AlphaGo.

Tapi hanya keluar dari langkah ke-37 saja tidak cukup. Itu keren dan berguna, tapi apakah sistem ini bisa menemukan inovasi dalam permainan Go sendiri? Kalau Anda berikan deskripsi tingkat tinggi, misalnya “game yang bisa dipelajari dalam lima menit, tapi membutuhkan seumur hidup untuk mahir, secara estetika sangat elegan, bisa selesai satu pertandingan dalam satu sore,” lalu sistem mengembalikan hasil berupa Go, itu belum bisa dilakukan sistem saat ini. Kenapa?

Gary Tan: Mungkin ada orang di sini yang bisa melakukannya.

Demis Hassabis: Kalau ada yang bisa, jawabannya bukan karena sistem kekurangan sesuatu, tapi karena cara kita menggunakan sistemnya salah. Mungkin memang saat ini sistem sudah punya kemampuan itu, hanya butuh orang jenius untuk mengarahkan, memberi jiwa pada proyek tersebut, dan orang itu harus sangat menyatu dengan alatnya. Kalau Anda menghabiskan waktu siang malam dengan alat-alat ini dan punya kreativitas mendalam, mungkin Anda bisa menciptakan sesuatu yang luar biasa.

Open source dan model multimodal

Gary Tan: Mari beralih ke open source. Baru-baru ini, peluncuran Gemma memungkinkan model yang sangat kuat bisa dijalankan secara lokal. Bagaimana pandangan Anda? Apakah AI akan menjadi sesuatu yang dikendalikan pengguna sendiri, bukan lagi di cloud utama? Apakah ini akan mengubah siapa yang bisa membangun produk dengan model-model ini?

Demis Hassabis: Kami adalah pendukung kuat open source dan ilmu pengetahuan terbuka. Contohnya, AlphaFold kami buka secara gratis seluruhnya. Sampai saat ini, karya ilmiah kami tetap dipublikasikan di jurnal top. Untuk Gemma, kami ingin menciptakan model terdepan di kelasnya. Saat ini, Gemma sudah diunduh sekitar 40 juta kali dalam dua setengah minggu sejak peluncuran.

Saya juga percaya pentingnya keberadaan ekosistem open source dengan tumpukan teknologi Barat. Model open source dari China sangat bagus dan saat ini memimpin, tapi kami yakin Gemma sangat kompetitif di kelasnya.

Bagi kami, ada masalah sumber daya, tidak ada yang punya kapasitas berlebih untuk mengerjakan dua model terdepan secara bersamaan. Jadi, keputusan kami saat ini adalah: model edge untuk Android, kacamata, robot, dan lain-lain, sebaiknya dibuat terbuka, karena begitu di-deploy ke perangkat, mereka sudah terekspos, jadi lebih baik dibuka sepenuhnya. Kami menyatukan strategi terbuka secara nano, ini juga masuk akal secara strategis.

Gary Tan: Sebelum tampil, saya tunjukkan demo OS AI yang saya buat, saya bisa berinteraksi dengan Gemini lewat suara langsung. Saya agak gugup saat menampilkan, tapi ternyata berhasil. Gemini sejak awal memang dibangun sebagai multimodal. Saya sudah coba banyak model, interaksi suara langsung ke model plus kemampuan panggil alat dan pemahaman konteks, saat ini tidak ada yang bisa menandingi Gemini.

Demis Hassabis: Betul. Salah satu keunggulan Gemini yang belum cukup dikenal adalah, sejak awal kami membangun dengan pendekatan multimodal. Ini membuat langkah awal lebih sulit dibanding hanya teks, tapi kami yakin ini akan memberi manfaat jangka panjang, dan saat ini sudah mulai terwujud.

Misalnya dalam model dunia, kami membangun Genie di atas Gemini (model lingkungan interaktif generatif dari DeepMind). Di bidang robotik, Gemini Robotics akan dibangun di atas model multimodal, dan keunggulan kami di multimodal akan menjadi benteng kompetitif. Kami juga semakin banyak menggunakan Gemini di Waymo (perusahaan self-driving dari Alphabet).

Bayangkan asisten digital yang mengikuti Anda ke dunia nyata, mungkin di ponsel atau kacamata, yang harus memahami dunia fisik dan lingkungan sekitar. Sistem kami sangat kuat di bidang ini. Kami akan terus berinvestasi di arah ini, dan saya yakin keunggulan kami di bidang ini sangat besar.

Gary Tan: Biaya penalaran semakin cepat turun. Ketika penalaran hampir gratis, apa yang menjadi mungkin? Apakah fokus tim Anda akan berubah?

Demis Hassabis: Saya tidak yakin penalaran akan benar-benar gratis, karena paradoks Jevons (efisiensi meningkatkan konsumsi total). Saya rasa semua orang akhirnya akan memanfaatkan semua kapasitas komputasi yang tersedia.

Bayangkan ratusan ribu Agent bekerja sama, atau sekelompok Agent berpikir dari berbagai arah sekaligus lalu mengintegrasikan hasilnya. Kami sedang bereksperimen dengan semua ini, dan semua akan menghabiskan sumber daya penalaran yang tersedia.

Dari segi energi, jika kita menyelesaikan masalah fusi nuklir terkendali, superkonduktivitas suhu kamar, dan baterai optimal, saya rasa melalui ilmu material kita bisa capai, dan biaya energi bisa mendekati nol. Tapi proses manufaktur chip secara fisik masih punya hambatan, setidaknya selama beberapa dekade ke depan. Jadi, batas kuota penalaran tetap ada, dan kita harus menggunakan sumber daya ini secara efisien.

Terobosan ilmiah berikutnya

Gary Tan: Untungnya, model kecil semakin pintar. Banyak pendiri di bidang bioteknologi dan biologi di sini. AlphaFold 3 sudah melampaui protein, dan memperluas ke molekul biologis yang lebih luas. Seberapa jauh kita dari memodelkan sistem sel lengkap? Apakah ini level tantangan yang benar-benar berbeda?

Demis Hassabis: Isomorphic Labs sangat maju. AlphaFold hanyalah salah satu bagian dari proses penemuan obat. Kami juga mengerjakan penelitian biokimia terkait, seperti merancang senyawa dengan sifat yang tepat, dan dalam waktu dekat akan ada pengumuman besar.

Tujuan akhir kami adalah menciptakan simulasi sel virtual lengkap, sebuah model sel lengkap yang bisa diberi gangguan, dan outputnya cukup mendekati hasil eksperimen serta memiliki kegunaan nyata. Anda bisa melewati banyak proses pencarian, menghasilkan data sintetis dalam jumlah besar untuk melatih model lain, dan memprediksi perilaku sel nyata.

Perkiraan saya, butuh sekitar sepuluh tahun lagi untuk mencapai sel virtual lengkap. Kami mulai dari inti sel karena relatif mandiri dan terisolasi. Masalah utama adalah, apakah kita bisa memotong bagian yang cukup kompleks, cukup mandiri, dan bisa kita perkirakan input-output-nya secara akurat, lalu fokus pada sub-sistem ini. Inti sel dari sudut pandang ini sangat cocok.

Masalah lain adalah kekurangan data. Saya sudah berbicara dengan ilmuwan yang bekerja dengan mikroskop elektron dan teknik pencitraan lainnya. Jika bisa melakukan pencitraan sel hidup tanpa membunuhnya, itu akan revolusioner. Karena itu akan mengubahnya menjadi masalah visual, dan kita tahu cara menyelesaikan masalah visual.

Tapi, sejauh ini, belum ada teknologi yang mampu melakukan pencitraan sel hidup secara dinamis dengan resolusi nano tanpa merusak sel. Gambar statis dengan resolusi tinggi sudah sangat detail, dan itu sangat menjanjikan, tapi belum cukup untuk langsung menjadi masalah visual.

Jadi, ada dua jalur: satu hardware dan data-driven, dan satu lagi membangun simulator yang lebih baik untuk mensimulasikan dinamika ini.

Gary Tan: Anda tidak hanya melihat biologi. Material science, penemuan obat, klimatologi, matematika—jika harus diurutkan, bidang mana yang akan mengalami transformasi paling besar dalam lima tahun ke depan?

Demis Hassabis: Setiap bidang sangat menarik, dan ini adalah alasan utama mengapa saya sangat bersemangat dan telah berkecimpung di AI selama lebih dari 30 tahun. Saya selalu percaya AI akan menjadi alat ilmiah utama untuk mempercepat pemahaman ilmiah, penemuan ilmiah, kedokteran, dan pemahaman kita tentang alam semesta.

Awalnya, misi kami dirumuskan dalam dua langkah. Pertama, menyelesaikan kecerdasan, yaitu membangun AGI; kedua, menggunakan itu untuk menyelesaikan semua masalah lain. Tapi kemudian kami harus mengubah kata-kata, karena orang bertanya, “Benarkah kalian bermaksud menyelesaikan semua masalah?”

Kami memang bermaksud demikian. Sekarang orang mulai memahami apa artinya. Secara spesifik, saya berbicara tentang menyelesaikan apa yang saya sebut “masalah akar” dalam sains, yaitu bidang yang jika terpecahkan akan membuka cabang penemuan baru. Contohnya, AlphaFold adalah prototipe dari apa yang ingin kami capai.

Lebih dari tiga juta peneliti di seluruh dunia, hampir semua peneliti biologi saat ini menggunakan AlphaFold. Saya dengar dari eksekutif perusahaan farmasi bahwa hampir semua penemuan obat di masa depan akan melibatkan AlphaFold di salah satu tahapnya. Kami bangga akan hal ini, dan ini adalah dampak yang ingin kami capai dengan AI. Tapi ini baru permulaan.

Saya tidak bisa membayangkan bidang ilmiah atau rekayasa yang AI tidak bisa bantu. Bidang-bidang yang Anda sebutkan, saya rasa masih dalam tahap “AlphaFold 1”, hasilnya sudah sangat menjanjikan, tapi tantangan besar belum terpecahkan. Dalam dua tahun ke depan, kita akan melihat banyak kemajuan di semua bidang ini, dari material science sampai matematika.

Gary Tan: Rasanya seperti memberi manusia kekuatan baru ala Prometheus.

Demis Hassabis: Betul. Tapi seperti cerita Prometheus, kita harus berhati-hati dalam menggunakan kekuatan ini, bagaimana dan di mana digunakan, serta risiko penyalahgunaannya.

Pengalaman Sukses

Gary Tan: Banyak di sini mencoba membangun perusahaan yang menerapkan AI dalam sains. Menurut Anda, apa bedanya startup yang benar-benar mendorong batas terdepan dan yang hanya membungkus model dasar dengan API, lalu mengklaim “AI for Science”?

Demis Hassabis: Kalau saya bayangkan, kalau saya duduk di posisi kalian di Y Combinator, saya akan berpikir seperti apa. Satu hal penting adalah memprediksi arah teknologi AI, yang sangat sulit. Tapi saya yakin menggabungkan AI dengan bidang teknologi mendalam lain punya peluang besar. Cross-section ini, entah itu material, kedokteran, atau bidang ilmiah lain yang sangat kompleks, terutama yang melibatkan atom, dalam waktu dekat tidak akan ada jalan pintas. Bidang ini tidak akan langsung tertinggal hanya karena model dasar terbaru. Tapi, jika Anda mencari jalur yang tahan banting, itu yang saya rekomendasikan.

Saya pribadi sangat menyukai teknologi mendalam. Hal yang benar-benar tahan lama dan berharga tidak mudah didapat. Saya selalu tertarik pada teknologi mendalam. Saat kami mulai sekitar 2010, AI sudah termasuk kategori teknologi mendalam—investor bilang “kita sudah tahu ini tidak akan berhasil”, dan akademisi juga menganggap ini sebagai bidang kecil yang gagal di tahun 90-an.

Tapi jika Anda percaya pada ide Anda—mengapa ini berbeda kali ini, apa kombinasi unik latar belakang Anda—idealnya Anda adalah ahli di bidang machine learning dan aplikasinya, atau mampu membentuk tim pendiri yang seperti itu—maka ada potensi besar dan nilai besar yang bisa diciptakan.

Gary Tan: Informasi ini sangat penting. Setelah satu hal berhasil, tampaknya wajar, tapi sebelum berhasil, semua orang menentang.

Demis Hassabis: Tentu, jadi Anda harus melakukan apa yang benar-benar Anda sukai. Bagi saya, apapun yang terjadi, saya akan tetap mengerjakan AI. Sejak kecil, saya sudah memutuskan ini adalah hal paling berpengaruh yang bisa saya lakukan. Dan memang terbukti, tapi mungkin juga tidak, mungkin kita terlalu dini, 50 tahun lebih awal.

Dan ini juga hal paling menarik yang bisa saya pikirkan. Bahkan jika hari ini kita masih di garasi kecil dan AI belum jadi, saya tetap akan cari cara untuk terus maju. Mungkin saya akan kembali ke dunia akademik, tapi saya akan terus mencari jalan.

Gary Tan: AlphaFold adalah contoh keberuntungan dan keberanian memilih arah yang tepat. Apa yang membuat bidang ilmiah cocok untuk terobosan seperti AlphaFold? Apakah ada pola tertentu, misalnya fungsi objektif tertentu?

Demis Hassabis: Saya harus menulis ini suatu hari nanti. Dari pengalaman di AlphaGo dan AlphaFold, saya belajar bahwa teknologi kita paling efektif ketika:

Pertama, masalah memiliki ruang pencarian kombinatorial yang besar, semakin besar semakin baik, sampai tidak bisa diselesaikan dengan brute-force atau algoritma khusus. Ruang langkah di Go dan konfigurasi protein jauh melebihi jumlah atom di alam semesta. Kedua, kita bisa mendefinisikan fungsi objektif yang jelas, seperti energi bebas protein yang minimal, atau kemenangan di Go, sehingga sistem bisa melakukan gradient ascent. Ketiga, ada cukup data, atau ada simulator yang bisa menghasilkan data sintetis dalam jumlah besar dan distribusi yang relevan.

Jika ketiga kondisi ini terpenuhi, metode saat ini bisa berjalan jauh, menemukan “jarum dalam tumpukan jerami”. Penemuan obat juga mengikuti logika yang sama: ada senyawa tertentu yang bisa menyembuhkan penyakit dan tanpa efek samping, selama hukum fisika memungkinkan keberadaannya, satu-satunya masalah adalah bagaimana menemukannya secara efisien dan feasible. AlphaFold membuktikan bahwa sistem ini mampu menemukan jarum di ruang pencarian yang sangat besar.

Gary Tan: Saya ingin naik satu tingkat. Kita berbicara bahwa manusia menggunakan metode ini untuk menciptakan AlphaFold, tapi ada lapisan meta, yaitu manusia menggunakan AI untuk mengeksplorasi ruang hipotesis yang mungkin. Seberapa jauh kita dari AI yang mampu melakukan penalaran ilmiah sejati (bukan sekadar pola data) ?

Demis Hassabis: Saya rasa sangat dekat. Kita sedang membangun sistem umum. Ada sistem bernama AI co-scientist, dan algoritma seperti AlphaEvolve yang bisa melakukan lebih dari Gemini dasar. Semua laboratorium terdepan sedang mengeksplorasi ini.

Tapi sejauh ini, saya belum melihat penemuan ilmiah besar yang benar-benar dibuat oleh sistem ini. Saya rasa itu akan datang. Mungkin terkait dengan kreativitas, melampaui batas pengetahuan saat ini. Pada level itu, bukan lagi sekadar pola, tapi penalaran analogis. Sistem ini saat ini belum mampu, atau kita belum menggunakannya dengan cara yang benar.

Salah satu standar yang saya gunakan dalam sains adalah, apakah sistem ini bisa mengusulkan hipotesis yang benar-benar menarik, bukan sekadar memverifikasi yang sudah ada. Karena memverifikasi juga bisa besar, seperti membuktikan conjecture Riemann atau menyelesaikan masalah Millennium. Tapi mungkin kita hanya tinggal beberapa tahun lagi untuk sampai ke sana.

Lebih sulit lagi, apakah bisa mengusulkan satu set masalah Millennium baru yang dianggap oleh matematikawan top sama mendalam dan layak dipelajari seumur hidup. Saya rasa ini level yang lebih tinggi lagi, dan kita belum tahu caranya. Tapi saya percaya, sistem ini akhirnya bisa, mungkin hanya butuh satu atau dua hal lagi.

Kita bisa mengujinya dengan apa yang saya sebut “Tes Einstein”, yaitu apakah Anda bisa melatih sistem dengan pengetahuan tahun 1901, lalu membiarkannya secara mandiri menyimpulkan hasil-hasil yang dibuat Einstein tahun 1905, termasuk relativitas khusus. Saya rasa kita harus benar-benar melakukan tes ini, coba berulang-ulang, dan lihat kapan bisa. Kalau bisa, maka sistem ini tidak jauh dari penemuan sesuatu yang benar-benar baru.

Saran untuk startup

Gary Tan: Pertanyaan terakhir. Banyak orang di sini yang punya latar belakang teknologi mendalam dan ingin membangun sesuatu sebesar kalian. Kalian adalah salah satu organisasi riset AI terbesar. Dari pengalaman di garis depan riset AGI, ada hal apa yang sekarang Anda tahu, tapi seharusnya Anda tahu saat usia 25 tahun?

Demis Hassabis: Kita sebenarnya sudah membahas sebagian. Anda akan menemukan bahwa mengikuti masalah yang sulit dan yang sederhana itu sebenarnya sama sulitnya, hanya caranya berbeda. Ada tantangan berbeda di setiap bidang. Tapi hidup ini singkat, dan energi terbatas, jadi lebih baik fokus pada hal-hal yang jika tidak kita lakukan, tidak akan dilakukan orang lain.

Selain itu, saya rasa dalam beberapa tahun ke depan, kombinasi lintas bidang akan menjadi lebih umum, dan AI akan memudahkan kolaborasi lintas bidang tersebut.

Terakhir, tergantung pada garis waktu AGI Anda. Saya memperkirakan sekitar tahun 2030. Kalau Anda mulai proyek teknologi mendalam hari ini, biasanya butuh sekitar satu dekade. Jadi, Anda harus memasukkan kemungkinan munculnya AGI di tengah jalan ke dalam perencanaan. Apa artinya? Tidak selalu buruk, tapi harus dipertimbangkan. Apakah proyek Anda bisa memanfaatkan AGI? Bagaimana sistem AGI akan berinteraksi dengan proyek Anda?

Kembali ke hubungan antara AlphaFold dan sistem AI umum, saya bisa membayangkan Gemini, Claude, atau sistem umum serupa akan memanggil sistem khusus seperti AlphaFold sebagai alat. Saya tidak percaya kita akan memasukkan semuanya ke dalam satu sistem besar.

Link video asli

Klik untuk tahu lebih banyak tentang lowongan di BlockBeats

Selamat bergabung di komunitas resmi BlockBeats:

Telegram: https://t.me/theblockbeats

Telegram Grup Diskusi: https://t.me/BlockBeats_App

Twitter resmi: https://twitter.com/BlockBeatsAsia

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
WCTCTradingKingPK
401.26K Popularitas
#
#FedHoldsRateButDividesDeepen
20.65K Popularitas
#
IsraelStrikesIranBTCPlunges
36.48K Popularitas
#
#DailyPolymarketHotspot
724.77K Popularitas
#
BitcoinSpotVolumeNewLow
162.66M Popularitas

Sematkan

peta situs

Wawancara Eksklusif Pendiri DeepMind: Arsitektur AGI, Status Agen, dan Terobosan Ilmiah dalam Sepuluh Tahun Mendatang

Pengantar editor

Kutipan Paling Berkesan

Rencana dan garis waktu AGI

Memori dan jendela konteks

Kekurangan dalam penalaran

Agent dan kreativitas

Distilasi dan model kecil

Penemuan ilmiah dan “Tes Einstein”

Saran untuk startup teknologi mendalam

Jalur Realisasi AGI

Distilasi dan model kecil

Memori dan penalaran

Kemampuan Agent yang sebenarnya

Open source dan model multimodal

Terobosan ilmiah berikutnya

Pengalaman Sukses

Saran untuk startup

Topik Trending

WCTCTradingKingPK

#FedHoldsRateButDividesDeepen

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinSpotVolumeNewLow

Sematkan