Musim panas tahun 1858, sebuah kabel tembaga berinti melintasi dasar laut Atlantik menghubungkan London dan New York.
Makna dari peristiwa ini bukanlah tentang kecepatan transmisi, melainkan tentang struktur kekuasaan. Siapa yang memasang kabel bawah laut, dia yang bisa mengendalikan aliran informasi dan menarik keuntungan dari situ. Kekaisaran Inggris melalui jaringan telegraf global ini, mengendalikan intelijen koloninya, harga kapas, dan berita perang.
Kekuatan kekaisaran tidak hanya dari armada kapal, tetapi juga dari kabel ini.
Lebih dari seratus enam puluh tahun kemudian, logika ini sedang diulang dengan cara yang tak terduga.
Tahun 2026, model besar China secara diam-diam menguasai pasar pengembang global. Data terbaru OpenRouter menunjukkan, dari sepuluh model teratas di platform, 61% dari konsumsi Token berasal dari model China, dan tiga besar semuanya dari China. Pengembang dari San Francisco, Berlin, dan Singapura setiap hari mengirim permintaan API yang melintasi kabel bawah laut Pasifik menuju pusat data di China. Di sana, daya komputasi digunakan, listrik mengalir, dan hasilnya kembali.
Listrik tidak pernah meninggalkan jaringan listrik China, tetapi nilainya dikirim secara lintas negara melalui Token.
Migrasi Model AI Besar
Tanggal 24 Februari 2026, OpenRouter merilis data mingguan: total konsumsi Token dari sepuluh model teratas sekitar 8,7 triliun, dengan model China mendominasi 5,3 triliun, yaitu 61%. MiniMax M2.5 menduduki puncak dengan 2,45 triliun Token, diikuti Kimi K2.5 dan Zhipu GLM-5, semuanya dari China.
Data terbaru 26 Februari
Ini bukan kebetulan, sebuah pemicu kecil memulai semuanya.
Awal tahun ini, muncul OpenClaw, sebuah alat sumber terbuka yang memungkinkan AI benar-benar “bekerja”, dapat langsung mengendalikan komputer, menjalankan perintah, dan menyelesaikan alur kerja kompleks secara paralel. Dalam beberapa minggu, bintang di GitHub melebihi 210.000.
Para profesional keuangan, seperti John, segera menginstal OpenClaw dan menghubungkan API Anthropic, mulai memantau otomatis informasi pasar saham dan memberi sinyal transaksi secara real-time. Beberapa jam kemudian, dia menatap saldo akun dan terdiam: puluhan dolar hilang.
Inilah realitas baru yang dibawa OpenClaw. Dulu, berbicara dengan AI hanya memakan beberapa ribu Token, biayanya tak berarti. Setelah OpenClaw terintegrasi, AI menjalankan lebih dari sepuluh tugas secara bersamaan di latar belakang, memanggil konteks berulang kali, dan konsumsi Token menjadi eksponensial. Tagihan seperti mobil yang menggeber mesin di jalanan, bensin terus menipis, dan tak bisa dihentikan.
Dalam komunitas pengembang, beredar trik: menggunakan token OAuth untuk menghubungkan langganan Anthropic atau Google langsung ke OpenClaw, mengubah batas bulanan “tak terbatas” menjadi bahan bakar gratis bagi AI Agent. Banyak pengembang yang memakai metode ini.
Respon resmi pun datang.
Pada 19 Februari, Anthropic memperbarui kebijakan, secara tegas melarang penggunaan kredensial langganan Claude untuk alat pihak ketiga seperti OpenClaw. Untuk mengakses fitur Claude, harus melalui jalur penagihan API. Google juga secara besar-besaran memblokir akun langganan yang mengakses Antigravity dan Gemini AI Ultra melalui OpenClaw.
“Selama ini, rakyat China menderita,” kata John, lalu beralih ke model besar domestik.
Di OpenRouter, model besar domestik MiniMax M2.5 mendapatkan skor 80,2% dalam tugas rekayasa perangkat lunak, sedangkan Claude Opus 4.6 mencapai 80,8%. Perbedaannya hampir tak terasa. Tapi harganya sangat berbeda: biaya input per juta Token untuk yang pertama sekitar 0,3 dolar, sedangkan yang kedua 5 dolar—sekitar 17 kali lipat.
John beralih ke model domestik, alur kerja tetap berjalan, dan tagihan berkurang satu tingkat. Migrasi ini sedang berlangsung secara global.
COO OpenRouter, Chris Clark, menyatakan secara lugas, mengapa model sumber terbuka China mampu merebut pangsa pasar besar? Karena mereka sangat dominan dalam alur kerja proxy yang dijalankan pengembang Amerika.
Listrik ke Luar Negeri
Untuk memahami esensi ekspansi Token ke luar negeri, pertama-tama harus memahami struktur biaya Token.
Tampilannya ringan, satu Token kira-kira setara dengan 0,75 kata Inggris. Satu percakapan biasa dengan AI hanya memakan beberapa ribu Token. Tapi ketika jumlah Token mencapai triliunan, realitas fisiknya menjadi sangat berat.
Biaya Token terdiri dari dua komponen utama: daya komputasi dan listrik.
Daya komputasi adalah depresiasi GPU. Membeli satu Nvidia H100 seharga sekitar 30.000 dolar, dan masa pakainya dihitung per inferensi. Listrik adalah bahan bakar operasional pusat data. Saat GPU penuh beban, konsumsi listrik sekitar 700 watt per unit, ditambah biaya pendinginan. Sebuah pusat data AI besar bisa menghabiskan ratusan juta dolar per tahun.
Sekarang, gambarkan proses fisik ini di peta.
Seorang pengembang di San Francisco mengirim permintaan API. Data melintasi kabel bawah laut Pasifik, sampai di pusat data di China. GPU mulai bekerja, listrik mengalir dari jaringan China ke chip, inferensi selesai, hasil kembali. Seluruh proses mungkin hanya berlangsung satu atau dua detik.
Listrik, tidak pernah meninggalkan jaringan listrik China, tetapi nilainya dikirim secara lintas negara melalui Token.
Ada keajaiban yang tidak bisa dicapai oleh perdagangan biasa: Token tidak berwujud, tidak perlu melalui bea cukai, tidak dikenai tarif, bahkan tidak tercatat dalam statistik perdagangan resmi. China mengekspor layanan daya komputasi dan listrik dalam bentuk Token, tetapi secara resmi hampir tidak terlihat.
Token menjadi turunan dari listrik, ekspansi Token adalah ekspansi listrik.
Ini berkat harga listrik yang relatif murah di China, sekitar 40% lebih rendah dari AS, sebuah biaya fisik yang mudah diduplikasi oleh kompetitor.
Selain itu, model besar AI China juga unggul dalam algoritma dan “inovasi internal”.
DeepSeek V3 dengan arsitektur MoE hanya mengaktifkan sebagian parameter saat inferensi. Pengujian independen menunjukkan biaya inferensi sekitar 36 kali lebih murah dari GPT-4o. MiniMax M2.5 dengan 229B parameter hanya mengaktifkan 10B.
Puncaknya adalah kompetisi internal: Alibaba, ByteDance, Baidu, Tencent, Yuezhi Anmian, Zhipu, MiniMax… lebih dari selusin perusahaan saling bersaing di jalur yang sama, harga sudah jatuh di bawah batas keuntungan wajar. Rugi demi keuntungan sudah menjadi hal biasa.
Mirip dengan ekspor manufaktur China, mereka memanfaatkan keunggulan rantai pasok dan kompetisi internal untuk menekan harga Token.
Dari Bitcoin ke Token
Sebelum Token, ada lagi ekspansi listrik.
Sekitar tahun 2015, pengelola pembangkit listrik di Sichuan, Yunnan, dan Xinjiang mulai kedatangan tamu aneh.
Mereka menyewa pabrik kosong, mengisi mesin-mesin yang rapat, menjalankan 24 jam nonstop. Mesin-mesin ini tidak memproduksi apa-apa, hanya terus-menerus menyelesaikan satu soal matematika. Kadang, dari soal matematika tak berujung ini, mereka menghitung satu Bitcoin.
Ini adalah bentuk pertama ekspansi listrik: mengubah listrik murah dari hidro dan angin menjadi aset digital yang beredar secara global melalui penambangan, lalu dijual di bursa sebagai dolar.
Listrik tidak menyeberangi perbatasan, tetapi nilainya, melalui Bitcoin, mengalir ke pasar global.
Pada masa itu, lebih dari 70% kekuatan penambangan Bitcoin di dunia berasal dari China. Air dan batu bara China, secara tidak langsung, turut berpartisipasi dalam redistribusi modal global.
Tahun 2021, semua ini berhenti tiba-tiba. Regulasi keras diluncurkan, para penambang tersebar, kekuatan penambangan berpindah ke Kazakhstan, Texas, dan Kanada.
Namun, logika ini tidak pernah hilang, hanya menunggu kerangka baru. Ketika ChatGPT muncul dan model besar bersaing, bekas tambang Bitcoin berubah menjadi pusat data AI, mesin-mesin menjadi GPU daya, dan Bitcoin yang dihasilkan menjadi Token. Yang tetap sama hanyalah listrik.
Perpindahan Bitcoin dan Token secara dasar adalah hal yang serupa, tetapi saat ini, Token memiliki nilai komersial yang lebih besar.
Penambangan dengan mesin adalah perhitungan matematis murni, Bitcoin yang dihasilkan adalah aset keuangan. Nilainya berasal dari kelangkaan dan konsensus pasar, bukan dari “apa yang dihitung”. Daya komputasi sendiri tidak produktif, lebih sebagai produk sampingan dari mekanisme kepercayaan.
Sedangkan inferensi model besar berbeda. GPU mengonsumsi listrik, dan hasilnya adalah layanan kognitif nyata—kode, analisis, terjemahan, kreativitas. Nilai Token langsung berasal dari manfaatnya bagi pengguna. Ini adalah bentuk embedded yang lebih dalam: begitu alur kerja pengembang bergantung pada suatu model, biaya beralih akan meningkat seiring waktu.
Ada satu perbedaan kunci lagi: penambangan Bitcoin diusir dari China, sedangkan ekspansi Token adalah pilihan aktif dari pengembang global.
Perang Token
Kabel bawah laut yang dipasang tahun 1858 mewakili kedaulatan Inggris atas jalan raya informasi. Siapa yang memiliki infrastruktur dasar, dia yang menentukan aturan main.
Ekspansi Token ke luar negeri juga adalah perang tanpa deklarasi, penuh tantangan.
Kedaulatan data adalah tembok pertama. Permintaan API dari pengembang AS yang diproses di pusat data China secara fisik melintasi China. Untuk pengembang individu dan aplikasi kecil, ini bukan masalah. Tapi untuk data sensitif perusahaan, informasi keuangan, dan skenario kepatuhan pemerintah, ini adalah hambatan besar. Itulah mengapa penetrasi model China di alat pengembangan dan aplikasi pribadi sangat tinggi, tetapi hampir tidak ada di sistem inti perusahaan.
Larangan chip adalah tembok kedua. Pengembangan AI China menghadapi pembatasan ekspor GPU high-end Nvidia. Arsitektur MoE dan optimisasi algoritma hanya bisa mengurangi kerugian ini sebagian. Batasan tetap ada.
Tapi hambatan saat ini hanyalah babak awal. Arena yang lebih besar sedang terbentuk.
Token dan model AI telah menjadi dimensi baru dalam perang strategis antara AS dan China, tak kalah penting dari perang semi-konduktor dan internet abad ke-20, bahkan lebih dekat ke metafora kuno: perang di luar angkasa.
Tahun 1957, Uni Soviet meluncurkan Sputnik, mengejutkan seluruh Amerika. Amerika pun meluncurkan program Apollo, mengerahkan sumber daya miliaran dolar hari ini, untuk memastikan tidak kalah dalam perlombaan luar angkasa.
Logika persaingan AI sangat mirip, tetapi tingkat intensitasnya jauh melampaui perlombaan luar angkasa. Luar angkasa adalah ruang fisik yang tak bisa dirasakan orang biasa, sedangkan infiltrasi AI menyentuh pembuluh darah ekonomi. Setiap baris kode, setiap kontrak, setiap sistem pengambilan keputusan pemerintah bisa jadi menjalankan model besar dari suatu negara. Siapa yang modelnya menjadi infrastruktur dasar pengembang global, dia secara tak kasat mata memperoleh pengaruh struktural terhadap ekonomi digital dunia.
Inilah yang membuat Washington benar-benar merasa tidak nyaman dengan ekspansi Token China.
Ketika kode, alur kerja agen, dan logika produk pengembang dibangun di sekitar API model China, biaya migrasi akan meningkat secara eksponensial seiring waktu. Bahkan jika AS memberlakukan larangan, pengembang akan tetap bertahan, seperti tak seorang pun bisa meninggalkan GitHub hari ini.
Perlu diingat, ekspansi Token ini mungkin baru awal dari permainan panjang. Model besar China tidak mengklaim akan menggulingkan apa pun, mereka hanya menawarkan layanan dengan harga lebih murah ke setiap pengembang di seluruh dunia yang memiliki API Key.
Kali ini, kabel bawah laut dipasang oleh tim insinyur di Hangzhou, Beijing, Shanghai, dan oleh cluster GPU yang beroperasi siang malam di suatu provinsi di Selatan.
Perang ini tidak memiliki hitung mundur. Ia berlangsung setiap hari 24 jam, dengan satuan Token, dan medan pertempuran adalah setiap terminal pengembang.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Token keluar ke pasar internasional, menjual listrik dari China ke seluruh dunia
Pertempuran Tanpa Asap Senjata di Dunia Listrik
Penulis: Black Lobster, Deep潮 TechFlow
Musim panas tahun 1858, sebuah kabel tembaga berinti melintasi dasar laut Atlantik menghubungkan London dan New York.
Makna dari peristiwa ini bukanlah tentang kecepatan transmisi, melainkan tentang struktur kekuasaan. Siapa yang memasang kabel bawah laut, dia yang bisa mengendalikan aliran informasi dan menarik keuntungan dari situ. Kekaisaran Inggris melalui jaringan telegraf global ini, mengendalikan intelijen koloninya, harga kapas, dan berita perang.
Kekuatan kekaisaran tidak hanya dari armada kapal, tetapi juga dari kabel ini.
Lebih dari seratus enam puluh tahun kemudian, logika ini sedang diulang dengan cara yang tak terduga.
Tahun 2026, model besar China secara diam-diam menguasai pasar pengembang global. Data terbaru OpenRouter menunjukkan, dari sepuluh model teratas di platform, 61% dari konsumsi Token berasal dari model China, dan tiga besar semuanya dari China. Pengembang dari San Francisco, Berlin, dan Singapura setiap hari mengirim permintaan API yang melintasi kabel bawah laut Pasifik menuju pusat data di China. Di sana, daya komputasi digunakan, listrik mengalir, dan hasilnya kembali.
Listrik tidak pernah meninggalkan jaringan listrik China, tetapi nilainya dikirim secara lintas negara melalui Token.
Migrasi Model AI Besar
Tanggal 24 Februari 2026, OpenRouter merilis data mingguan: total konsumsi Token dari sepuluh model teratas sekitar 8,7 triliun, dengan model China mendominasi 5,3 triliun, yaitu 61%. MiniMax M2.5 menduduki puncak dengan 2,45 triliun Token, diikuti Kimi K2.5 dan Zhipu GLM-5, semuanya dari China.
Data terbaru 26 Februari
Ini bukan kebetulan, sebuah pemicu kecil memulai semuanya.
Awal tahun ini, muncul OpenClaw, sebuah alat sumber terbuka yang memungkinkan AI benar-benar “bekerja”, dapat langsung mengendalikan komputer, menjalankan perintah, dan menyelesaikan alur kerja kompleks secara paralel. Dalam beberapa minggu, bintang di GitHub melebihi 210.000.
Para profesional keuangan, seperti John, segera menginstal OpenClaw dan menghubungkan API Anthropic, mulai memantau otomatis informasi pasar saham dan memberi sinyal transaksi secara real-time. Beberapa jam kemudian, dia menatap saldo akun dan terdiam: puluhan dolar hilang.
Inilah realitas baru yang dibawa OpenClaw. Dulu, berbicara dengan AI hanya memakan beberapa ribu Token, biayanya tak berarti. Setelah OpenClaw terintegrasi, AI menjalankan lebih dari sepuluh tugas secara bersamaan di latar belakang, memanggil konteks berulang kali, dan konsumsi Token menjadi eksponensial. Tagihan seperti mobil yang menggeber mesin di jalanan, bensin terus menipis, dan tak bisa dihentikan.
Dalam komunitas pengembang, beredar trik: menggunakan token OAuth untuk menghubungkan langganan Anthropic atau Google langsung ke OpenClaw, mengubah batas bulanan “tak terbatas” menjadi bahan bakar gratis bagi AI Agent. Banyak pengembang yang memakai metode ini.
Respon resmi pun datang.
Pada 19 Februari, Anthropic memperbarui kebijakan, secara tegas melarang penggunaan kredensial langganan Claude untuk alat pihak ketiga seperti OpenClaw. Untuk mengakses fitur Claude, harus melalui jalur penagihan API. Google juga secara besar-besaran memblokir akun langganan yang mengakses Antigravity dan Gemini AI Ultra melalui OpenClaw.
“Selama ini, rakyat China menderita,” kata John, lalu beralih ke model besar domestik.
Di OpenRouter, model besar domestik MiniMax M2.5 mendapatkan skor 80,2% dalam tugas rekayasa perangkat lunak, sedangkan Claude Opus 4.6 mencapai 80,8%. Perbedaannya hampir tak terasa. Tapi harganya sangat berbeda: biaya input per juta Token untuk yang pertama sekitar 0,3 dolar, sedangkan yang kedua 5 dolar—sekitar 17 kali lipat.
John beralih ke model domestik, alur kerja tetap berjalan, dan tagihan berkurang satu tingkat. Migrasi ini sedang berlangsung secara global.
COO OpenRouter, Chris Clark, menyatakan secara lugas, mengapa model sumber terbuka China mampu merebut pangsa pasar besar? Karena mereka sangat dominan dalam alur kerja proxy yang dijalankan pengembang Amerika.
Listrik ke Luar Negeri
Untuk memahami esensi ekspansi Token ke luar negeri, pertama-tama harus memahami struktur biaya Token.
Tampilannya ringan, satu Token kira-kira setara dengan 0,75 kata Inggris. Satu percakapan biasa dengan AI hanya memakan beberapa ribu Token. Tapi ketika jumlah Token mencapai triliunan, realitas fisiknya menjadi sangat berat.
Biaya Token terdiri dari dua komponen utama: daya komputasi dan listrik.
Daya komputasi adalah depresiasi GPU. Membeli satu Nvidia H100 seharga sekitar 30.000 dolar, dan masa pakainya dihitung per inferensi. Listrik adalah bahan bakar operasional pusat data. Saat GPU penuh beban, konsumsi listrik sekitar 700 watt per unit, ditambah biaya pendinginan. Sebuah pusat data AI besar bisa menghabiskan ratusan juta dolar per tahun.
Sekarang, gambarkan proses fisik ini di peta.
Seorang pengembang di San Francisco mengirim permintaan API. Data melintasi kabel bawah laut Pasifik, sampai di pusat data di China. GPU mulai bekerja, listrik mengalir dari jaringan China ke chip, inferensi selesai, hasil kembali. Seluruh proses mungkin hanya berlangsung satu atau dua detik.
Listrik, tidak pernah meninggalkan jaringan listrik China, tetapi nilainya dikirim secara lintas negara melalui Token.
Ada keajaiban yang tidak bisa dicapai oleh perdagangan biasa: Token tidak berwujud, tidak perlu melalui bea cukai, tidak dikenai tarif, bahkan tidak tercatat dalam statistik perdagangan resmi. China mengekspor layanan daya komputasi dan listrik dalam bentuk Token, tetapi secara resmi hampir tidak terlihat.
Token menjadi turunan dari listrik, ekspansi Token adalah ekspansi listrik.
Ini berkat harga listrik yang relatif murah di China, sekitar 40% lebih rendah dari AS, sebuah biaya fisik yang mudah diduplikasi oleh kompetitor.
Selain itu, model besar AI China juga unggul dalam algoritma dan “inovasi internal”.
DeepSeek V3 dengan arsitektur MoE hanya mengaktifkan sebagian parameter saat inferensi. Pengujian independen menunjukkan biaya inferensi sekitar 36 kali lebih murah dari GPT-4o. MiniMax M2.5 dengan 229B parameter hanya mengaktifkan 10B.
Puncaknya adalah kompetisi internal: Alibaba, ByteDance, Baidu, Tencent, Yuezhi Anmian, Zhipu, MiniMax… lebih dari selusin perusahaan saling bersaing di jalur yang sama, harga sudah jatuh di bawah batas keuntungan wajar. Rugi demi keuntungan sudah menjadi hal biasa.
Mirip dengan ekspor manufaktur China, mereka memanfaatkan keunggulan rantai pasok dan kompetisi internal untuk menekan harga Token.
Dari Bitcoin ke Token
Sebelum Token, ada lagi ekspansi listrik.
Sekitar tahun 2015, pengelola pembangkit listrik di Sichuan, Yunnan, dan Xinjiang mulai kedatangan tamu aneh.
Mereka menyewa pabrik kosong, mengisi mesin-mesin yang rapat, menjalankan 24 jam nonstop. Mesin-mesin ini tidak memproduksi apa-apa, hanya terus-menerus menyelesaikan satu soal matematika. Kadang, dari soal matematika tak berujung ini, mereka menghitung satu Bitcoin.
Ini adalah bentuk pertama ekspansi listrik: mengubah listrik murah dari hidro dan angin menjadi aset digital yang beredar secara global melalui penambangan, lalu dijual di bursa sebagai dolar.
Listrik tidak menyeberangi perbatasan, tetapi nilainya, melalui Bitcoin, mengalir ke pasar global.
Pada masa itu, lebih dari 70% kekuatan penambangan Bitcoin di dunia berasal dari China. Air dan batu bara China, secara tidak langsung, turut berpartisipasi dalam redistribusi modal global.
Tahun 2021, semua ini berhenti tiba-tiba. Regulasi keras diluncurkan, para penambang tersebar, kekuatan penambangan berpindah ke Kazakhstan, Texas, dan Kanada.
Namun, logika ini tidak pernah hilang, hanya menunggu kerangka baru. Ketika ChatGPT muncul dan model besar bersaing, bekas tambang Bitcoin berubah menjadi pusat data AI, mesin-mesin menjadi GPU daya, dan Bitcoin yang dihasilkan menjadi Token. Yang tetap sama hanyalah listrik.
Perpindahan Bitcoin dan Token secara dasar adalah hal yang serupa, tetapi saat ini, Token memiliki nilai komersial yang lebih besar.
Penambangan dengan mesin adalah perhitungan matematis murni, Bitcoin yang dihasilkan adalah aset keuangan. Nilainya berasal dari kelangkaan dan konsensus pasar, bukan dari “apa yang dihitung”. Daya komputasi sendiri tidak produktif, lebih sebagai produk sampingan dari mekanisme kepercayaan.
Sedangkan inferensi model besar berbeda. GPU mengonsumsi listrik, dan hasilnya adalah layanan kognitif nyata—kode, analisis, terjemahan, kreativitas. Nilai Token langsung berasal dari manfaatnya bagi pengguna. Ini adalah bentuk embedded yang lebih dalam: begitu alur kerja pengembang bergantung pada suatu model, biaya beralih akan meningkat seiring waktu.
Ada satu perbedaan kunci lagi: penambangan Bitcoin diusir dari China, sedangkan ekspansi Token adalah pilihan aktif dari pengembang global.
Perang Token
Kabel bawah laut yang dipasang tahun 1858 mewakili kedaulatan Inggris atas jalan raya informasi. Siapa yang memiliki infrastruktur dasar, dia yang menentukan aturan main.
Ekspansi Token ke luar negeri juga adalah perang tanpa deklarasi, penuh tantangan.
Kedaulatan data adalah tembok pertama. Permintaan API dari pengembang AS yang diproses di pusat data China secara fisik melintasi China. Untuk pengembang individu dan aplikasi kecil, ini bukan masalah. Tapi untuk data sensitif perusahaan, informasi keuangan, dan skenario kepatuhan pemerintah, ini adalah hambatan besar. Itulah mengapa penetrasi model China di alat pengembangan dan aplikasi pribadi sangat tinggi, tetapi hampir tidak ada di sistem inti perusahaan.
Larangan chip adalah tembok kedua. Pengembangan AI China menghadapi pembatasan ekspor GPU high-end Nvidia. Arsitektur MoE dan optimisasi algoritma hanya bisa mengurangi kerugian ini sebagian. Batasan tetap ada.
Tapi hambatan saat ini hanyalah babak awal. Arena yang lebih besar sedang terbentuk.
Token dan model AI telah menjadi dimensi baru dalam perang strategis antara AS dan China, tak kalah penting dari perang semi-konduktor dan internet abad ke-20, bahkan lebih dekat ke metafora kuno: perang di luar angkasa.
Tahun 1957, Uni Soviet meluncurkan Sputnik, mengejutkan seluruh Amerika. Amerika pun meluncurkan program Apollo, mengerahkan sumber daya miliaran dolar hari ini, untuk memastikan tidak kalah dalam perlombaan luar angkasa.
Logika persaingan AI sangat mirip, tetapi tingkat intensitasnya jauh melampaui perlombaan luar angkasa. Luar angkasa adalah ruang fisik yang tak bisa dirasakan orang biasa, sedangkan infiltrasi AI menyentuh pembuluh darah ekonomi. Setiap baris kode, setiap kontrak, setiap sistem pengambilan keputusan pemerintah bisa jadi menjalankan model besar dari suatu negara. Siapa yang modelnya menjadi infrastruktur dasar pengembang global, dia secara tak kasat mata memperoleh pengaruh struktural terhadap ekonomi digital dunia.
Inilah yang membuat Washington benar-benar merasa tidak nyaman dengan ekspansi Token China.
Ketika kode, alur kerja agen, dan logika produk pengembang dibangun di sekitar API model China, biaya migrasi akan meningkat secara eksponensial seiring waktu. Bahkan jika AS memberlakukan larangan, pengembang akan tetap bertahan, seperti tak seorang pun bisa meninggalkan GitHub hari ini.
Perlu diingat, ekspansi Token ini mungkin baru awal dari permainan panjang. Model besar China tidak mengklaim akan menggulingkan apa pun, mereka hanya menawarkan layanan dengan harga lebih murah ke setiap pengembang di seluruh dunia yang memiliki API Key.
Kali ini, kabel bawah laut dipasang oleh tim insinyur di Hangzhou, Beijing, Shanghai, dan oleh cluster GPU yang beroperasi siang malam di suatu provinsi di Selatan.
Perang ini tidak memiliki hitung mundur. Ia berlangsung setiap hari 24 jam, dengan satuan Token, dan medan pertempuran adalah setiap terminal pengembang.