Token ra biển, bán điện lực Trung Quốc cho toàn thế giới

Một cuộc chiến tranh năng lượng không khói súng.

Tác giả: Black Lobster, Deep Tide TechFlow

Vào mùa hè năm 1858, một dây cáp đồng trung tâm xuyên qua đáy đại dương Đại Tây Dương, kết nối London và New York lại với nhau.

Ý nghĩa của sự kiện này không nằm ở tốc độ truyền tải, mà ở cấu trúc quyền lực, ai là người lắp đặt cáp ngầm dưới biển, người đó có thể hút lợi từ dòng chảy thông tin. Đế quốc Anh dựa vào mạng lưới điện báo toàn cầu này để nắm giữ tin tình báo thuộc địa, giá bông, tin chiến tranh trong tay.

Sức mạnh của đế chế không chỉ có hạm đội mà còn có dây cáp đó.

Hơn 160 năm sau, logic này đang được lặp lại theo một cách không ngờ tới.

Năm 2026, các mô hình lớn của Trung Quốc đang âm thầm chiếm lĩnh thị trường nhà phát triển toàn cầu. Dữ liệu mới nhất từ OpenRouter cho thấy, trong số các token tiêu thụ của top 10 mô hình trên nền tảng, mô hình Trung Quốc chiếm tới 61%, ba vị trí dẫn đầu đều đến từ Trung Quốc. Các nhà phát triển ở San Francisco, Berlin, Singapore gửi yêu cầu API hàng ngày, vượt qua cáp quang dưới Thái Bình Dương đến trung tâm dữ liệu Trung Quốc, sức mạnh tính toán ở đó tiêu thụ, điện năng chảy qua, và kết quả được truyền về.

Điện năng chưa từng rời khỏi lưới điện Trung Quốc, nhưng giá trị của nó đã được chuyển giao qua Token xuyên biên giới.

Di cư mô hình AI lớn

Ngày 24 tháng 2 năm 2026, OpenRouter công bố dữ liệu hàng tuần: tổng lượng Token tiêu thụ của top 10 mô hình trên nền tảng khoảng 8.7 nghìn tỷ, trong đó mô hình Trung Quốc chiếm 5.3 nghìn tỷ, tỷ lệ 61%. MiniMax M2.5 dẫn đầu với 2.45 nghìn tỷ Token, Kimi K2.5 và Zhìpǔ GLM-5 theo sau, ba vị trí đầu đều đến từ Trung Quốc.

Dữ liệu mới nhất ngày 26 tháng 2

Đây không phải là ngẫu nhiên, một mồi lửa đã thắp sáng tất cả.

Đầu năm nay, OpenClaw xuất hiện, là một công cụ mã nguồn mở giúp AI bắt đầu “làm việc thật sự”, có thể kiểm soát máy tính, thực thi lệnh, hoàn thành các quy trình phức tạp song song, và số sao trên GitHub trong vài tuần đã vượt quá 210.000.

Nhân viên tài chính John lập tức cài đặt OpenClaw, kết nối API của Anthropic, bắt đầu tự động giám sát thông tin thị trường chứng khoán, và kịp thời báo cáo để đưa ra tín hiệu giao dịch. Chỉ sau vài giờ, anh nhìn vào số dư tài khoản rồi sững người: vài chục đô la, đã biến mất.

Đây chính là thực tế mới do OpenClaw mang lại. Trước đây, khi trò chuyện với AI, một lần đối thoại chỉ tiêu tốn vài nghìn Token, chi phí gần như không đáng kể. Sau khi OpenClaw kết nối, AI chạy đồng thời hơn chục tác vụ con, lặp đi lặp lại gọi ngữ cảnh, vòng lặp, lượng Token tiêu thụ không còn tuyến tính mà theo cấp số nhân. Hóa đơn như chiếc xe mở nắp capô đang tăng tốc, bình nhiên liệu cứ thế giảm dần, không thể dừng lại.

Trong cộng đồng nhà phát triển, nhanh chóng lan truyền một “bí quyết”: dùng OAuth token để kết nối trực tiếp tài khoản đăng ký của Anthropic hoặc Google vào OpenClaw, biến hạn mức “vô hạn” theo tháng thành nhiên liệu miễn phí cho AI Agent, cũng là phương pháp nhiều nhà phát triển áp dụng.

Phản ứng của chính thức cũng nhanh chóng đến.

Ngày 19 tháng 2, Anthropic cập nhật quy định, rõ ràng cấm sử dụng chứng thực đăng ký Claude cho các công cụ bên thứ ba như OpenClaw, muốn tích hợp chức năng của Claude phải qua kênh tính phí API. Google còn mở rộng cấm các tài khoản đăng ký truy cập Antigravity và Gemini AI Ultra qua OpenClaw.

“Trời đất đã lâu không yên,” Jhon ngay lập tức dấn thân vào mô hình lớn nội địa.

Trên OpenRouter, mô hình lớn nội địa MiniMax M2.5 đạt điểm 80.2% trong các nhiệm vụ kỹ thuật phần mềm, Claude Opus 4.6 đạt 80.8%, chênh lệch gần như không đáng kể. Nhưng giá cả thì khác biệt rõ rệt, phần đầu vào mỗi triệu Token của MiniMax là 0.3 USD, còn Claude là 5 USD, chênh lệch khoảng 17 lần.

Jhon chuyển sang dùng mô hình nội địa, quy trình làm việc vẫn vận hành, hóa đơn giảm một cấp độ, sự di cư này đang diễn ra đồng bộ trên toàn cầu.

COO của OpenRouter, Chris Clark, nói rất thẳng thắn: Các mô hình mã nguồn mở Trung Quốc chiếm thị phần lớn là nhờ tỷ lệ chạy trong các quy trình代理 của nhà phát triển Mỹ cực kỳ cao.

Đi ra biển

Để hiểu bản chất của Token ra biển, trước hết phải rõ cấu trúc chi phí của một Token.

Nó trông nhẹ nhàng, một Token tương đương khoảng 0.75 từ tiếng Anh, cuộc trò chuyện bình thường với AI chỉ tiêu thụ vài nghìn Token. Nhưng khi những Token này tích tụ thành hàng nghìn tỷ, thực tế vật lý phía sau trở nên nặng nề.

Chi phí của Token gồm hai phần chính: tính toán và điện năng.

Tính toán là khấu hao của GPU, mua một chiếc Nvidia H100 khoảng 30.000 USD, tuổi thọ quy đổi thành mỗi lần suy luận là chi phí khấu hao. Điện năng là nhiên liệu duy trì hoạt động của trung tâm dữ liệu, mỗi GPU hoạt động tối đa tiêu thụ khoảng 700W, cộng thêm hệ thống làm mát, hóa đơn điện của một trung tâm AI lớn có thể dễ dàng vượt hàng trăm triệu USD mỗi năm.

Bây giờ, hãy vẽ ra quá trình vật lý này trên bản đồ.

Một nhà phát triển Mỹ gửi yêu cầu API từ San Francisco. Dữ liệu đi qua cáp quang dưới Thái Bình Dương đến trung tâm dữ liệu ở Trung Quốc, cụm GPU bắt đầu làm việc, điện từ lưới điện Trung Quốc chảy vào các chip đó, suy luận hoàn tất, kết quả gửi về. Toàn bộ quá trình có thể chỉ mất một hoặc hai giây.

Điện năng, chưa từng rời khỏi lưới điện Trung Quốc, nhưng giá trị của nó đã được chuyển qua Token, thực hiện giao dịch xuyên biên giới.

Điều kỳ diệu mà thương mại bình thường không thể sánh bằng chính là: Token không có hình thể, không cần qua hải quan, không bị đánh thuế, thậm chí không nằm trong bất kỳ số liệu thương mại hiện hành nào. Trung Quốc xuất khẩu lượng lớn dịch vụ tính toán và điện năng, nhưng trong dữ liệu thương mại chính thức, gần như vô hình.

Token trở thành sản phẩm phái sinh của điện năng, ra biển qua Token chính là ra biển qua điện năng.

Điều này cũng nhờ vào mức giá điện thấp của Trung Quốc, tổng giá điện thấp hơn Mỹ khoảng 40%, đây là chênh lệch về vật lý, đối thủ dễ dàng sao chép.

Ngoài ra, các mô hình lớn của Trung Quốc còn có lợi thế về thuật toán và “sự cạnh tranh nội bộ”.

DeepSeek V3 với kiến trúc MoE chỉ kích hoạt một phần tham số khi suy luận, thử nghiệm độc lập cho thấy chi phí suy luận thấp hơn GPT-4o khoảng 36 lần, MiniMax M2.5 cũng chỉ kích hoạt 10B trong tổng số 229B tham số.

Cấp cao nhất là sự cạnh tranh nội bộ, Alibaba, ByteDance, Baidu, Tencent, Mặt tối của tháng, Zhìpǔ, MiniMax… hơn chục công ty cùng tranh đua trên cùng một sân chơi, giá đã rơi vào vùng lợi nhuận hợp lý, thậm chí lỗ để quảng cáo đã trở thành bình thường trong ngành.

Xem kỹ, điều này giống như xuất khẩu sản xuất của Trung Quốc, tận dụng lợi thế chuỗi cung ứng và cạnh tranh nội bộ để đẩy giá Token xuống mức thấp nhất.

Từ Bitcoin đến Token

Trước Token, còn có một hình thức ra biển của điện năng.

Khoảng năm 2015, các nhà quản lý nhà máy điện ở Tứ Xuyên, Vân Nam, Tân Cương bắt đầu đón nhận những khách hàng kỳ lạ.

Họ thuê nhà xưởng bỏ hoang, lắp đầy máy móc, hoạt động 24/24. Máy móc không sản xuất gì, chỉ liên tục giải một bài toán toán học vô hạn, thỉnh thoảng, từ bài toán vô tận này, tính ra một đồng Bitcoin.

Đây là hình thức ra biển đầu tiên của điện năng: tận dụng điện nước rẻ và gió, qua các máy đào hash, đổi lấy tài sản số toàn cầu, rồi bán ra đô la trên sàn giao dịch.

Điện năng không vượt qua biên giới, nhưng giá trị của nó, qua Bitcoin, đã chảy vào thị trường toàn cầu.

Những năm đó, Trung Quốc chiếm hơn 70% sức mạnh khai thác Bitcoin toàn cầu. Điện nước của Trung Quốc, theo cách vòng vo này, tham gia phân phối lại vốn toàn cầu.

Năm 2021, tất cả chấm dứt. Các quy định siết chặt, các thợ mỏ phân tán, sức mạnh khai thác chuyển sang Kazakhstan, Texas (Mỹ), Canada.

Nhưng logic này chưa bao giờ biến mất, chỉ chờ đợi một lớp vỏ mới, cho đến khi ChatGPT xuất hiện, các mô hình lớn cạnh tranh, các mỏ Bitcoin cũ biến thành trung tâm dữ liệu AI, máy đào biến thành GPU tính toán, Bitcoin cũ thành Token, duy nhất không đổi là điện năng.

Ra biển Bitcoin và ra biển Token về cơ bản là đồng dạng, nhưng Token hiện nay có giá trị thương mại cao hơn.

Máy đào khai thác Bitcoin là một phép tính toán thuần túy, Bitcoin sinh ra là một tài sản tài chính, giá trị dựa trên tính khan hiếm và sự đồng thuận của thị trường, không liên quan gì đến “đào cái gì”. Tính toán không có tính sản xuất, chỉ là sản phẩm phụ của cơ chế tin cậy.

Trong khi đó, suy luận mô hình lớn khác hẳn. GPU tiêu thụ điện năng, mang lại dịch vụ nhận thức thực sự, như mã nguồn, phân tích, dịch thuật, sáng tạo. Giá trị của Token đến từ hiệu quả sử dụng của nó đối với người dùng. Đây là một dạng nhúng sâu hơn, một khi nhà phát triển phụ thuộc vào một mô hình nào đó trong quy trình làm việc, việc chuyển đổi sẽ ngày càng tốn kém theo thời gian.

Tất nhiên, còn một khác biệt quan trọng: khai thác Bitcoin bị đẩy ra khỏi Trung Quốc, còn ra biển Token là do các nhà phát triển toàn cầu chủ động lựa chọn.

Chiến tranh Token

Dây cáp ngầm năm 1858 tượng trưng cho chủ quyền của đế quốc Anh đối với con đường cao tốc thông tin, ai sở hữu hạ tầng đó, người đó có thể định hình luật chơi.

Ra biển Token cũng là một cuộc chiến không tuyên chiến, đầy thử thách.

Chủ quyền dữ liệu là hàng rào đầu tiên, một nhà phát triển Mỹ gửi yêu cầu API qua trung tâm dữ liệu Trung Quốc, dữ liệu vật lý đi qua Trung Quốc. Đối với nhà phát triển cá nhân và ứng dụng nhỏ, điều này không thành vấn đề, nhưng trong các trường hợp liên quan đến dữ liệu nhạy cảm của doanh nghiệp, thông tin tài chính, tuân thủ chính phủ, đây là một điểm yếu. Đó là lý do tại sao tỷ lệ thâm nhập của các mô hình Trung Quốc trong các công cụ phát triển và ứng dụng cá nhân cao nhất, còn trong hệ thống cốt lõi của doanh nghiệp thì gần như không tồn tại.

Lệnh cấm chip là hàng rào thứ hai, ngành công nghiệp AI Trung Quốc đối mặt với hạn chế xuất khẩu GPU cao cấp của Nvidia, kiến trúc MoE và tối ưu thuật toán chỉ phần nào giảm thiểu bất lợi này, giới hạn vẫn còn đó.

Nhưng các trở ngại trước mắt chỉ là phần mở đầu, chiến trường lớn hơn đang hình thành.

Token và mô hình AI đã trở thành một chiều chiến lược mới giữa Trung Quốc và Mỹ, không kém gì cuộc đua bán dẫn, internet của thế kỷ 20, thậm chí còn gần hơn với một phép ẩn dụ cổ xưa hơn: Cuộc chiến giành không gian vũ trụ.

Năm 1957, Liên Xô phóng vệ tinh Sputnik, Mỹ kinh ngạc, ngay sau đó phát động chương trình Apollo, huy động hàng nghìn tỷ USD để không bị thua trong cuộc đua không gian.

Logic cạnh tranh AI cũng rất giống vậy, nhưng mức độ khốc liệt còn vượt xa cuộc đua không gian. Không gian là không gian vật lý, người bình thường không cảm nhận được, còn AI thấm sâu vào mạch máu kinh tế, từng dòng mã, từng hợp đồng, từng hệ thống quyết định chính phủ đều có thể chạy mô hình lớn của một quốc gia nào đó. Ai có mô hình trở thành hạ tầng mặc định của nhà phát triển toàn cầu, người đó vô hình nắm giữ ảnh hưởng cấu trúc của nền kinh tế số toàn cầu.

Đây chính là điều khiến Washington thực sự lo ngại về việc ra biển Token của Trung Quốc.

Khi một nhà phát triển xây dựng kho mã, quy trình Agent, logic sản phẩm dựa trên API của một mô hình Trung Quốc, chi phí chuyển đổi sẽ theo thời gian tăng theo cấp số nhân. Đến lúc đó, dù Mỹ có ban hành luật hạn chế, nhà phát triển cũng sẽ phản kháng bằng chân, giống như ngày nay không thể bỏ GitHub.

Chuyến ra biển Token này có thể chỉ mới bắt đầu của cuộc chiến dài hạn này. Các mô hình lớn của Trung Quốc chưa tuyên bố muốn lật đổ gì, chúng chỉ đơn giản là đưa dịch vụ đến từng nhà phát triển có API Key toàn cầu với mức giá thấp hơn.

Lần này, dây cáp được lắp đặt bởi các kỹ sư đội ngũ viết code ở Hàng Châu, Bắc Kinh, Thượng Hải, và các cụm GPU hoạt động ngày đêm ở một tỉnh phía Nam.

Cuộc chiến này không có đếm ngược, nó diễn ra 24/7 hàng ngày, bằng Token, trên từng thiết bị cuối của mỗi nhà phát triển.

BTC-2,39%
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim