Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Lofli: Hố đen chi phí tôm hùm xuất hiện, cần khung Agent có hiệu quả token cao hơn
Anthropic phong tỏa hành vi lạm dụng quyền truy cập đăng ký của công cụ bên thứ ba, đang phơi bày một cuộc khủng hoảng chi phí trong thời đại AI Agent đã bị bỏ qua kéo dài.
Hai ngày trước, Anthropic công bố cắt đứt kênh để các nền tảng gọi bên thứ ba tiếp cận gói đăng ký Claude. Ngay sau đó, người phụ trách mô hình ngôn ngữ lớn Xiaomi MiMo là Luo Fuli (Fuli Luo) đã đăng bài, kết hợp với kế hoạch Token mà MiMo vừa ra mắt ba ngày trước để đưa ra phân tích sâu về sự kiện này.
Cô ấy cho rằng, việc Anthropic làm không chỉ đơn thuần là phòng thủ thương mại, mà là một mốc cần thiết cho sự trưởng thành của toàn bộ hệ sinh thái trong bối cảnh nguồn cung năng lực tính toán toàn cầu không thể theo kịp tốc độ tăng trưởng nhu cầu của Agent.
Cuộc tấn công trực diện lần này nhắm vào những người dùng các khung gọi bên thứ ba như OpenClaw, OpenCode vốn chạy dựa trên quyền truy cập đăng ký của Claude. Những người dùng này đang phải đối mặt với chi phí tăng đột ngột, trong ngắn hạn có thể lên tới hàng chục lần so với trước đây.
Nhưng Luo Fuli lại cho rằng, áp lực này chính là chất xúc tác buộc phải cải thiện chất lượng kỹ thuật — chỉ khi chi phí kém hiệu quả được nhìn thấy một cách thực sự, thì mới có thể thúc đẩy nhà phát triển nghiêm túc đối xử với quản lý ngữ cảnh và tối ưu hóa bộ nhớ đệm.
Hố đen chi phí ẩn sau chế độ đăng ký
Luo Fuli chỉ ra rằng, hệ thống đăng ký của Claude Code có thiết kế phân bổ năng lực tính toán khá tinh xảo, nhưng cô thừa nhận rằng hệ thống này rất có khả năng không có lãi, thậm chí có thể đang ở trạng thái lỗ.
Nguyên nhân cốt lõi nằm ở cách các khung bên thứ ba thực hiện lệnh gọi. Lấy OpenClaw làm ví dụ, việc quản lý ngữ cảnh tồn tại những thiếu sót rõ ràng: khi xử lý một yêu cầu của người dùng, hệ thống sẽ tách ra nhiều vòng gọi công cụ có giá trị thấp, phát đi từng lượt dưới dạng các yêu cầu API độc lập; mỗi lần yêu cầu mang theo thường vượt quá 100k token cửa sổ ngữ cảnh.
Dù có khả năng trúng bộ nhớ đệm, kiểu mô hình này vẫn cực kỳ lãng phí; trong trường hợp cực đoan, nó còn làm tăng tỷ lệ không trúng bộ nhớ đệm của các yêu cầu khác.
Luo Fuli ước tính rằng số lượng yêu cầu thực tế mà các khung này tạo ra cho mỗi lần truy vấn thường là vài lần so với khung gốc của Claude Code. Khi quy đổi sang cách tính phí theo API, chi phí thực tế có thể lên tới hàng chục lần giá đăng ký. Cô gọi sự chênh lệch này là “không phải là một khoảng trống, mà là một cái hố”.
Người tổ chức AI Workshop @newlinedotco bình luận rằng: gói “all you can eat” của đăng ký ngay từ đầu đã là bom hẹn giờ — các harness bên thứ ba (như OpenClaw) chạy vòng lặp 24/7, chi phí API có thể cao tới 5000 đô la, trong khi đăng ký chỉ 200 đô la. Các công cụ chính thức (như Claude Code) có thể duy trì được nhờ tối ưu prompt cache.
Sau khi phong tỏa: đau ngắn hạn và quy luật dài hạn
Điều chỉnh lần này của Anthropic không đóng hoàn toàn cánh cửa cho truy cập bên thứ ba. OpenClaw, OpenCode và các công cụ khác vẫn có thể gọi Claude thông qua API, chỉ là mất kênh đi kèm gói đăng ký.
Sự khác biệt này là vô cùng quan trọng. Đối với những người dùng vốn quen sử dụng các công cụ này với mức chi phí theo giá đăng ký, cú sốc chi phí là tức thời và rõ rệt.
Nhưng Luo Fuli cho rằng, cảm giác đau này mang ý nghĩa hiệu chỉnh — nó sẽ buộc các nhà phát triển khung phải nghiêm túc nâng cao năng lực quản lý ngữ cảnh, tối đa hóa tỷ lệ trúng prompt cache để tái sử dụng ngữ cảnh đã xử lý, và cắt giảm tiêu hao token vô ích. Cô mô tả quá trình này là “đau khổ cuối cùng chuyển hóa thành quy luật kỹ thuật”.
Cô đồng thời nhắc nhở các công ty mô hình ngôn ngữ lớn rằng, trước khi chưa làm rõ cấu trúc chi phí của kế hoạch lập trình, thì không nên mù quáng lao vào cuộc đua định giá. Việc bán token rẻ mở rộng cánh cửa cho các khung bên thứ ba; bề ngoài thì thân thiện với người dùng, nhưng thực chất là một cái bẫy — và Anthropic vừa mới bước ra khỏi cái bẫy đó.
Cô cũng chỉ ra rằng nếu người dùng sau khi dồn nhiều công sức vào các khung chất lượng thấp, dịch vụ suy luận không ổn định và mô hình bị hạ cấp mà vẫn không thu được gì, thì sẽ gây tổn hại thực chất đến trải nghiệm người dùng và mức độ lưu giữ.
Về vấn đề này, kỹ sư AI @karpathy cho biết:
Đường đi khác nhau của kế hoạch MiMo Token
Trong khi giải thích các hành động của Anthropic, Luo Fuli cũng làm rõ logic thiết kế của kế hoạch MiMo Token.
Kế hoạch này hỗ trợ các khung gọi bên thứ ba, dùng cách tính phí theo hạn mức token; về mặt logic, nó tương thích với gói dùng vượt mức mà Claude vừa mới ra mắt.
Luo Fuli nhấn mạnh mục tiêu của MiMo là “trong dài hạn ổn định cung cấp các mô hình và dịch vụ chất lượng cao, chứ không phải để người dùng bốc đồng trả tiền rồi bị mất.”
Cách diễn đạt này phản ánh một triết lý phân bổ năng lực tính toán khác với chế độ đăng ký: ràng buộc hành vi của người dùng và của khung thông qua chi phí thực tế theo mức sử dụng, thay vì quản lý rủi ro lạm dụng theo cách đóng kín.
Cuộc cạnh tranh về hiệu suất, không phải tiêu hao năng lực tính toán
Ở phần kết bài, Luo Fuli đưa ra một phán đoán mang tính vĩ mô hơn: nguồn cung năng lực tính toán toàn cầu đã không còn theo kịp tốc độ tăng nhu cầu token do Agent tạo ra.
Theo cô, lối thoát không nằm ở việc tiếp tục hạ giá token hơn nữa, mà nằm ở sự tiến hóa phối hợp giữa “khung Agent có hiệu suất token cao hơn” và “các mô hình mạnh hơn, hiệu quả hơn”.
Dù lần điều chỉnh này của Anthropic có phải là thiết kế chủ động hay không, thì nó cũng đang đẩy toàn bộ hệ sinh thái — dù là mã nguồn mở hay mã nguồn đóng — đi theo hướng đó.
“Thời đại Agent không thuộc về người đốt năng lực tính toán nhiều nhất, mà thuộc về người dùng thông minh nhất.” Luo Fuli viết.
Cảnh báo rủi ro và điều khoản miễn trừ trách nhiệm