Khi mà các doanh nghiệp cố gắng lấy câu “dùng AI để thay thế nhân lực nhằm giảm chi phí” làm bàn tính, thì Anthropic lại thay đổi luật chơi. Gã khổng lồ AI này gần đây đã cập nhật cấu trúc tính phí của phiên bản doanh nghiệp Claude, tách lượng sử dụng Claude, Claude Code và Cowork khỏi khoản phí thuê bao 40 USD/tháng, chuyển sang tính phí riêng theo số lượng Token thực tế tiêu thụ. Giờ đây, có vẻ như chi phí của “nhân viên AI” không hề rẻ như những gì người ta vẫn nói.
(Dùng văn ngôn và hội thoại AI có tiết kiệm Token không? Một ảnh chụp màn hình đã khơi nổ tranh luận; kỹ sư: thực ra dùng tiếng Anh mới là thượng sách)
Chấm dứt thời đại giá cố định, phiên bản doanh nghiệp Claude đổi cách tính phí: dùng bao nhiêu trả bấy nhiêu
Báo The Information cho biết, trong tài liệu giới thiệu doanh nghiệp mà Anthropic cập nhật có viết: “Phí chỗ ngồi hàng tháng (seats) chỉ bao gồm quyền truy cập nền tảng, không bao gồm bất kỳ lượng sử dụng nào; mọi mức sử dụng đều được tính phí riêng theo mức giá API tiêu chuẩn.” Trước đây doanh nghiệp mua “thả sức dùng”, thì nay chuyển sang “theo lượt tính”.
Theo phương án cũ, chi phí thuê bao hàng tháng cho mỗi tài khoản doanh nghiệp khoảng 40 đến 200 USD, kèm theo chiết khấu API từ 10% đến 15%. Dù phương án mới hạ mức phí thuê bao xuống 20 USD/tháng, nhưng đồng thời loại bỏ mọi chiết khấu API và yêu cầu doanh nghiệp cam kết trước cũng như thanh toán trước lượng Token dự ước sử dụng mỗi tháng. Dù dùng nhiều hay ít thực tế, số tiền cam kết vẫn phải trả nguyên, và cam kết càng cao cũng không được đổi lấy đơn giá thấp hơn.
Cấu trúc này đối với Anthropic là doanh thu thường xuyên có thể dự đoán hằng năm; còn đối với doanh nghiệp thì là sự chuyển giao chi phí theo mức sử dụng và rủi ro.
“Thiếu hụt tài nguyên tính toán” mới là ngòi nổ thật sự cho việc điều chỉnh giá
Anthropic gọi lần điều chỉnh này là “tối ưu hóa sản phẩm”, nhưng động lực đằng sau là chi phí tính toán cao ngất. Dù doanh thu năm hóa của Anthropic chỉ trong vỏn vẹn bốn tháng đã tăng từ 9 tỷ USD lên 30 tỷ USD, thì thứ mà người dùng nhận được không phải là giảm giá, mà là sự tái cấu trúc mô hình doanh thu.
Điểm cốt lõi nằm ở cách tiêu hao của đại lý AI (AI Agent). Việc chat thông thường tiêu thụ theo kiểu “uống từng ngụm nhỏ”, nhưng các tác vụ có nhiều bước, ghép nối lặp lại, thậm chí các luồng công việc phối hợp giữa nhiều đại lý, lại là kiểu “uống ừng ực thả ga”.
Ở phía cung cũng đang căng thẳng. Giá thuê GPU Blackwell tăng 48% trong vòng hai tháng; CoreWeave tăng giá hơn 20% từ cuối năm trước; và một dự báo của ngân hàng Mỹ cho rằng nhu cầu năng lực tính toán sẽ tiếp tục co hẹp cho đến năm 2029. Khoản doanh thu do giá cố định mang lại đối với Anthropic đã sớm không còn chịu nổi gánh nặng.
Dịch vụ không ổn định mới là “đèn cảnh báo” thật sự đối với khách hàng doanh nghiệp
Ngoài ra, tính ổn định của dịch vụ cũng là một vấn đề lớn. Sáng lập viên Retool, David Hsu, cho biết trên báo The Wall Street Journal rằng dù Claude Opus 4.6 hoạt động tốt hơn OpenAI, cuối cùng ông vẫn chuyển quy trình làm việc sang bên sau. Lý do là dịch vụ Claude thường xuyên bị gián đoạn khiến ông nhiều lần không thể bàn giao mã đúng tiến độ.
Trong 90 ngày tính đến ngày 8 tháng 4 năm nay, thời gian hoạt động bình thường của Anthropic API chỉ đạt 98,95%, thấp xa so với chuẩn 99,99% của ngành. Hành động của Hsu cho thấy một điều: khi lựa chọn giữa độ tin cậy dịch vụ và năng lực mô hình, doanh nghiệp cần AI có độ ổn định cao.
Chi phí thật của “nhân viên AI” phức tạp hơn nhiều so với con số trên hóa đơn
Hiện nay, mô hình định giá AI dựa trên “phí thuê bao hằng tháng” của truyền thống đã qua đi; tổng chi phí sẽ được tính lại dựa trên mức Token sử dụng thực tế. Việc giành chiết khấu theo mức sử dụng hoặc điều khoản điều chỉnh linh hoạt trong hợp đồng, hoặc chủ động kiểm soát chi tiêu bằng cách tối ưu Prompt, xử lý theo lô và chiến lược bộ nhớ đệm (cache), đã trở thành bài toán mới đối với các doanh nghiệp đi theo hướng áp dụng và chuyển đổi sang AI.
Vài ngày trước, OpenAI cũng công bố chuyển Codex sang tính phí theo Token; GitHub ngày 10 tháng 4 đã siết lại giới hạn sử dụng Copilot; và Windsurf dùng hạn ngạch theo ngày thay cho cơ chế theo điểm. Toàn bộ ngành công nghiệp AI đồng loạt đang tuyên bố chấm dứt thời đại giá cố định.
Trước khi doanh nghiệp đánh giá “triển khai AI có thể tiết kiệm được bao nhiêu nhân lực”, có lẽ vẫn cần kiểm nghiệm liệu người dùng có thể tạo ra các tác phẩm ổn định và chất lượng cao trong một ngân sách bị giới hạn hay không.
Bài viết này về việc phiên bản doanh nghiệp Anthropic Claude tiên phong chuyển sang tính phí theo mức sử dụng, liệu nhân viên AI có thực sự tiết kiệm tiền hơn không? Xuất hiện sớm nhất trên 鏈新聞 ABMedia.
Bài viết liên quan
Thợ đào Bitcoin TeraWulf huy động $900M thông qua phát hành cổ phiếu để xây dựng trung tâm dữ liệu AI
Đánh giá Viện nghiên cứu An toàn AI của Vương quốc Anh về Claude Mythos: Có thể tự động hoàn thành mô phỏng tấn công mạng doanh nghiệp 32 bước
Nvidia Kích hoạt Mô hình AI Lượng tử, Thúc đẩy Đà tăng trên Toàn bộ Cổ phiếu Lượng tử Toàn cầu
Chứng sợ AI, và vụ phóng hỏa đêm muộn với ý định thiêu chết Sam Altman
TSMC và Samsung tiếp sức! Chip AI5 của Tesla hoàn tất thiết kế, kế hoạch mục tiêu sản xuất hàng loạt vào giữa năm 2027