Thiếu hụt sức mạnh GPU lặp lại: Các công ty lớn như OpenAI, Anthropic chiếm dụng nguồn cung, các startup AI phải chờ đến cuối năm

Microsoft, Amazon và các ông lớn đám mây khác đang tập trung GPU tính toán của NVIDIA cho các đội nhóm nội bộ và khách hàng hàng đầu như OpenAI, Anthropic, khiến các startup AI nhỏ và vừa đối mặt với mức tăng giá thuê 32%, xếp hàng đến cuối năm, và hạn mức hợp đồng tăng vọt lên hàng chục triệu USD. Một số quỹ đầu tư đã bắt đầu lên kế hoạch chia sẻ pool sức mạnh tính toán để thương lượng tập thể, trong khi các startup thậm chí tự bỏ tiền mua GPU để tránh xếp hàng.
(Thông tin trước: Giá cổ phiếu của NVIDIA đạt đỉnh lịch sử, vốn hóa vượt 5 nghìn tỷ đô la: Đầu tư 5 tỷ USD vào Intel trong chưa đầy một năm, lãi 12.7 tỷ USD)
(Bổ sung nền tảng: Toàn văn bài phát biểu của Jensen Huang tại GTC2026: Nhu cầu AI đạt hàng nghìn tỷ USD, sức mạnh tính toán tăng 350 lần, OpenClaw biến mọi công ty thành AaaS)

Mục lục bài viết

Toggle

  • Nửa năm trước 2.80 USD, gia hạn thành 3.70 USD
  • Hệ thống phân cấp của Microsoft
  • Quỹ đầu tư đã bắt đầu tự tìm cách

4 vạn GPU trực tuyến, 40 vạn nhu cầu đang xếp hàng. Theo báo cáo của The Information, nhà cung cấp đám mây GPU Lightning AI do CEO Will Falcon điều hành đã đưa ra một con số, mô tả chính xác tỷ lệ cung cầu thị trường sức mạnh tính toán AI năm 2026 là 1 so với 10. Nền tảng của họ có khoảng 40 khách hàng đang chờ, giá thuê đã tăng hơn 25% trong nửa năm qua.

Nửa năm trước 2.80 USD, gia hạn thành 3.70 USD

Startup tạo hình ảnh mới Krea (tổng vốn huy động 83 triệu USD, trong đó có Andreessen Horowitz và Bain Capital Ventures) đã thuê hàng trăm chip NVIDIA Blackwell với giá 2.80 USD mỗi giờ mỗi card cách đây nửa năm, hợp đồng 6 tháng. Khi gia hạn, nhiều nhà cung cấp đám mây trực tuyến đã không còn bắt máy.

Cuối cùng, giá giao dịch là 3.70 USD, tăng 32%, hợp đồng được kéo dài đến 1 năm. CEO của Krea, Victor Perez, cho biết một số nhà cung cấp báo giá hợp đồng dài 3 năm mới chịu thương lượng, còn một số thì thẳng thừng không phản hồi.

Điều này không phải là trường hợp cá biệt, chỉ số giá Ornn Compute Price Index cho thấy, giá thuê theo giờ của Blackwell đã tăng vọt lên 4.08 USD, trong vòng hai tháng đã tăng 48%.

Giá thuê hợp đồng một năm của H100 cũng từ 1.70 USD tháng 10 năm 2025 nhảy lên 2.35 USD tháng 3 năm 2026, tăng gần 40%.

Hệ thống phân cấp của Microsoft

Microsoft áp dụng hệ thống phân cấp quản lý truy cập GPU, ưu tiên phân phối sức mạnh tính toán cho khoảng 1,000 khách hàng lớn nhất (Tier 1); khách hàng nhỏ hơn muốn thuê Blackwell phải cam kết ít nhất 1,000 card, ít nhất một năm, hợp đồng bắt đầu từ hàng chục triệu USD.

Khách hàng trả theo mức sử dụng (pay-as-you-go) nếu để GPU bị bỏ không vài giờ, Microsoft có thể thu hồi quyền truy cập ngay lập tức. Các startup tham gia chương trình miễn phí “Microsoft for Startups” cũng được thông báo rằng nếu không sử dụng đầy đủ sẽ bị thu hồi quyền cấp phép GPU. Quản lý bán hàng của Azure gần đây đã thông báo với nhân viên rằng thời gian chờ GPU của khách hàng đám mây dự kiến sẽ kéo dài đến cuối năm 2026.

Hiện tại, Microsoft đang tập trung cung cấp sức mạnh tính toán cho các khách hàng lớn như OpenAI, Anthropic, khiến các startup AI nhỏ và vừa trở thành những người xếp hàng chờ đợi.

Quỹ đầu tư đã bắt đầu tự tìm cách

Đồng sáng lập của Quỹ General Catalyst, Hemant Taneja, đã gửi khảo sát cho các công ty được đầu tư về vấn đề hạn chế sức mạnh tính toán, tổ chức này đang lên kế hoạch chia sẻ pool sức mạnh tính toán hoặc nhóm đại lý thương lượng tập thể.

Trường hợp cực đoan hơn là startup AI trong ngành dầu khí Collide, dự định bỏ ra khoảng 50.000 USD để mua trực tiếp GPU NVIDIA, thuê trung tâm dữ liệu để tự chạy, nhằm tránh xếp hàng và rủi ro giá cả. Khi một công ty AI trong ngành dầu khí quyết định quay lại mua phần cứng, thuê máy chủ như cũ, mọi người đều biết rằng chiếc ghế đám mây đã quá chật chội.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim