NVIDIA thị phần giảm mạnh, cơ hội trong giai đoạn hai của cuộc cách mạng AI nằm ở đâu? Đây là bài thứ chín trong series 100 bài nghiên cứu đầu tư AI.


Trước đó đã xem qua Intel, AMD, ARM. Trong năm qua, giá cổ phiếu của họ đều tăng không nhỏ—AMD nhân đôi, Intel tăng gấp ba, ARM cũng đạt đỉnh cao lịch sử. Sau khi tăng trưởng, một câu hỏi đơn giản đã xuất hiện:
Liệu những cổ phiếu đã tăng này còn có thể giữ được không? Những cổ phiếu chưa tăng có còn cơ hội không?
Để trả lời câu hỏi này, không thể không đề cập đến một từ khóa trung tâm—suy luận. Những công ty đó tăng trưởng, trong phân tích đều lặp lại hai chữ này.
Vậy: Đường đua suy luận lớn đến mức nào? Hiện tại đang ở giai đoạn nào? Những công ty nào sẽ hưởng lợi? Những đã được thị trường định giá, những chưa?
Đây là bài thứ chín trong series 100 bài nghiên cứu đầu tư AI, dài 15.000 từ, nội dung phong phú nhưng dễ đọc, khuyên nên lưu lại trước khi xem.
1. Đường đua có lớn không
Huấn luyện mô hình là "viết chương trình", suy luận là "quá trình chương trình này được gọi hàng ngày". Sau khi GPT được huấn luyện, hàng ngày có hàng tỷ người hỏi nó vấn đề, mỗi lần hỏi đều tiêu thụ sức mạnh suy luận. Claude Code chạy một nhiệm vụ, agent tự chạy 100 vòng, mỗi vòng đều là suy luận.
Nhiều nghiên cứu ngành và truyền thông đều chỉ về một hướng: sau khi mô hình đi vào môi trường sản xuất, suy luận sẽ trở thành phần lớn chi phí vòng đời, ước tính phổ biến trong khoảng 80-90%. Nói cách khác, trong hóa đơn tính toán của thời đại AI tương lai, 10 đồng có 8 đồng là do suy luận tiêu hao.
Nhưng trong 3 năm qua, hầu như thị trường chỉ bàn về huấn luyện, vì huấn luyện là câu chuyện "hấp dẫn" hơn—so xem ai có H100 nhiều hơn, tham số lớn hơn, ai huấn luyện ra mô hình thế hệ tiếp theo trước. Suy luận bị xem như việc phụ sau khi huấn luyện xong.
Nhận thức sai lệch này đang dần được điều chỉnh, và chính điều này là lý do cốt lõi khiến giá của các công ty bán dẫn trong năm qua bị định giá lại.
Vậy đường đua suy luận lớn đến mức nào? Cụ thể có thể đo từ 5 góc độ.
Thứ nhất là số người dùng. ChatGPT hoạt động hàng tuần 9 tỷ, trả phí 50 triệu. So sánh trực tiếp hơn ở Trung Quốc—lượng token gọi trung bình mỗi ngày từ đầu năm 2024 là 1000 tỷ, đến năm 2026 là 140 nghìn tỷ, tăng 1400 lần. Chỉ số này còn xa mới đạt tới điểm bão hòa.
Thứ hai là cường độ sử dụng. Khối lượng token xử lý của OpenAI vào tháng 10 năm 2025 vẫn là 6 tỷ mỗi phút, đến tháng 4 năm 2026 đã lên 15 tỷ—gấp 2,5 lần trong nửa năm. Doanh thu từ phiên bản doanh nghiệp chiếm hơn 40%, người dùng doanh nghiệp sử dụng mạnh gấp hàng chục lần người tiêu dùng.
Thứ ba là độ dài hội thoại. Độ dài ngữ cảnh từ vài trăm token ban đầu, đến nay API DeepSeek liệt kê V4 Pro / Flash có độ dài ngữ cảnh 1 triệu, xuất tối đa 384 nghìn. Càng dài, mỗi lần suy luận tiêu thụ bộ nhớ và sức mạnh tính toán càng cao.
Thứ tư là mô hình ngày càng tốn nhiều sức mạnh tính toán hơn. Các mô hình suy luận như OpenAI o1, DeepSeek R1, Claude thinking, trước khi trả lời câu hỏi sẽ "suy nghĩ" trong nội bộ vài nghìn đến hàng chục nghìn token. Huang Renxun từng lấy DeepSeek R1 làm ví dụ, nói rằng mô hình suy luận có thể cần lượng tính toán cao hơn nhiều, thậm chí gấp trăm lần.
Trước đây, bạn hỏi AI một câu, nó trực tiếp trả lời; bây giờ, bạn hỏi một vấn đề khó, nó sẽ suy nghĩ trong đầu nửa phút rồi mới trả lời. Khoảng thời gian "suy nghĩ nửa phút" này chính là tiêu hao sức mạnh tính toán mới.
Thứ năm là agent. Một agent thường phải gọi mô hình 10-100 lần cho một nhiệm vụ. Số hoạt động hàng tuần của OpenAI Codex đã vượt 4 triệu (tính đến ngày 22 tháng 4 năm 2026)—chỉ là một sản phẩm của một công ty. Một chuyên gia trong chuỗi ngành AI nhận định, tổng tiêu hao sức mạnh tính toán của AI thông minh có thể vượt hơn 10 lần so với các mô hình ngôn ngữ lớn cùng tham số.
Năm yếu tố nhân lên nhau, trong vòng 3-5 năm, tổng cầu suy luận sẽ mở rộng theo cấp số nhân, không phải là chuyện phóng đại, mà là một dự đoán ngày càng trở thành xu hướng chính thống.
《NVIDIA thị phần suy luận giảm mạnh, cơ hội trong giai đoạn hai của cuộc cách mạng AI nằm ở đâu?》
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim