Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Pre-IPOs
Mở khóa quyền truy cập đầy đủ vào các IPO cổ phiếu toàn cầu
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Hai trăm tỷ đô la: OpenAI và Nvidia tham gia "Chiến tranh suy luận"
NVIDIA và OpenAI đều bỏ ra 20 tỷ USD để mở rộng thị trường chip AI suy luận, Cerebras nộp đơn IPO định giá 35 tỷ USD. Cuộc chiến âm thầm này nhằm kiểm soát khả năng tính toán AI trong tương lai đang định hình lại cấu trúc thị trường công nghệ trị giá hàng nghìn tỷ USD. Bài viết này xuất phát từ Wall Street Journal, do PANews tổng hợp và báo cáo.
(Trước đó: Doanh thu của NVIDIA tăng trưởng 114% vượt dự kiến, tại sao Jensen Huang không e ngại tác động của DeepSeek?)
(Thông tin bổ sung: The Economist tuyên bố: 2025 là thời đại “AI Agent”, nhưng cần chú ý đến ba khó khăn)
Mục lục bài viết
Toggle
Tháng 12 năm 2025, NVIDIA âm thầm chi 20 tỷ USD mua lại một công ty chip AI tên là Groq.
Ngày 17 tháng 4 năm 2026, OpenAI công bố sẽ mua hơn 20 tỷ USD chip của một công ty chip AI khác là Cerebras. Cùng ngày, Cerebras chính thức nộp hồ sơ IPO lên NASDAQ, mục tiêu định giá 35 tỷ USD.
Hai khoản tiền này, gần như bằng nhau về số lượng. Một là mua lại, một là mua sắm. Một đến từ nhà bán chip AI lớn nhất thế giới, một đến từ nhà mua AI lớn nhất toàn cầu.
Đây không phải hai sự kiện độc lập, mà là hai hành động đối xứng trong cùng một cuộc chiến. Tên chiến trường là: AI suy luận.
Phần lớn mọi người không để ý đến cuộc chiến này. Bởi vì nó không có tiếng nổ, chỉ là các thông báo tài chính và các cuộc thảo luận kỹ thuật lan truyền trong cộng đồng kỹ sư Silicon Valley. Nhưng ảnh hưởng của nó có thể sâu sắc hơn bất kỳ buổi ra mắt AI nào trong hai năm qua — vì nó đang phân phối lại quyền kiểm soát của một thị trường công nghệ gần như chắc chắn sẽ trở thành lớn nhất trong lịch sử.
Suy luận là gì, tại sao từ khóa quan trọng năm 2026 không còn là “đào tạo”
Trước khi nói về hai khoản 20 tỷ USD này, cần hiểu một bối cảnh: Trận chiến chip AI đang diễn ra một sự dịch chuyển trọng tâm.
Đào tạo và suy luận là hai giai đoạn tiêu thụ sức mạnh tính toán của AI. Đào tạo là tạo mô hình — cung cấp lượng dữ liệu khổng lồ cho mạng neural để nó học một khả năng nào đó. Quá trình này thường chỉ xảy ra một lần hoặc định kỳ cập nhật. Suy luận là sử dụng mô hình — mỗi lần người dùng đặt câu hỏi, ChatGPT đưa ra câu trả lời, đó chính là một yêu cầu suy luận.
Năm 2023, phần lớn chi tiêu cho sức mạnh tính toán AI toàn cầu tập trung vào đào tạo, suy luận chỉ là phụ.
Nhưng tỷ lệ này đang nhanh chóng đảo ngược.
Theo dữ liệu nghiên cứu thị trường của Deloitte và CES 2026, năm 2025, suy luận đã chiếm tới 50% tổng chi tiêu cho sức mạnh tính toán AI; đến năm 2026, tỷ lệ này sẽ nhảy lên 2/3. CEO Lenovo, Yang Yuanqing, nói thẳng hơn tại CES: Cấu trúc chi tiêu AI sẽ hoàn toàn đảo ngược từ “80% đào tạo + 20% suy luận” thành “20% đào tạo + 80% suy luận”.
Logic không phức tạp. Đào tạo là chi phí một lần, suy luận là chi phí liên tục. GPT-4 chỉ đào tạo một lần, nhưng mỗi ngày phải trả lời hàng tỷ câu hỏi của người dùng, mỗi cuộc trò chuyện đều là một yêu cầu suy luận. Sau khi triển khai quy mô lớn, lượng tiêu thụ suy luận tích lũy vượt xa đào tạo.
Điều này có nghĩa gì? Nghĩa là phần lợi nhuận lớn nhất của ngành AI đang chuyển từ “chip đào tạo” sang “chip suy luận”. Và hai loại chip này cần các kiến trúc thiết kế hoàn toàn khác nhau.
Vấn đề của NVIDIA: Chip thiết kế cho đào tạo, sinh ra không phù hợp cho suy luận
H100, H200 của NVIDIA là những “quái vật” dành cho đào tạo. Ưu thế cốt lõi của chúng là khả năng xử lý cực cao — đào tạo cần thực hiện hàng loạt phép nhân ma trận khổng lồ, GPU rất giỏi với “tính toán song song đa nhân”.
Nhưng nút thắt của suy luận không phải là tính toán, mà là băng thông bộ nhớ.
Khi người dùng gửi câu hỏi, chip cần chuyển toàn bộ trọng số của mô hình từ bộ nhớ vào các đơn vị tính toán, rồi mới sinh ra câu trả lời. Quá trình “chuyển” này chính là nguồn gốc gây ra độ trễ trong suy luận. GPU của NVIDIA dùng bộ nhớ băng thông cao (HBM) ngoài, nhưng việc vận chuyển này không thể tránh khỏi gây độ trễ — đối với ChatGPT xử lý hàng nghìn yêu cầu mỗi giây, độ trễ này cộng dồn theo quy mô sẽ trở thành giới hạn hiệu năng thực sự.
Các kỹ sư của OpenAI nhận ra vấn đề này khi tối ưu Codex (công cụ sinh mã), phát hiện dù điều chỉnh tham số thế nào, tốc độ phản hồi vẫn bị giới hạn bởi kiến trúc GPU của NVIDIA.
Nói cách khác, điểm yếu của NVIDIA ở phía suy luận không phải do cố gắng hay nỗ lực, mà là do kiến trúc.
Cerebras đã đi theo hướng hoàn toàn khác. Chip WSE-3 của họ lớn đến mức phải dùng đóng gói wafer — diện tích 46.255 mm², lớn hơn lòng bàn tay người — tích hợp 900.000 lõi AI và 44GB SRAM siêu tốc ngay trên một miếng silicon. Bộ nhớ được đặt ngay cạnh các lõi tính toán, rút ngắn khoảng cách “chuyển” từ centimet xuống micromet. Kết quả: tốc độ suy luận nhanh hơn H100 của NVIDIA từ 15 đến 20 lần.
Cần bổ sung: NVIDIA không đứng yên. Kiến trúc Blackwell (B200) mới nhất của họ đã nâng cao hiệu năng suy luận gấp 4 lần so với H100, đang được triển khai quy mô lớn. Nhưng Blackwell đang nhắm tới một mục tiêu di động — Cerebras cũng đang cập nhật dòng sản phẩm, và thị trường chip đang xuất hiện nhiều đối thủ cạnh tranh chứ không chỉ riêng Cerebras.
20 tỷ USD của NVIDIA: Một giấy chứng nhận thừa nhận sau thương vụ mua bán lớn nhất lịch sử
Ngày 24 tháng 12 năm 2025, NVIDIA công bố thương vụ mua lại lớn nhất trong lịch sử của họ.
Mục tiêu là Groq.
Groq là đối thủ cạnh tranh cùng loại của Cerebras, cũng tập trung vào chip SRAM tối ưu cho suy luận — gọi là LPU (Language Processing Unit), từng được đánh giá là chip có tốc độ suy luận nhanh nhất thế giới. NVIDIA bỏ ra 20 tỷ USD mua toàn bộ công nghệ cốt lõi và đội ngũ sáng lập của Groq, gồm cả nhà sáng lập Jonathan Ross và nhiều kỹ sư hàng đầu từng làm việc tại nhóm TPU của Google.
Đây là thương vụ lớn nhất của NVIDIA kể từ việc mua Mellanox năm 2019 với 7 tỷ USD, gấp ba lần.
Theo nhiều nhà phân tích, điều truyền tải sau số tiền này còn quan trọng hơn chính số tiền: NVIDIA nhận thấy mình còn thiếu cấu trúc trong suy luận, và thiếu đến mức phải bỏ ra 20 tỷ USD để lấp đầy.
Nếu NVIDIA thực sự tin rằng GPU của họ vô địch trong suy luận, họ đã không cần mua Groq. Thực tế, số tiền này là một đơn đặt hàng mua công nghệ trị giá 20 tỷ USD — thừa nhận rằng kiến trúc SRAM tích hợp có lợi thế thực sự trong suy luận, và NVIDIA không thể tự nhiên phủ sóng lợi thế này qua dòng sản phẩm hiện tại, nên phải trả giá cao nhất để mua lại một công nghệ mà họ không có.
Dĩ nhiên, sau khi mua, NVIDIA tuyên bố rằng: “Hợp tác sâu với Groq để cung cấp giải pháp suy luận toàn diện hơn.” Ngôn ngữ kỹ thuật là: Chúng tôi nhận ra sản phẩm của mình chưa đủ, nên mua của người khác.
20 tỷ USD của OpenAI: Mua chip chỉ là bề nổi, cổ phần mới là chìa khóa
Quay trở lại với OpenAI.
Tháng 1 năm 2026, OpenAI ký hợp đồng mua 100 tỷ USD công suất tính toán trong ba năm với Cerebras — truyền thông ban đầu nhấn mạnh là “OpenAI đa dạng hóa nhà cung cấp chip”, giọng điệu khá nhẹ nhàng.
Nhưng chi tiết mới được tiết lộ vào ngày 17 tháng 4 đã làm thay đổi hoàn toàn bản chất của sự việc:
Thứ nhất, số tiền mua sắm tăng từ 100 tỷ lên 200 tỷ USD, gấp đôi.
Thứ hai, OpenAI sẽ nhận quyền chọn cổ phần của Cerebras, theo quy mô mua sắm, tỷ lệ sở hữu có thể lên tới 10% tổng cổ phần của Cerebras.
Thứ ba, OpenAI sẽ cung cấp 1 tỷ USD vốn xây dựng trung tâm dữ liệu cho Cerebras — nói cách khác, OpenAI đang giúp Cerebras xây nhà máy.
Ba chi tiết này tạo ra một bức tranh hoàn toàn khác: OpenAI không chỉ mua chip, mà còn đang nuôi dưỡng một nhà cung cấp.
Lịch sử công nghệ đã có tiền lệ rõ ràng. Năm 2006, Apple bắt đầu hợp tác tùy biến chip dòng A với Samsung, ban đầu cũng là hợp đồng mua bán lớn, nhưng sau đó Apple ngày càng tham gia sâu hơn, tự nghiên cứu dòng chip M, kiểm soát hoàn toàn chuỗi cung ứng — từ đó quyền kiểm soát chuỗi cung ứng chuyển từ Intel và Samsung sang Apple. OpenAI đang làm điều tương tự — nhưng có một điểm khác biệt quan trọng: Apple từ đầu đã nắm quyền thiết kế chip, còn OpenAI hiện vẫn là người mua, sau khi Cerebras lên sàn, sẽ phát triển độc lập và phục vụ nhiều khách hàng hơn. Con đường này có thể không dẫn đến OpenAI hoàn toàn kiểm soát Cerebras, mà là xây dựng một hệ sinh thái hợp tác chặt chẽ.
Một mặt, bằng cách bỏ ra 20 tỷ USD và sở hữu cổ phần trong Cerebras, OpenAI đảm bảo nguồn cung sức mạnh tính toán suy luận không phụ thuộc NVIDIA; mặt khác, OpenAI đang hợp tác với Broadcom để phát triển chip ASIC riêng, dự kiến sản xuất hàng loạt vào cuối năm 2026. Cả hai hướng đi cùng lúc, mục tiêu cuối cùng là tự chủ về khả năng tính toán.
Cerebras hôm nay IPO, bạn đang mua gì
Ngày 17 tháng 4, Cerebras chính thức nộp hồ sơ IPO lên NASDAQ, mục tiêu định giá 35 tỷ USD, dự kiến huy động 3 tỷ USD.
Mức định giá này tăng gấp bốn lần so với mức 8,1 tỷ USD của tháng 9 năm 2025. Tháng 2 năm nay, họ mới hoàn tất vòng gọi vốn mới, định giá đã lên tới 23 tỷ USD, mức IPO 35 tỷ USD còn cao hơn 52% dựa trên giá trị này.
Những người quen thuộc với lịch sử Cerebras biết rằng đây là lần thứ hai họ cố gắng lên sàn. Lần đầu là năm 2024, nhưng do khách hàng chính G42 (quỹ đầu tư công nghệ của chính phủ Các Tiểu vương quốc Ả Rập Thống nhất) chiếm tới 83-97% doanh thu năm đó, CFIUS can thiệp vì lý do an ninh quốc gia, khiến IPO bị hoãn lại.
Lần này, G42 đã không còn trong danh sách cổ đông, thay vào đó là OpenAI.
Nói cách khác, cấu trúc tập trung khách hàng của Cerebras vẫn chưa được giải quyết triệt để — khách hàng lớn đã đổi, nhưng phụ thuộc vào khách hàng lớn vẫn còn. Các nhà đầu tư cần đánh giá: khách hàng lớn này tốt hơn hay tệ hơn? Về mặt tín dụng, rõ ràng OpenAI tốt hơn G42; về chiến lược, OpenAI còn là đối thủ cạnh tranh của Cerebras — khi chip tự nghiên cứu của họ hoàn thiện, sẽ là mối đe dọa thực sự.
Cerebras cũng tích cực mở rộng khách hàng khác, dự kiến sẽ liệt kê nhiều nguồn thu nhập đa dạng hơn trong hồ sơ phát hành, giúp giảm sự tập trung. Nhưng trước khi chip tự nghiên cứu của OpenAI đi vào sản xuất hàng loạt, câu hỏi này vẫn chưa có câu trả lời.
Mua cổ phiếu Cerebras, bạn thực chất đang đặt cược: OpenAI sẽ tiếp tục chọn Cerebras, và chip tự nghiên cứu của OpenAI sẽ không sớm ra đời. Cả hai đều chưa chắc chắn.
Tất nhiên, lý do tăng trưởng vẫn có thật: nếu quy mô thị trường suy luận tăng theo dự đoán, dù Cerebras chỉ chiếm một phần nhỏ trong thị trường này, con số tuyệt đối cũng rất đáng kể. Vấn đề không phải là Cerebras có cơ hội hay không, mà là mức định giá 35 tỷ USD đã phản ánh kỳ vọng tích cực nhất hay chưa.
Hai khoản 20 tỷ USD này, đối xứng xuất hiện trong khoảng cuối năm 2025 đến tháng 4 năm 2026.
Một đến từ nhà bán chip AI lớn nhất thế giới, mua lại công nghệ của đối thủ cạnh tranh trong thị trường suy luận.
Một đến từ nhà mua AI lớn nhất toàn cầu, đang nuôi dưỡng một công ty thách thức NVIDIA trong thị trường suy luận.
20 tỷ của NVIDIA là phòng thủ — họ dùng giá cao nhất để chặn một lỗ hổng công nghệ mà chính họ không thể tự lấp đầy.
20 tỷ của OpenAI là tấn công — họ tiêu tiền xây dựng một con đường cao tốc suy luận không phụ thuộc NVIDIA, đồng thời sở hữu cổ phần trong một trạm thu phí trên con đường đó.
Cuộc chiến này không có tiếng súng, nhưng dòng chảy vốn không bao giờ nói dối. Hai khoản tiền này cho thấy rõ hơn bất kỳ buổi ra mắt AI nào: quyền kiểm soát hạ tầng suy luận đang bị tranh giành. Và thị trường này, vào năm 2026, sẽ chiếm tới hai phần ba tổng chi tiêu cho sức mạnh tính toán toàn ngành.
IPO của Cerebras chính là hồi còi báo hiệu cuộc chiến này bắt đầu.