Công ty Chứng khoán Quốc Liên Dân Sinh: Nhu cầu Token trong bối cảnh "lạm phát" Quan sát ngắn hạn về các nhà cung cấp mô hình lớn tăng giá và cải thiện biên nhờ nhu cầu
Ứng dụng Tài chính Zhitong được biết, Công ty Chứng khoán Liên Minh Minsheng đã phát hành báo cáo nghiên cứu cho rằng, điện toán đám mây dần trở thành “bán tài nguyên”, trong khi các nhà sản xuất mô hình lớn biến thành “bán Token làm nhiên liệu + bán thành quả”. Việc tăng giá của kế hoạch mã hóa GLM của Zhitu (02513) phản ánh sự thay đổi trong logic định giá ngành: Khi suy luận tiêu thụ trở thành nguyên liệu sản xuất, các nhà cung cấp mô hình có cơ hội chuyển “khan hiếm sức mạnh tính toán” thành lợi nhuận gộp và dòng tiền thông qua phân tầng giá và các sản phẩm đăng ký. Quan sát ngắn hạn về việc tăng giá và nhu cầu (lạm phát Token) mang lại cải thiện biên, theo dõi trung hạn về vị thế doanh nghiệp và tỷ lệ giữ chân đăng ký để mở rộng doanh thu gia hạn, và dài hạn ủng hộ việc phổ biến các công cụ quản trị mang lại thị trường mới cho “tường lửa AI”.
Quan điểm chính của Công ty Chứng khoán Liên Minh Minsheng như sau:
Sự kiện: Ngày 12 tháng 2, Zhitu chính thức thông báo trên kênh chính thức về việc tăng giá đăng ký kế hoạch mã hóa GLM, mức tăng “ít nhất 30%”. Trước đó, các nhà cung cấp đám mây quốc tế cũng đồng loạt tăng giá trong tháng này, như Google Cloud tăng giá tới 100% ở Bắc Mỹ, đồng thời cũng tăng giá tại châu Âu và châu Á; cùng lúc đó, AWS cũng tăng giá khoảng 15%. Nhìn chung, nhu cầu Token “lạm phát” không chỉ có lợi cho sức mạnh tính toán đám mây mà còn giúp các nhà sản xuất mô hình có quyền thương lượng.
Phá vỡ con đường miễn phí truyền thống của internet
Con đường điển hình của phần mềm internet truyền thống là dùng miễn phí để mở rộng người dùng, dựa vào “số lượng và thời gian người dùng” để có quyền thương lượng, sau đó kiếm lợi qua quảng cáo, đăng ký thành viên, dịch vụ gia tăng, hoa hồng giao dịch. Nguyên nhân nền tảng của miễn phí chính là chi phí biên cực thấp. Cụ thể, mỗi người dùng hoặc mỗi lần nhấp chuột đều có thể làm giảm chi phí nhờ hiệu ứng băng thông và lưu trữ, gần như về không.
Thời đại điện toán đám mây cũng từng xuất hiện mô hình “miễn phí/giá thấp rồi mở rộng”, nhưng đơn vị tính phí của đám mây nhanh chóng chuyển sang CPU/lưu trữ/băng thông/số yêu cầu, khách hàng đã quen với “tính phí theo lượng”. Đám mây có thể thu phí vì nó cung cấp các tài nguyên rõ ràng và các thỏa thuận cấp dịch vụ (SLA). Tuy nhiên, khi ngành vẫn còn trong “chiến tranh giá mô hình”, Zhitu đã xuất hiện tín hiệu tăng giá, điều này có nghĩa là “đơn vị đo lường” của thời đại mô hình lớn từ lưu lượng (DAU/thời gian) chuyển sang Token (tiêu thụ suy luận), và tiêu thụ Token ngày càng trở thành nhu cầu thiết yếu trong nhiều kịch bản.
Thay đổi trong thời đại mô hình lớn: Token trở thành “nguyên liệu sản xuất có thể đo lường”, không còn là “lưu lượng miễn phí”
Các mô hình lớn biến các dịch vụ như “đối thoại/viết mã/ tạo nội dung” vốn tưởng chừng do nhà cung cấp phần mềm cung cấp thành dịch vụ dựa vào sức mạnh tính toán trực tuyến. Đối với nhà sản xuất mô hình, mỗi lần phản hồi đều tiêu tốn GPU, bộ nhớ đồ họa, băng thông và điện năng; còn đối với người dùng, mỗi lần “để mô hình nghĩ thêm một chút, viết đoạn mã dài hơn, chạy một nhiệm vụ phức tạp hơn” đều tiêu thụ nhiều Token hơn, do đó Token tự nhiên trở thành đơn vị đo lường mới. Trước đó, Zhitu vì tăng trưởng người dùng dẫn đến căng thẳng tạm thời về sức mạnh tính toán, đã thực hiện “bán giới hạn” kế hoạch mã hóa, điều này tạo thành một chuỗi cung cầu điển hình: Nhu cầu tăng mạnh trong ngắn hạn → nguồn lực bị hạn chế cứng nhắc (dẫn đến giới hạn luồng/giới hạn số lượng) → tăng giá.
Khi xảy ra tắc nghẽn cao điểm và thiếu hụt nguồn lực, việc tăng giá là cơ chế để các nhà mô hình lọc nhu cầu, bảo vệ trải nghiệm người dùng tốt hơn so với “giới hạn luồng không phân biệt”. Hơn nữa, chi phí của các nhà cung cấp mô hình vẫn liên quan chặt chẽ đến cung GPU, tỷ lệ sử dụng, tối ưu suy luận; việc tăng giá/phân tầng giá hợp lý giúp các nhà mô hình thoát khỏi “lỗ lớn khi quy mô lớn hơn”, từ đó nâng cao lợi nhuận gộp và chất lượng dòng tiền.
Nhu cầu Token trong “lạm phát”
“Lạm phát Token” không phải là Token trở nên đắt hơn, mà là cấu trúc tiêu thụ Token theo thời gian và theo người dùng tăng lên mang tính cấu trúc. Các nguyên nhân chính khiến nhu cầu Token tăng cao gồm:
Từ “hỏi đáp” sang “làm việc”: Đến nay, người dùng không còn hài lòng với dạng trả lời đơn thuần, mà bắt đầu yêu cầu mô hình tái cấu trúc mã, chỉnh sửa tệp, tạo tài liệu, chạy thử nghiệm v.v. Trong các kịch bản lập trình, đặc trưng tự nhiên là “ngữ cảnh dài, nhiều vòng lặp, lượng xuất ra lớn”, điều này tiêu thụ lượng Token lớn. Qua cách diễn đạt của Zhitu, cũng xác nhận rằng các nhà phát triển dựa vào mô hình của họ để hỗ trợ mã hóa, dẫn đến tốc độ tiêu thụ Token tăng nhanh.
Từ “một vòng” sang “đa vòng của Agent”: Zhitu định vị GLM-5 là mô hình thế hệ mới hướng tới các kịch bản lập trình và Agent; ngày 12 tháng 2, MiniMax-WP(00100) cũng chính thức ra mắt mô hình lập trình hàng đầu mới nhất M2.5, được gọi là mô hình sản xuất cấp độ đầu tiên thiết kế nguyên bản cho kịch bản Agent. Việc so sánh trực tiếp hiệu suất lập trình và trí tuệ nhân tạo của M2.5 (Coding&Agentic) với Claude Opus4.6. Agent sẽ chủ động lập kế hoạch, truy xuất, thực thi, phản tư, gọi mô hình nhiều lần, và tiêu thụ Token theo từng bước.
Tăng cường độ suy luận: Nhiều “suy nghĩ sâu hơn, liên kết dài hơn” sẽ làm tăng rõ rệt lượng Token tiêu thụ trong đầu ra và các quá trình trung gian. Đối với nhà phát triển, điều này thường mang lại tỷ lệ thành công cao hơn và ít phải làm lại hơn, người dùng sẵn lòng “tiêu thụ nhiều Token hơn để đổi lấy hiệu quả”.
Điều này có nghĩa là Token không còn là “lưu lượng” với chi phí biên gần như bằng không của thời internet truyền thống, mà là “nhiên liệu” không thể thiếu trong các nhiệm vụ sản xuất.
Khuyến nghị đầu tư
Điện toán đám mây dần trở thành “bán tài nguyên”, trong khi các nhà sản xuất mô hình lớn biến thành “bán nhiên liệu Token + bán thành quả”. Việc tăng giá của Zhitu GLM Coding Plan phản ánh sự thay đổi trong logic định giá ngành: Khi tiêu thụ suy luận trở thành nguyên liệu sản xuất, các nhà mô hình có thể chuyển “khan hiếm sức mạnh tính toán” thành lợi nhuận gộp và dòng tiền thông qua phân tầng giá và các sản phẩm đăng ký. Các khuyến nghị theo dõi tiếp theo:
Các nhà cung cấp đám mây và hạ tầng tính toán: Chi tiêu CNTT do AI thúc đẩy và đầu tư hạ tầng vẫn trong chu kỳ tăng trưởng, các đám mây sẽ hưởng lợi từ sự gia tăng liên tục của sức mạnh GPU, lưu trữ và I/O mạng.
Các nhà sản xuất mô hình lớn: Khi họ có thể duy trì tỷ lệ giữ chân đăng ký và mở rộng vị thế doanh nghiệp trong các kịch bản có ROI cao như lập trình, Agent, quy trình doanh nghiệp, và có thể chuyển đổi “lượng sử dụng Token” thành giá trị giao hàng “tiết kiệm nhân lực, thời gian, giảm công sức”, thì họ có khả năng vượt qua chiến tranh giá và mở rộng thị trường.
Công cụ quản trị an toàn và phòng thủ runtime: Khi doanh nghiệp tích hợp AI vào quy trình làm việc, các rủi ro như rò rỉ dữ liệu, quyền hạn vượt quá sẽ thúc đẩy nhu cầu “nền tảng an toàn AI / nền tảng quản trị” trở thành thiết yếu.
Quan sát ngắn hạn về việc tăng giá và nhu cầu (lạm phát Token) mang lại cải thiện biên, theo dõi trung hạn về vị thế doanh nghiệp và tỷ lệ giữ chân đăng ký để mở rộng doanh thu gia hạn, và dài hạn ủng hộ việc phổ biến các công cụ quản trị mang lại thị trường mới cho “tường lửa AI”.
Rủi ro cảnh báo
Chuyển đổi công nghệ có tính không chắc chắn; cạnh tranh ngành ngày càng gay gắt.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Công ty Chứng khoán Quốc Liên Dân Sinh: Nhu cầu Token trong bối cảnh "lạm phát" Quan sát ngắn hạn về các nhà cung cấp mô hình lớn tăng giá và cải thiện biên nhờ nhu cầu
Ứng dụng Tài chính Zhitong được biết, Công ty Chứng khoán Liên Minh Minsheng đã phát hành báo cáo nghiên cứu cho rằng, điện toán đám mây dần trở thành “bán tài nguyên”, trong khi các nhà sản xuất mô hình lớn biến thành “bán Token làm nhiên liệu + bán thành quả”. Việc tăng giá của kế hoạch mã hóa GLM của Zhitu (02513) phản ánh sự thay đổi trong logic định giá ngành: Khi suy luận tiêu thụ trở thành nguyên liệu sản xuất, các nhà cung cấp mô hình có cơ hội chuyển “khan hiếm sức mạnh tính toán” thành lợi nhuận gộp và dòng tiền thông qua phân tầng giá và các sản phẩm đăng ký. Quan sát ngắn hạn về việc tăng giá và nhu cầu (lạm phát Token) mang lại cải thiện biên, theo dõi trung hạn về vị thế doanh nghiệp và tỷ lệ giữ chân đăng ký để mở rộng doanh thu gia hạn, và dài hạn ủng hộ việc phổ biến các công cụ quản trị mang lại thị trường mới cho “tường lửa AI”.
Quan điểm chính của Công ty Chứng khoán Liên Minh Minsheng như sau:
Sự kiện: Ngày 12 tháng 2, Zhitu chính thức thông báo trên kênh chính thức về việc tăng giá đăng ký kế hoạch mã hóa GLM, mức tăng “ít nhất 30%”. Trước đó, các nhà cung cấp đám mây quốc tế cũng đồng loạt tăng giá trong tháng này, như Google Cloud tăng giá tới 100% ở Bắc Mỹ, đồng thời cũng tăng giá tại châu Âu và châu Á; cùng lúc đó, AWS cũng tăng giá khoảng 15%. Nhìn chung, nhu cầu Token “lạm phát” không chỉ có lợi cho sức mạnh tính toán đám mây mà còn giúp các nhà sản xuất mô hình có quyền thương lượng.
Phá vỡ con đường miễn phí truyền thống của internet
Con đường điển hình của phần mềm internet truyền thống là dùng miễn phí để mở rộng người dùng, dựa vào “số lượng và thời gian người dùng” để có quyền thương lượng, sau đó kiếm lợi qua quảng cáo, đăng ký thành viên, dịch vụ gia tăng, hoa hồng giao dịch. Nguyên nhân nền tảng của miễn phí chính là chi phí biên cực thấp. Cụ thể, mỗi người dùng hoặc mỗi lần nhấp chuột đều có thể làm giảm chi phí nhờ hiệu ứng băng thông và lưu trữ, gần như về không.
Thời đại điện toán đám mây cũng từng xuất hiện mô hình “miễn phí/giá thấp rồi mở rộng”, nhưng đơn vị tính phí của đám mây nhanh chóng chuyển sang CPU/lưu trữ/băng thông/số yêu cầu, khách hàng đã quen với “tính phí theo lượng”. Đám mây có thể thu phí vì nó cung cấp các tài nguyên rõ ràng và các thỏa thuận cấp dịch vụ (SLA). Tuy nhiên, khi ngành vẫn còn trong “chiến tranh giá mô hình”, Zhitu đã xuất hiện tín hiệu tăng giá, điều này có nghĩa là “đơn vị đo lường” của thời đại mô hình lớn từ lưu lượng (DAU/thời gian) chuyển sang Token (tiêu thụ suy luận), và tiêu thụ Token ngày càng trở thành nhu cầu thiết yếu trong nhiều kịch bản.
Thay đổi trong thời đại mô hình lớn: Token trở thành “nguyên liệu sản xuất có thể đo lường”, không còn là “lưu lượng miễn phí”
Các mô hình lớn biến các dịch vụ như “đối thoại/viết mã/ tạo nội dung” vốn tưởng chừng do nhà cung cấp phần mềm cung cấp thành dịch vụ dựa vào sức mạnh tính toán trực tuyến. Đối với nhà sản xuất mô hình, mỗi lần phản hồi đều tiêu tốn GPU, bộ nhớ đồ họa, băng thông và điện năng; còn đối với người dùng, mỗi lần “để mô hình nghĩ thêm một chút, viết đoạn mã dài hơn, chạy một nhiệm vụ phức tạp hơn” đều tiêu thụ nhiều Token hơn, do đó Token tự nhiên trở thành đơn vị đo lường mới. Trước đó, Zhitu vì tăng trưởng người dùng dẫn đến căng thẳng tạm thời về sức mạnh tính toán, đã thực hiện “bán giới hạn” kế hoạch mã hóa, điều này tạo thành một chuỗi cung cầu điển hình: Nhu cầu tăng mạnh trong ngắn hạn → nguồn lực bị hạn chế cứng nhắc (dẫn đến giới hạn luồng/giới hạn số lượng) → tăng giá.
Khi xảy ra tắc nghẽn cao điểm và thiếu hụt nguồn lực, việc tăng giá là cơ chế để các nhà mô hình lọc nhu cầu, bảo vệ trải nghiệm người dùng tốt hơn so với “giới hạn luồng không phân biệt”. Hơn nữa, chi phí của các nhà cung cấp mô hình vẫn liên quan chặt chẽ đến cung GPU, tỷ lệ sử dụng, tối ưu suy luận; việc tăng giá/phân tầng giá hợp lý giúp các nhà mô hình thoát khỏi “lỗ lớn khi quy mô lớn hơn”, từ đó nâng cao lợi nhuận gộp và chất lượng dòng tiền.
Nhu cầu Token trong “lạm phát”
“Lạm phát Token” không phải là Token trở nên đắt hơn, mà là cấu trúc tiêu thụ Token theo thời gian và theo người dùng tăng lên mang tính cấu trúc. Các nguyên nhân chính khiến nhu cầu Token tăng cao gồm:
Từ “hỏi đáp” sang “làm việc”: Đến nay, người dùng không còn hài lòng với dạng trả lời đơn thuần, mà bắt đầu yêu cầu mô hình tái cấu trúc mã, chỉnh sửa tệp, tạo tài liệu, chạy thử nghiệm v.v. Trong các kịch bản lập trình, đặc trưng tự nhiên là “ngữ cảnh dài, nhiều vòng lặp, lượng xuất ra lớn”, điều này tiêu thụ lượng Token lớn. Qua cách diễn đạt của Zhitu, cũng xác nhận rằng các nhà phát triển dựa vào mô hình của họ để hỗ trợ mã hóa, dẫn đến tốc độ tiêu thụ Token tăng nhanh.
Từ “một vòng” sang “đa vòng của Agent”: Zhitu định vị GLM-5 là mô hình thế hệ mới hướng tới các kịch bản lập trình và Agent; ngày 12 tháng 2, MiniMax-WP(00100) cũng chính thức ra mắt mô hình lập trình hàng đầu mới nhất M2.5, được gọi là mô hình sản xuất cấp độ đầu tiên thiết kế nguyên bản cho kịch bản Agent. Việc so sánh trực tiếp hiệu suất lập trình và trí tuệ nhân tạo của M2.5 (Coding&Agentic) với Claude Opus4.6. Agent sẽ chủ động lập kế hoạch, truy xuất, thực thi, phản tư, gọi mô hình nhiều lần, và tiêu thụ Token theo từng bước.
Tăng cường độ suy luận: Nhiều “suy nghĩ sâu hơn, liên kết dài hơn” sẽ làm tăng rõ rệt lượng Token tiêu thụ trong đầu ra và các quá trình trung gian. Đối với nhà phát triển, điều này thường mang lại tỷ lệ thành công cao hơn và ít phải làm lại hơn, người dùng sẵn lòng “tiêu thụ nhiều Token hơn để đổi lấy hiệu quả”.
Điều này có nghĩa là Token không còn là “lưu lượng” với chi phí biên gần như bằng không của thời internet truyền thống, mà là “nhiên liệu” không thể thiếu trong các nhiệm vụ sản xuất.
Khuyến nghị đầu tư
Điện toán đám mây dần trở thành “bán tài nguyên”, trong khi các nhà sản xuất mô hình lớn biến thành “bán nhiên liệu Token + bán thành quả”. Việc tăng giá của Zhitu GLM Coding Plan phản ánh sự thay đổi trong logic định giá ngành: Khi tiêu thụ suy luận trở thành nguyên liệu sản xuất, các nhà mô hình có thể chuyển “khan hiếm sức mạnh tính toán” thành lợi nhuận gộp và dòng tiền thông qua phân tầng giá và các sản phẩm đăng ký. Các khuyến nghị theo dõi tiếp theo:
Các nhà cung cấp đám mây và hạ tầng tính toán: Chi tiêu CNTT do AI thúc đẩy và đầu tư hạ tầng vẫn trong chu kỳ tăng trưởng, các đám mây sẽ hưởng lợi từ sự gia tăng liên tục của sức mạnh GPU, lưu trữ và I/O mạng.
Các nhà sản xuất mô hình lớn: Khi họ có thể duy trì tỷ lệ giữ chân đăng ký và mở rộng vị thế doanh nghiệp trong các kịch bản có ROI cao như lập trình, Agent, quy trình doanh nghiệp, và có thể chuyển đổi “lượng sử dụng Token” thành giá trị giao hàng “tiết kiệm nhân lực, thời gian, giảm công sức”, thì họ có khả năng vượt qua chiến tranh giá và mở rộng thị trường.
Công cụ quản trị an toàn và phòng thủ runtime: Khi doanh nghiệp tích hợp AI vào quy trình làm việc, các rủi ro như rò rỉ dữ liệu, quyền hạn vượt quá sẽ thúc đẩy nhu cầu “nền tảng an toàn AI / nền tảng quản trị” trở thành thiết yếu.
Quan sát ngắn hạn về việc tăng giá và nhu cầu (lạm phát Token) mang lại cải thiện biên, theo dõi trung hạn về vị thế doanh nghiệp và tỷ lệ giữ chân đăng ký để mở rộng doanh thu gia hạn, và dài hạn ủng hộ việc phổ biến các công cụ quản trị mang lại thị trường mới cho “tường lửa AI”.
Rủi ro cảnh báo
Chuyển đổi công nghệ có tính không chắc chắn; cạnh tranh ngành ngày càng gay gắt.