Đang theo dõi bước đi mới nhất của NVIDIA trong lĩnh vực AI doanh nghiệp và điều đó đáng để chú ý. Họ vừa ra mắt Nemotron 3 Super—một mô hình 120 tỷ tham số được thiết kế đặc biệt cho các quy trình làm việc AI có tác nhân, và thời điểm này cho thấy điều gì đó về hướng dòng tiền thực sự đang chảy.



Điều khiến tôi chú ý là: vấn đề cốt lõi họ giải quyết thực ra khá cụ thể đối với cách hoạt động của hệ thống đa tác nhân trong sản xuất. Khi bạn vận hành nhiều tác nhân AI cần phối hợp, bạn nhanh chóng gặp phải giới hạn này. Mỗi tương tác của tác nhân làm mới toàn bộ lịch sử hội thoại, kết quả công cụ, chuỗi lý luận—tăng gấp 15 lần lượng token so với chatbot cơ bản. Điều này trở nên đắt đỏ khi vận hành quy mô doanh nghiệp. Nemotron 3 Super xử lý điều này với cửa sổ ngữ cảnh 1 triệu token, cho phép các tác nhân giữ toàn bộ trạng thái quy trình làm việc mà không cần xử lý lại liên tục.

Lựa chọn kiến trúc ở đây quan trọng hơn nhiều so với các thông số chính. Họ sử dụng thiết kế hỗn hợp các chuyên gia (hybrid mixture-of-experts) trong đó chỉ 12 tỷ tham số hoạt động trong quá trình suy luận, mặc dù tổng cộng có tới 120 tỷ. Những lợi ích về hiệu quả cộng hưởng—kết hợp dự đoán đa token—họ tuyên bố nhanh hơn 3 lần so với thế hệ trước. Trên phần cứng Blackwell, bạn sẽ thấy tốc độ tăng gấp 4 lần so với thế hệ cũ mà không giảm độ chính xác.

Điều thực sự đáng chú ý là danh sách các đơn vị đã áp dụng. Perplexity đã tích hợp ngay lập tức. CodeRabbit, Factory, và Greptile đang tích hợp vào các tác nhân lập trình AI của họ. Nhưng phần chơi công nghiệp nặng hơn mới thực sự thú vị—Siemens, Dassault Systèmes, và Cadence cho tự động hóa sản xuất và thiết kế. Palantir và Amdocs cho an ninh mạng và viễn thông. Đây không phải là hype, mà là các doanh nghiệp đang triển khai hệ thống tác nhân cho các quy trình làm việc thực tế.

Khả năng truy cập trên đám mây đang triển khai qua Google Cloud, Oracle, và sắp tới là AWS và Azure. Các nhà cung cấp suy luận như Fireworks AI và DeepInfra đã bắt đầu phục vụ mô hình này. Việc phân phối này quan trọng vì nó thể hiện sự tự tin vào nhu cầu duy trì lâu dài.

Một điểm nổi bật là NVIDIA đã mở mã nguồn mô hình này cùng trọng số và hơn 10 nghìn tỷ token dữ liệu huấn luyện. Đó là một nước đi chiến lược—bạn không chỉ bán mô hình, mà còn xây dựng hệ sinh thái nơi Blackwell trở thành phần cứng mặc định để chạy AI có tác nhân doanh nghiệp cấp cao. Mô hình này đứng đầu bảng xếp hạng hiệu quả phân tích nhân tạo, điều này xác thực kỹ thuật.

Đối với các nhà đầu tư theo dõi, Nemotron 3 Super ít liên quan đến mô hình cụ thể mà hơn hết là NVIDIA đang báo hiệu hướng đi của AI doanh nghiệp—đến các hệ thống tác nhân chuyên biệt đòi hỏi tính toán mạnh mẽ. Câu hỏi thực sự là liệu các triển khai này có duy trì nhu cầu Blackwell xuyên suốt năm 2026 hay không. Các dấu hiệu ban đầu cho thấy là có.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Gate Fun hot

    Xem thêm
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$0.1Người nắm giữ:0
    0.00%
  • Vốn hóa:$2.25KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.28KNgười nắm giữ:1
    0.00%
  • Vốn hóa:$2.3KNgười nắm giữ:2
    0.16%
  • Ghim