Văn Túy AI, mô hình LLM mã nguồn mở ‘Kimi-K2.6’ được công bố… so sánh trực tiếp với GPT-5.4

robot
Đang tạo bản tóm tắt

Công ty khởi nghiệp trí tuệ nhân tạo của Trung Quốc Moonshot AI đã công bố mô hình ngôn ngữ lớn (LLM) mã nguồn mở mới nhất “Kimi-K2.6”. Công ty cho biết, mô hình này dẫn đầu hoặc xếp sau nhẹ nhàng so với GPT-5.4 và Claude Opus 4.6 trong các bài kiểm tra tiêu chuẩn chính về trí tuệ nhân tạo.

Kimi-K2.6 là sản phẩm mới nhất trong dòng “Kimi” của Moonshot AI. Mô hình này được thiết kế không chỉ để xử lý văn bản mà còn có thể xử lý các dữ liệu đa phương tiện như hình ảnh. Moonshot AI đặc biệt nhấn mạnh vào hiệu quả và khả năng thực thi nhiệm vụ thực tế. Điều này có nghĩa là không chỉ nâng cao chất lượng câu trả lời mà còn tối ưu cấu trúc, cho phép sử dụng cùng một tài nguyên tính toán để thực hiện các nhiệm vụ phức tạp hơn.

Cấu trúc nâng cao hiệu suất với ít tài nguyên là yếu tố then chốt

Kimi-K2.6 sử dụng hàm kích hoạt gọi là “Swiglu”. Đây là một cấu trúc có thể nâng cao hiệu quả sử dụng phần cứng so với phương pháp truyền thống và phần nào đơn giản hóa quá trình huấn luyện mô hình. Phương pháp này cũng đã được áp dụng trong các mô hình mã nguồn mở như dòng Llama của Meta Platforms.

Mô hình nội bộ có 384 mạng “chuyên gia”. Tuy nhiên, không phải lúc nào tất cả các mạng này đều hoạt động cùng lúc mỗi khi người dùng nhập câu hỏi. Khi tạo phản hồi, chỉ có 8 chuyên gia được chọn lựa một cách có chọn lọc. Phương pháp “pha trộn chuyên gia” này chỉ kích hoạt phần cần thiết, giúp giảm lượng tính toán và gánh nặng hạ tầng.

Ngoài ra, còn tích hợp công nghệ “Chú ý tiềm năng đa đầu” (multi-head latent attention). Đây là một dạng cơ chế chú ý, giúp lọc thông tin quan trọng từ gợi ý một cách hiệu quả hơn. Nhờ việc nén dữ liệu thành dạng toán học nhẹ hơn, cấu trúc chú ý này yêu cầu phần cứng thấp hơn so với các cơ chế chú ý thông thường.

Nâng cao khả năng hiểu hình ảnh và hợp tác với các tác nhân thông minh

Kimi-K2.6 còn được trang bị bộ mã hóa hình ảnh có quy mô 4 tỷ tham số. Thiết bị này chuyển đổi hình ảnh thành dạng “nhúng” dễ hiểu cho mô hình. Nhờ đó, Kimi-K2.6 không chỉ xử lý đầu vào dạng câu mà còn có thể làm việc với bản phác thảo hoặc dữ liệu hình ảnh.

Theo Moonshot AI, mô hình này chỉ cần hướng dẫn đơn giản của người dùng và sơ đồ giao diện để tạo ra một trang web hoàn chỉnh. Đối với các nhiệm vụ phức tạp và tốn thời gian hơn, có thể huy động tối đa 300 tác nhân trí tuệ cùng hợp tác. Giải thích của công ty là các tác nhân này sẽ phân chia nhiệm vụ thành các bước nhỏ để xử lý song song, giúp tăng tốc độ so với thực thi theo trình tự.

Ngoài ra, còn có chức năng “Hợp tác nhóm” (group collaboration), cho phép thiết kế quy trình làm việc chung giữa con người và các tác nhân trí tuệ nhân tạo. Moonshot AI giải thích rằng, nhờ đó có thể phân chia công việc trong dự án cho người lao động và trí tuệ nhân tạo. Công ty bổ sung rằng, so với các thế hệ trước, hiệu suất của họ trong các nhiệm vụ lập trình khó như phát triển bằng Rust cũng đã được cải thiện.

Tự hào dẫn đầu trong đánh giá độ khó HLE-Full so với GPT-5.4

Moonshot AI cho biết, đã so sánh Kimi-K2.6 với GPT-5.4 và Claude Opus 4.6 trong hơn 20 bài kiểm tra tiêu chuẩn chính. Theo công ty, mô hình mới này đã vượt trội hoặc chỉ kém cạnh trong nhiều bài kiểm tra, với chênh lệch điểm số trong phạm vi vài phần trăm.

Đặc biệt, trong một trong những bài đánh giá khắt khe nhất là “HLE-Full”, Kimi-K2.6 đạt 54 điểm. Bài kiểm tra này gồm hơn 2.500 câu hỏi thuộc hơn 100 lĩnh vực học thuật khác nhau. Moonshot AI cho biết, trong cùng bài kiểm tra này, Claude Opus 4.6 đạt 53 điểm, GPT-5.4 đạt 52,1 điểm.

Việc ra mắt này cho thấy cuộc cạnh tranh trí tuệ nhân tạo mã nguồn mở đang ngày càng gay gắt. Trong khi các mô hình hàng đầu đóng kín vẫn chiếm lĩnh thị trường, thì ngày càng nhiều mô hình mã nguồn mở như Kimi-K2.6, nhấn mạnh cả hiệu quả lẫn khả năng tự động hóa nhiệm vụ, đang mở rộng sự lựa chọn cho doanh nghiệp và nhà phát triển.

Lưu ý của TP AI Bản tóm tắt này dựa trên mô hình ngôn ngữ của TokenPost.ai. Nội dung chính có thể bị bỏ qua hoặc có sự khác biệt với thực tế.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim