Thời kỳ Agent đơn chính thức kết thúc: Một người không thắng nổi thì cứ lên 300 người

Đại lý cuối cùng có thể nói lời chia tay với “độc lập một mình”, đón chờ bước tiến hóa giai đoạn hai chưa?

Ngay trong sáng nay, mặt tối của mặt trăng chính thức ra mắt và mở mã nguồn dòng sản phẩm flagship mới nhất của Kimi — Kimi K2.6, chỉ chưa đầy 3 tháng sau khi phiên bản trước đó K2.5 ra mắt. Sau khi phát hành, độ nóng rất cao, lượng xem trên trang chính đã đạt 4 triệu.

Hiện tại, Agent trong xử lý các dự án phức tạp thường còn hạn chế, dù chúng thành thạo hoàn thành các nhiệm vụ riêng lẻ, nhưng khả năng hợp tác nhóm còn thiếu sót. Làm thế nào để vượt qua giới hạn này, trở thành mục tiêu cốt lõi của Kimi K2.6.

Phiên bản mới khám phá cách kích thích khả năng hợp tác nhóm của Agent: tăng cường hơn nữa chức năng Agent Swarm (Bầy đàn Agent) mà K2.5 đã giới thiệu, qua việc thích nghi với các framework như OpenClaw để nâng cao khả năng chủ động của Agent, cùng với Claw Group (Nhóm Claw) mới, bổ sung khả năng tổ chức hợp tác. Hệ thống toàn bộ khả năng này tích hợp hệ thống, xây dựng một hệ thống AI gần hơn với nhóm người thật.

Để đạt được tất cả điều này, mô hình nền phải đủ mạnh mẽ. Lần này, Kimi K2.6 có tiến bộ rõ rệt về khả năng Agent chung, mã, hiểu hình ảnh. Các bài kiểm tra như Humanity’s Last Exam, SWE-Bench Pro gần thực tế phát triển, và DeepSearchQA để kiểm tra khả năng truy vấn sâu của Agent, K2.6 đều dẫn đầu đối thủ cạnh tranh.

Ngay cả khi so sánh K2.6 với các mô hình kín nguồn như GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro, nó cũng hoàn toàn không thua kém, thậm chí còn có một số chỉ số còn vượt trội.

Nền tảng đánh giá mô hình lớn Artificial Analysis đưa ra kết quả mới nhất, “Kimi K2.6 trở thành vua mới của các mô hình mã nguồn mở”!

Sau khi ra mắt Kimi K2.6, nền tảng tổng hợp mô hình lớn OpenRouter đã đưa ra đánh giá cao, cho rằng mặt tối của mặt trăng thế hệ mới này tập trung vào khả năng lập trình theo chuỗi thời gian dài, dành riêng cho các tình huống Agent cần thực thi liên tục. So với các chatbot truyền thống, nó giống như một “kỹ sư hệ thống”, có thể phân chia các nhiệm vụ phức tạp thành từng bước, thực thi từng phần, đồng thời liên tục tối ưu trong quá trình.

Có người dùng cảm thán, mô hình flagship Kimi này quá mạnh, đã có thể so kè với GPT-5.4 về viết mã, giá lại thấp hơn Opus 4.7 rất nhiều, còn mở mã nguồn và miễn phí sử dụng. Hiện nay, cứ vài tháng lại xuất hiện một mô hình mã nguồn mở mới gần như bắt kịp GPT và Claude kín nguồn. “Cảm giác như mô hình mã nguồn mở thật sự đã bắt kịp rồi, và tất cả đều do Trung Quốc thúc đẩy nhịp độ.”

12 giờ liên tục, 300 Agent cùng làm việc

Đây có phải là hình thái tối thượng của Agent?

Lần này, Kimi K2.6 tiếp tục phát huy trong lĩnh vực lập trình. Vài ngày trước, cộng đồng quốc tế còn bàn tán sôi nổi về bản xem trước Kimi K2.6-Code-Preview ra mắt âm thầm, và đang rất mong chờ phiên bản chính thức của K2.6.

Là mô hình mạnh nhất từ trước đến nay về khả năng lập trình của dòng Kimi, Kimi K2.6 đã đạt bước đột phá trong khả năng mã hóa dài hạn, giúp thúc đẩy tự động hóa phát triển phần mềm tiến sâu hơn vào các giai đoạn kỹ thuật.

Ví dụ, Kimi K2.6 có thể tải xuống thành công Qwen3.5-0.8B trên Mac và chạy thử. Nó không theo stack công nghệ phổ biến, mà dùng ngôn ngữ Zig ít người biết để viết lại quy trình suy luận và liên tục tối ưu, thể hiện khả năng tổng quát của mô hình.

Toàn bộ quá trình kéo dài hơn 12 giờ, trong đó gọi công cụ hơn 4000 lần, qua 14 vòng lặp chỉnh sửa. Nhờ điều chỉnh tham số và tái cấu trúc liên tục, tốc độ suy luận ban đầu khoảng 15 tokens/giây đã tăng lên khoảng 193 tokens/giây, nhanh hơn ứng dụng chat mô hình lớn chạy locally LM Studio khoảng 20%.

Tiếp theo, trọng tâm của lần nâng cấp Kimi K2.6 này là duy trì và nâng cao khả năng hợp tác của nhóm Agent. Nói đơn giản, chức năng này giúp “làm rõ cách Agent làm việc cùng nhau”.

Hiện tại, mức độ nào có thể đạt được? K2.6 tự động phân chia một nhiệm vụ phức tạp, phân công cho các Agent có chuyên môn khác nhau, để xử lý các bước tìm kiếm, nghiên cứu sâu, phân tích tài liệu, viết bài dài, rồi ghép kết quả để tiếp tục tiến trình.

Trong cơ chế này, một lần chạy có thể hoàn thành toàn bộ chuỗi: từ dữ liệu gốc, nội dung web, đến PPT và bảng tính, tất cả tự động tạo ra, không cần chuyển đổi công cụ hay can thiệp thủ công.

Song song đó, kiến trúc nền của nhóm Agent cũng được mở rộng, tối đa có thể điều phối 300 Agent con cùng lúc, hoàn thành 4000 bước hợp tác, khả năng song song đã đạt một cấp độ mới. Khi quy mô mở rộng, vai trò của AI cũng thay đổi: bắt đầu tiếp quản toàn bộ quy trình và trực tiếp đưa ra kết quả hệ thống.

Nhóm Agent đã phân tích và tái sử dụng một bài báo vật lý thiên văn có dữ liệu hình ảnh mật độ cao, tạo ra khoảng 7000 từ báo cáo nghiên cứu, 20.000 dữ liệu và 14 biểu đồ.

Để AI trở thành một nhân viên cyber hoạt động liên tục 24/7, không cần can thiệp thủ công, Kimi K2.6 đã thích nghi sâu hơn với các framework như OpenClaw, Hermes Agent.

Với mục tiêu này, Kimi K2.6 còn đẩy mạnh khả năng tự thực thi của mô hình: độ chính xác của API, độ ổn định khi chạy lâu, và an toàn khi thực hiện các nhiệm vụ nghiên cứu phức tạp đều thể hiện rõ nét.

Trong lĩnh vực Vibe Coding, thiết kế website của Kimi K2.6 còn ấn tượng hơn. Các trang web do K2.6 tạo ra, đặc biệt là phần đầu trang, có sức hút thị giác rất lớn, phong cách nhất quán. Thêm vào đó, các yếu tố tương tác, hiệu ứng cuộn trang và các chi tiết khác giúp giữ chân người dùng lâu hơn.

Ngoài phần frontend, lần này Kimi K2.6 còn mang đến bất ngờ cho các lập trình viên backend, khi ra mắt chức năng đăng nhập tài khoản Kimi và thu thập thông tin biểu mẫu. Bạn có thể dùng nó để tạo trang đăng ký sự kiện, dễ dàng xem thông tin đăng ký phía backend. Như vậy, kết nối frontend và backend trở nên mượt mà hơn.

Hiện tại, Kimi K2.6 đã trở thành mô hình mặc định cho phiên bản web, ứng dụng và trợ lý lập trình Kimi Code, hãy thử ngay đi.

Thử nghiệm thực tế, gây ấn tượng toàn diện

Không dài dòng, chúng ta sẽ trực tiếp thử nghiệm một số ví dụ để xem hiệu quả ra sao.

Phần thử đầu tiên chọn “K2.6 Agent”, từ hai góc độ thực dụng và thẩm mỹ, xem nó có thể tạo ra hiệu ứng front-end đủ bắt mắt không.

Có ai thích Persona 5 không?

Đây là phong cách nghệ thuật rất đặc trưng, là một cuộc tấn công thị giác mang vẻ ngoài truyện tranh. Nó dùng thiết kế không theo quy chuẩn, thách thức thẩm mỹ truyền thống, đưa chủ đề “phản kháng sự nhàm chán của xã hội” vào từng pixel và đường nét. Hoà quyện hoàn hảo giữa thiết kế phẳng và không gian 3D, biểu tượng truyện tranh và biểu đạt thị giác hòa quyện sâu sắc.

Nếu chúng ta mở một quán bar phong cách P5, trang chủ sẽ trông thế nào?

Chúng tôi phát hiện, trong quá trình xây dựng trang web front-end, Kimi K2.6 đã thực hiện kiểm tra kỹ lưỡng, thậm chí mô phỏng click:

Ngoài ra, chúng tôi còn làm một “món quà nhỏ”, để Kimi K2.6 tham khảo video mở đầu của Persona 5 Royal, không cung cấp bất kỳ素材 nào, tự tạo một đoạn hoạt hình nhỏ.

Chúng tôi tiếp tục đặt yêu cầu, lần này là phong cách front-end khác: “Thiết kế trang chủ ấn tượng cho nền tảng thương mại điện tử, gồm thanh điều hướng trên cùng có logo thương hiệu, ô tìm kiếm, giỏ hàng, nút đăng nhập / đăng ký; phần banner chính (Hero Section) thể hiện các chương trình khuyến mãi chính, sản phẩm bán chạy hoặc ưu đãi theo mùa; dưới Hero Section là các đề xuất sản phẩm hoặc danh mục; ở cuối trang hoặc khu vực nổi bật hiển thị đánh giá của khách hàng về các sản phẩm nổi bật.”

Chỉ một lần tạo ra, đã hoàn thiện trang chủ với độ hoàn thiện cực cao. Dù còn vài lỗi nhỏ, nhưng chúng tôi tin rằng qua một lần chỉnh sửa, chúng sẽ được sửa hết, không làm giảm giá trị tổng thể.

Chúng tôi tiếp tục thử nghiệm khả năng nhóm Agent, tạo brochure cho “Báo cáo Chỉ số Trí tuệ Nhân tạo 2026” của Đại học Stanford, yêu cầu nó xuất ra trang web, bảng và PPT, hoàn toàn không cung cấp thêm thông tin hay tài liệu nào, để kiểm tra khả năng viết chung của các Agent.

Chúng tôi nhận thấy, mỗi Agent đều có thẻ tên, mô tả chức năng và giới thiệu riêng. Khi dùng nhóm Agent, bạn thực sự như một CEO điều phối toàn bộ nhân lực, biết rõ năng lực từng người, lập tức tạo ra một nhóm làm việc, tự động thực hiện nhiệm vụ. Chỉ thiếu ghi “đáng tin cậy” trên thẻ tên thôi.

Cuối cùng, tất cả nội dung chúng tôi cần đều đã được xuất ra, trang web sáng bóng, PPT bố cục hợp lý, và bảng dữ liệu nghiêm túc.

Tương lai hợp tác đa Agent đã đến?

Chuỗi thử nghiệm trên cho thấy sức mạnh của Kimi K2.6 như một “mẫu nền” trong thời đại Agent.

Trong bối cảnh “cơn sốt tôm hùm” do OpenClaw khơi mào vẫn còn nóng, nhóm Claw mới ra mắt đã chỉ rõ một con đường rõ ràng cho sự tiến bộ của các Agent trong giai đoạn tiếp theo.

Hiện tại, Claw nhóm đã mở thử nghiệm trong phạm vi nhỏ.

Chức năng này đánh dấu một kỷ nguyên mới của hợp tác AI. Bạn có thể kết nối các Agent chạy tại máy cục bộ, điện thoại hoặc đám mây, mỗi cái mang theo công cụ, kỹ năng và trí nhớ, cùng nhau thúc đẩy nhiệm vụ trong một “nhóm”.

Trong đó, K2.6 như một người điều phối: ai giỏi truy vấn, ai phụ trách phân tích, ai tạo nội dung, nó sẽ phân chia theo khả năng. Nếu một bước bị kẹt, nó cũng có thể phát hiện kịp thời, phân lại nhiệm vụ, đổi người đảm nhận, để quy trình tiếp tục.

Hãy tưởng tượng, khi bạn cần chuẩn bị một báo cáo phức tạp hoặc phát triển một dự án đa tầng, các Agent trong Claw nhóm sẽ như một đội ngũ chuyên nghiệp, thảo luận, phối hợp, điều chỉnh trong nhóm chat, cuối cùng mang lại cho bạn một kết quả chính xác, đầy đủ.

Sáng kiến này không chỉ phá vỡ mô hình thực thi của các Agent cá thể truyền thống, mà còn thúc đẩy tổ chức trí tuệ tiến lên. Sự xuất hiện của nó khiến “nhiều AI cùng làm việc” trở nên gần hơn với thực tế.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim