Mô hình mới Xiaomi MiMo 2.5 Pro AI có thể nhìn, nghe và hành động—Tất cả trong một mô hình

###Tóm tắt ngắn gọn

  • Xiaomi giới thiệu MiMo-V2.5 và V2.5-Pro, kết hợp khả năng xử lý văn bản, hình ảnh, âm thanh và video trong một mô hình AI đa phương thức duy nhất.
  • Phiên bản Pro cạnh tranh với các mô hình tiên phong hàng đầu về chuẩn mã hóa và đánh giá tác nhân, đồng thời cải thiện đáng kể hiệu quả token và chi phí.
  • Các mô hình mới đánh dấu bước tiến nhanh của Xiaomi trong lĩnh vực AI, với kế hoạch mã nguồn mở và các vòng lặp phát triển mạnh mẽ sau khi được đón nhận rộng rãi trên các nền tảng như OpenRouter.

Xiaomi vừa ra mắt một dòng mô hình AI mới. Một lần nữa. Vài tuần trước, công ty đã giới thiệu MiMo-V2-Pro—một mô hình có hàng nghìn tỷ tham số đã âm thầm lưu hành trên OpenRouter dưới tên gọi “Hunter Alpha” trước khi Xiaomi tiết lộ danh tính. Nó từ trạng thái ẩn danh trở thành hàng đầu chỉ trong một đêm. Chúng tôi đã thử nghiệm và thấy ấn tượng. Giờ đây Xiaomi trở lại với MiMo-V2.5 và MiMo-V2.5-Pro, một dòng hai mô hình bổ sung một tính năng mà thế hệ trước chưa từng có trong một gói duy nhất: mắt, tai, và khả năng xử lý video. Ôi, và công ty dự định sẽ mở mã nguồn các mô hình này trong tương lai gần.

V2-Pro chỉ xử lý văn bản và mã. Khả năng đa phương thức tồn tại trong mô hình anh em của nó, MiMo-V2-Omni, nhưng đó là một sản phẩm riêng với điểm chuẩn thấp hơn. MiMo-V2.5 gộp tất cả vào một mô hình—nhanh hơn, có khả năng hơn, và tích hợp hiểu hình ảnh, video, âm thanh từ đầu. Điều này quan trọng hơn nhiều so với những gì có thể nghe qua đối với người dùng thông thường. Ví dụ, bây giờ bạn có thể tải lên hình ảnh tủ lạnh của mình và yêu cầu nó đề xuất các công thức nấu ăn tối. Thả vào một video hướng dẫn và nhận tóm tắt từng bước. Ghi lại cuộc họp và để nó rút ra các hành động cần làm. Tất cả trong một nơi, không cần phải dùng nhiều công cụ và mô hình riêng biệt với các chiến lược giá khác nhau. Xiaomi tuyên bố MiMo-V2.5-Pro thể hiện “bước nhảy lớn so với MiMo-V2-Pro về khả năng tác nhân tổng thể, kỹ thuật phần mềm phức tạp, và các nhiệm vụ dài hạn,” và nói rằng nó hiện phù hợp với các mô hình hàng đầu như Claude Opus 4.6 và GPT-5.4 trên hầu hết các chuẩn mã hóa và đánh giá tác nhân. Các số liệu phần lớn ủng hộ điều đó—mặc dù vẫn còn một số khoảng cách trên các nhiệm vụ lý luận khó hơn. 

Các mô hình cơ bản và pro phục vụ các mục đích khác nhau. MiMo-V2.5-Pro là mô hình nặng. Xiaomi nói rằng nó có thể “hoàn thành tự động các nhiệm vụ chuyên nghiệp liên quan đến hơn 1.000 lượt gọi công cụ, công việc mà các chuyên gia mất nhiều ngày.” Điều này dành cho các nhà phát triển chạy các quy trình tự động phức tạp, nhiều bước. Nó hoạt động ở mức 60–80 token mỗi giây và có giá 1,00 đô la đầu vào / 3,00 đô la đầu ra trên mỗi triệu token. MiMo-V2.5 là phiên bản dùng hàng ngày. Nhanh hơn (100–150 token mỗi giây), rẻ hơn ($0.40 đầu vào / $2.00 đầu ra), và hỗ trợ tất cả các phương thức—hình ảnh, âm thanh, và video mà tier chỉ dành cho Pro bỏ qua. Cả hai mô hình đều có cửa sổ ngữ cảnh 1 triệu token, nghĩa là chúng có thể giữ khoảng 750.000 từ trong một cuộc trò chuyện duy nhất. Trên SWE-bench Pro—chuẩn mã hóa nơi các mô hình sửa lỗi thực trong các mã nguồn startup thực, điểm số theo tỷ lệ thành công trên 100—MiMo-V2.5-Pro giải quyết 57,2% các nhiệm vụ. Đó gần như đứng đầu trong lĩnh vực; mô hình trung bình chỉ đạt khoảng 25%. Câu chuyện tương tự trên τ3-bench và ClawEval, nơi nó xếp gần Claude Opus 4.6 và GPT-5.4 trong vài điểm số. Khoảng cách lớn hơn xuất hiện trên Humanity’s Last Exam, một thử thách gồm các bài toán cấp cao trong hàng chục lĩnh vực học thuật: MiMo đạt 48,0% so với GPT-5.4 là 58,7%—một chênh lệch 10 điểm khó bù đắp. Điểm nổi bật thực sự của nó là hiệu quả token. Xiaomi nói rằng MiMo-V2.5-Pro sử dụng ít hơn 42% token so với Kimi K2.6 với cùng điểm chuẩn, và MiMo-V2.5 sử dụng gần một nửa số token của Muse Spark cho kết quả tương tự. Đối với những ai vận hành quy mô lớn—nhà phát triển xử lý hàng nghìn yêu cầu hàng ngày—sự khác biệt này là tiền thật. Trong các nhiệm vụ đa phương thức, điểm số của MiMo-V2.5 cho kết quả ngang bằng với GPT/5.4 và Gemini 3.1 Pro, và khá gần với tiêu chuẩn Opus 4.6.

Từ tháng 12 năm 2025, Xiaomi đã hoàn thành ba đợt ra mắt mô hình lớn: Đầu tiên, ra mắt MiMo-V2-Flash hiệu quả, sau đó là bộ ba V2-Pro/Omni/TTS vào tháng 3, và hôm nay là dòng V2.5. Công ty đã cam kết đầu tư ít nhất 8,7 tỷ đô la vào AI trong ba năm tới, được CEO Lei Jun công bố ngay ngày sau khi V2-Pro ra mắt—và chu kỳ phát hành này cho thấy ngân sách đã bắt đầu chuyển động. Bối cảnh cũng giúp giải thích tốc độ. Theo Digital Applied, tính đến đầu tháng 4, các mô hình của Xiaomi chiếm khoảng 21% tổng lưu lượng truy cập trên OpenRouter—tăng hơn 42% trong 7 ngày qua. Khi mô hình trước đó của bạn trở thành một trong những mô hình cạnh tranh nhất trên nền tảng định tuyến AI lớn nhất thế giới, bạn có cả nguồn lực lẫn áp lực để phát triển nhanh.

Điều này có thể do sự bùng nổ của công cụ AI tác nhân Hermes và mối quan hệ hợp tác của nó với Xiaomi, cung cấp cho người dùng quyền truy cập miễn phí vào MiMo v2 Pro trong một thời gian giới hạn. Thời gian đó đã kết thúc, nhưng sự phấn khích đủ để đưa Xiaomi vào sân chơi.

Cảm ơn bạn đã yêu thích ❤️❤️ https://t.co/mA1WV1GAia

— Xiaomi MiMo (@XiaomiMiMo) 11 tháng 4, 2026

Những ai muốn dùng Hermes miễn phí bây giờ có thể thử phiên bản Flash Step 3.5 mới với API Nous hoặc dùng OpenRouter với các mô hình miễn phí nhưng giới hạn hơn. Giá kế hoạch token cũng đã được cập nhật. MiMo-V2.5 hoạt động với tỷ lệ tín dụng 1x; MiMo-V2.5-Pro là 2x. Xiaomi không còn tính phí nhân hệ số cho việc sử dụng toàn bộ cửa sổ ngữ cảnh 1 triệu token nữa, giúp phân tích tài liệu dài rẻ hơn rõ rệt. Người dùng hiện tại cũng được reset toàn bộ tín dụng như một phần thưởng ra mắt. Xiaomi cho biết mô hình đã có sẵn trong AI Studio của họ. Chúng tôi đã cố truy cập ngay sau khi ra mắt—không thành công. Tuy nhiên, nó đã hoạt động trực tiếp qua API Xiaomi MiMo, nơi phần lớn các nhà phát triển sẽ sử dụng thực tế. Công ty nói rằng họ đang đào tạo thế hệ tiếp theo, với “khả năng lý luận sâu hơn, tích hợp công cụ chặt chẽ hơn, và nền tảng thực tế phong phú hơn.” Với tốc độ Xiaomi tiến hành, thông báo đó có thể đến gần hơn bạn nghĩ.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim