Tencent phát hành mã nguồn mở Hy3 phiên bản xem trước, bộ chuẩn kiểm thử hiệu năng mã nguồn tăng 40% so với phiên bản trước

MarketWhisper

騰訊開源Hy3預覽版

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时不足三个月。

Hy3 模型架构与开发背景

根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非同步启用全部参数,以降低计算需求。

前一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设置,超出此规模后增加参数的边际效益不再划算。

根据 Decrypt 报道,Hy3 的训练工作由腾讯首席人工智慧科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。

关键基准测试数据

根据腾讯官方公告所披露的基准测试结果:

SWE-bench Verified(GitHub 真实程式码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%

Terminal-Bench 2.0(命令列自行主任务执行):Hy3 预览版 54.4%,Hy2 为 23.2%

BrowseComp(复杂网络搜寻任务):Hy3 预览版 67.1%,Hy2 为 28.7%

WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%

清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分

2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分

部署平台与 API 定价

根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端到端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。

常见问题

腾讯 Hy3 预览版何时发布,可在哪些平台取得?

根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(星期四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。

Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?

根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 预览版的 API 定价为何?

根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Cựu kỹ sư Seed của ByteDance: Lượt lặp AI của ByteDance mất sáu tháng so với ba tháng của Google

Tin tức Cổng, ngày 24 tháng 4 — Zhang Chi, cựu kỹ sư tại đội Seed của ByteDance và hiện là trợ giảng tại Đại học Bắc Kinh, đã tiết lộ trên podcast "Into Asia" rằng ByteDance cần khoảng sáu tháng để hoàn thành một chu kỳ đầy đủ huấn luyện mô hình ngôn ngữ lớn (pretraining

GateNews13phút trước

Kỹ sư OpenAI Clive Chan Thách thức Khuyến nghị Phần cứng của V4, Trích dẫn Lỗi và Tính Mơ hồ so với V3

Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là "đáng ngạc nhiên là tầm thường và dễ gây lỗi" so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A

GateNews45phút trước

Naver Ra Mắt Bản Beta AI Tab Khi Google Gemini Bước Vào Thị Trường Tìm Kiếm Tại Hàn Quốc

Tin tức Cổng, ngày 24 tháng 4 — Naver đã công bố việc bắt đầu thử nghiệm beta kín cho AI Tab, tính năng tìm kiếm hội thoại mới của hãng, sau khi Google ra mắt Gemini trên Chrome tại Hàn Quốc. AI Tab sẽ xuất hiện cùng với các tab tìm kiếm hiện có của Naver, cung cấp cho người dùng một không gian riêng cho các truy vấn mang tính hội thoại

GateNews57phút trước

Ấn Độ Tuyển dụng Kỹ sư AI Bùng nổ 59,5%, Mở rộng ra Ngoài Các Trung tâm Công nghệ

Báo cáo Thị trường Lao động AI của LinkedIn năm 2026, được phát hành vào ngày 24 tháng 4, cho thấy việc tuyển dụng kỹ sư AI tại Ấn Độ đã tăng 59,5% so với cùng kỳ năm trước, đánh dấu tốc độ nhanh nhất trong số các thị trường được nền tảng này nghiên cứu. Sự tăng trưởng được thúc đẩy bởi nhu cầu lan rộng vượt ra ngoài các trung tâm công nghệ đã được thiết lập. Các thành phố bao gồm

CryptoFrontier1giờ trước

Ngân hàng Commonwealth Cắt Giảm 120 Việc Làm Giữa Đợt Mở Rộng AI

Ngân hàng Commonwealth Bank of Australia thông báo họ sẽ cắt giảm khoảng 120 việc làm khi ngân hàng lớn nhất của quốc gia này rà soát các vị trí và mở rộng việc sử dụng trí tuệ nhân tạo, theo Bloomberg. Các đợt cắt giảm bao gồm 43 vị trí tại Bankwest ở Tây Úc, với sáu vị trí bị ảnh hưởng bởi tự động hóa. Điều này là

CryptoFrontier1giờ trước

Cursor vạch ra lý do huấn luyện XAI: năng lực tính toán bị kẹt, SpaceX nắm riêng quyền chọn mua trị giá 60 tỷ USD

Anysphere thông báo rằng Cursor sẽ cùng xAI sử dụng hạ tầng Colossus để huấn luyện mô hình mới nhằm vượt qua nút thắt về năng lực tính toán; SpaceX đưa ra quyền chọn mua lại trị giá 60 tỷ USD (trong vòng 2026 có thể mua lại toàn bộ), nếu không thì sẽ thanh toán khoảng 10 tỷ USD như khoản bồi thường hợp tác. Hai giao dịch được tiến hành đồng thời, định hình ai có thể huấn luyện Cursor và ai có thể mua lại Cursor; Cursor vẫn cho phép nhiều backend mô hình, nhưng về dài hạn sẽ phụ thuộc vào việc SpaceX có thực hiện quyền mua lại hay không.

ChainNewsAbmedia1giờ trước
Bình luận
0/400
Không có bình luận