
腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时历时不足三个月。
Hy3 模型架构与开发背景
根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非异步启用全部参数,以降低计算需求。
上一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设定,超出此规模后增加参数的边际效益不再划算。
根据 Decrypt 报道,Hy3 的训练工作由腾讯首席人工智能科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。
关键基准测试数据
根据腾讯官方公告所披露的基准测试结果:
SWE-bench Verified(GitHub 真实代码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%
Terminal-Bench 2.0(命令行自动执行命令):Hy3 预览版 54.4%,Hy2 为 23.2%
BrowseComp(复杂网络搜索任务):Hy3 预览版 67.1%,Hy2 为 28.7%
WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%
清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分
2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分
部署平台与 API 定价
根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。
腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端对端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。
常见问题
腾讯 Hy3 预览版何时发布,可在哪些平台取得?
根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(周四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。
Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?
根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。
Hy3 预览版的 API 定价为何?
根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Sierra привлекла 950 млн долларов, оценка — 15,8 млрд: Брет Тейлор во главе OpenAI в роли председателя борется за лидерство в сфере AI-обслуживания клиентов
Компания Sierra, сооснователем которой является Bret Taylor, объявила о завершении раунда Series E на 950 млн долларов при оценке в 15,8 млрд долларов; инвестиции возглавили Tiger Global и GV. За 8 сезонов компания достигла 150 млн ARR, а проникновение в Fortune 50 превысило 40%. Платформа позиционируется как вертикальный сервис корпоративной поддержки, основанный на AI-agent, и предлагает готовые рабочие процессы. Taylor также является председателем совета директоров OpenAI, а вопросы управления и раскрытия интересов находятся в центре внимания.
ChainNewsAbmedia2м назад
OpenAI переработала WebRTC для голосового стека: 900 млн активных пользователей в неделю, Relay на Go в качестве ключевого компонента
OpenAI опубликовала тонкий relay, написанный на Go, и архитектуру с централизованным transceiver, чтобы перестроить медиа-слой WebRTC и поддержать голосовые сервисы для 900 миллионов активных пользователей в неделю. Соединения с высокой плотностью состояния концентрируются на transceiver, а relay служит безсостояной плоскостью данных; это решает узкие места вроде схемы «один порт — одна сессия», владельцев ICE/DTLS и низкой задержки первого хопа, а также упрощает горизонтальное масштабирование. Далее будет наблюдаться, включая вопросы о том, будет ли проект с открытым исходным кодом, масштабе и ценообразовании Realtime API, а также о действиях конкурентов.
ChainNewsAbmedia4м назад
Gemini API добавляет Webhooks: Google устраняет боль при длительных задачах с постоянным опросом, Batch/Veo теперь могут отправляться в реальном времени
Google Gemini API от 4 мая представила Webhooks: при завершении длительной задачи автоматически отправляют результат по callback URL, заменяя опрос (polling). Это снижает расход ресурсов и задержку, а также упрощает код. Поддерживается для Batch API, Veo2 и long context-инференса; особенно подходит для serverless. По сравнению с OpenAI, где больше используется SSE, и с Anthropic, которые всё ещё применяют опрос, Google делает упор на инфраструктуру для разработчиков. В будущем стоит ожидать внимания к механизмам безопасности и к расширению моделей. Для разработчиков на Тайване — стоит подключить это сразу: интеграция может заметно снизить расход quota и нагрузку на систему.
ChainNewsAbmedia6м назад
Krutrim переходит к облачным AI-услугам 5 мая, публикует первый прибыльный результат, поскольку выручка за FY26 достигает 31,6 млн $
Согласно Press Trust of India, индийская компания в сфере ИИ Krutrim 5 мая переориентировалась на предоставление отечественных облачных AI-услуг, приостановив разработки чипов и перенаправив капитал и таланты на облачную инфраструктуру.
Компания сообщила о выручке за FY26 на уровне примерно 3 миллиарда рупий (31,6 млн долларов США)
GateNews59м назад
Haun Ventures закрывает фонд на 1 миллиард долларов 5 мая, нацеливаясь на стартапы в сфере крипто и ИИ
По данным Cointelegraph, Haun Ventures завершила привлечение $1 млрд для нового фонда 5 мая; капитал планируется распределять поровну между инвестициями на ранней и поздней стадиях. Фонд будет сосредоточен на стартапах в сфере криптовалют, искусственного интеллекта и альтернативных
GateNews1ч назад
Anthropic и OpenAI инвестировали более 1,1 млрд долларов в розничную торговлю криптовалютами с начала 2026 года
По данным Bloomberg, розничные инвесторы вложили приблизительно 1,13 миллиарда долларов в маржинальную торговлю на деривативах частной AI-компании с начала 2026 года. Криптоплатформы Ventuals и PreStocks обеспечивают круглосуточную торговлю бумагами компаний, включая Anthropic, OpenAI и SpaceX, не предоставляя прямой доступ к инвестициям
GateNews1ч назад