Tencent merilis Hy3 versi pratinjau sumber terbuka, tolok ukur pengujian kode meningkat 40% dibanding pendahulunya

MarketWhisper

騰訊開源Hy3預覽版

Tencent resmi merilis model bahasa besar Hy3 versi pratinjau open-source pada 23 April di platform GitHub, Hugging Face, dan ModelScope, sekaligus menyediakan layanan API berbayar melalui Tencent Cloud. Menurut laporan Decrypt pada 24 April, Hy3 versi pratinjau memulai pelatihan pada akhir Januari, dan pada tanggal rilis belum sampai tiga bulan.

Arsitektur Model Hy3 dan Latar Belakang Pengembangan

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau adalah arsitektur mixture of experts (MoE): mengarahkan setiap kueri ke kumpulan sub-jaringan pakar yang ditentukan untuk pemrosesan, alih-alih mengaktifkan semua parameter secara asinkron, guna mengurangi kebutuhan komputasi.

Jumlah paramater pada model unggulan generasi sebelumnya Hy2 lebih dari 4.000 miliar. Pernyataan resmi Tencent menyebutkan bahwa 2.950 miliar adalah konfigurasi dengan optimasi terbaik untuk efisiensi inferensi; setelah melewati skala tersebut, manfaat marjinal dari penambahan parameter tidak lagi sebanding.

Menurut laporan Decrypt, pekerjaan pelatihan Hy3 dipimpin oleh Yao Shunyu (姚顺宇), ilmuwan utama kecerdasan buatan di Tencent. Setelah rekonstruksi ulang infrastruktur dasar untuk tumpukan pelatihan pra-pelatihan dan reinforcement learning selesai pada Februari 2026, pelatihan Hy3 kemudian dimulai secara resmi.

Data Pengujian Tolok Ukur Utama

Berdasarkan hasil pengujian tolok ukur yang diungkapkan oleh pengumuman resmi Tencent:

SWE-bench Verified(perbaikan error kode program nyata GitHub):Hy3 versi pratinjau 74,4%, Hy2 53,0%;pada periode yang sama, GLM-5 77,8%, Kimi-K2.5 76,8%, Claude Opus 4,6 80,8%

Terminal-Bench 2.0(eksekusi tugas mandiri dari baris perintah):Hy3 versi pratinjau 54,4%, Hy2 23,2%

BrowseComp(tugas pencarian web yang kompleks):Hy3 versi pratinjau 67,1%, Hy2 28,7%

WideSearch:Hy3 versi pratinjau 70,2%, lebih tinggi daripada GLM-5 dan Kimi-K2.5, lebih rendah daripada Claude Opus 4,6 yang 77,2%

Ujian kualifikasi doktor matematika Universitas Tsinghua(musim semi 2026):rata-rata dari tiga kali run (avg@3) 88,4, nilai tertinggi untuk model di Tiongkok

Kompetisi Olimpiade Biologi untuk siswa sekolah menengah Tiongkok 2025(CHSBO 2025):87,8 poin, nilai tertinggi untuk model sejenis di Tiongkok

Platform Deploy dan Harga API

Menurut pengumuman resmi Tencent, Hy3 versi pratinjau telah dideploy di platform berikut: Yuanbao(元寶)、QQ、Tencent Docs(腾讯文件)、CodeBuddy、WorkBuddy, dan OpenClaw.

Harga API di Tencent Cloud adalah 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; untuk rencana penandaan pribadi, biaya bulanan mulai dari sekitar 4,10 dolar AS. Pengumuman Tencent juga menunjukkan bahwa pada CodeBuddy dan WorkBuddy, latensi penandaan pertama Hy3 dibandingkan pendahulunya turun 54%, waktu generasi end-to-end berkurang 47%, dan berhasil menyelesaikan alur kerja agen yang terdiri dari 495 langkah.

Pertanyaan yang Sering Diajukan

Kapan Tencent Hy3 versi pratinjau dirilis, dan bisa didapatkan di platform apa?

Berdasarkan pengumuman resmi Tencent dan laporan Decrypt pada 24 April 2026, Hy3 versi pratinjau dirilis sebagai open-source pada 23 April 2026 (Kamis) di GitHub, Hugging Face, dan ModelScope, sementara Tencent Cloud secara bersamaan menyediakan layanan API berbayar.

Dibandingkan model generasi sebelumnya Hy2, apa perbedaan utama pengujian tolok ukur Hy3 versi pratinjau?

Menurut pengumuman resmi Tencent, skor SWE-bench Verified meningkat dari 53,0% pada Hy2 menjadi 74,4%; BrowseComp naik dari 28,7% menjadi 67,1%; Terminal-Bench 2.0 meningkat dari 23,2% menjadi 54,4%.

Berapa harga API untuk Hy3 versi pratinjau?

Berdasarkan harga resmi Tencent Cloud, API Hy3 versi pratinjau dimulai dari 0,18 dolar AS per satu juta token input dan 0,59 dolar AS per satu juta token output; biaya bulanan untuk rencana penandaan pribadi mulai dari sekitar 4,10 dolar AS.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3

Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya "mencengangkan: biasa saja dan rawan kesalahan" dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab

GateNews10menit yang lalu

Naver Meluncurkan Beta AI Tab saat Google Gemini Masuk Pasar Pencarian Korea Selatan

Pesan Berita Gate, 24 April — Naver mengumumkan dimulainya beta tertutup untuk AI Tab, fitur pencarian percakapan barunya, setelah peluncuran Gemini oleh Google di Chrome di Korea Selatan. AI Tab akan muncul berdampingan dengan tab pencarian Naver yang sudah ada, memberi pengguna ruang khusus untuk pertanyaan percakapan

GateNews22menit yang lalu

Perekrutan Kejuruan AI di India Melonjak 59,5%, Meluas di Luar Pusat Teknologi

Laporan Pasar Tenaga Kerja AI LinkedIn 2026, yang dirilis pada 24 April, menemukan bahwa perekrutan untuk insinyur AI di India naik 59,5% dari tahun ke tahun, menandai laju tercepat di antara pasar-pasar yang diteliti oleh platform tersebut. Pertumbuhan ini didorong oleh permintaan yang menyebar melampaui pusat teknologi yang sudah mapan. Kota-kota termasuk

CryptoFrontier42menit yang lalu

Commonwealth Bank Memotong 120 Pekerjaan di Tengah Perluasan AI

Bank Persemakmuran Australia mengumumkan bahwa pihaknya akan memangkas sekitar 120 pekerjaan karena bank terbesar di negara itu meninjau peran-peran dan memperluas penggunaan kecerdasan buatan, menurut Bloomberg. Pemangkasan tersebut mencakup 43 peran di Bankwest di Australia Barat, dengan enam posisi terdampak oleh otomatisasi. Ini a

CryptoFrontier51menit yang lalu

Cursor Mengungkap Alasan Pelatihan XAI: Daya komputasi terjebak, SpaceX memegang opsi senilai 60 miliar dolar AS lainnya untuk akuisisi

Pengumuman Anysphere menyatakan bahwa Cursor akan menggunakan infrastruktur Colossus dari xAI untuk melatih model baru guna memecahkan hambatan daya komputasi; SpaceX mengajukan opsi akuisisi senilai 60 miliar dolar (dapat diakuisisi sepenuhnya dalam waktu hingga tahun 2026), dan jika tidak, membayar sekitar 10 miliar dolar sebagai kompensasi kerja sama. Kedua transaksi tersebut berjalan bersamaan, membentuk ulang siapa yang dapat melatih Cursor serta siapa yang bisa membeli Cursor; Cursor tetap mengizinkan banyak model untuk sisi backend, tetapi arah jangka panjangnya bergantung pada apakah SpaceX menggunakan hak akuisisinya.

ChainNewsAbmedia1jam yang lalu

Penilaian pasar sekunder Anthropic menembus 1 triliun dolar: Forge Global mengungguli OpenAI sebesar 880 miliar

Berdasarkan laporan Decrypt, valuasi sekunder Anthropic dari Forge Global sekitar 1 triliun dolar, OpenAI sekitar 8.800 miliar dolar, dengan pembalikan tren yang pertama kali muncul di pasar sekunder. ARR Anthropic meningkat dari sekitar 9 miliar pada akhir 2025 menjadi sekitar 30 miliar pada Maret 2026, dengan pertumbuhan 233% selama tiga bulan, yang mendorong valuasi pasar privat. Valuasi sekunder berbeda dari pendanaan tahap awal, mencerminkan kepercayaan terhadap potensi keluar (exit); ke depan, masih mengamati empat jalur: teknologi, kebijakan, bisnis, dan narasi.

ChainNewsAbmedia1jam yang lalu
Komentar
0/400
Tidak ada komentar