Karyawan OpenAI secara terbuka menuduh hasil uji coba Benchmark dari model AI terbaru xAI Grok3 memiliki sifat yang menyesatkan

Pembuatan abstrak sedang berlangsung

Pesan ChainCatcher, seperti dilaporkan oleh Jinshi, seorang karyawan OpenAI secara terbuka menuduh perusahaan XAI di bawah kendali Musk, menyatakan bahwa hasil uji Benchmark terbaru dari model AI Grok3 yang dirilis oleh perusahaan tersebut menyesatkan. Igor Babushkin, salah satu pendiri XAI, dengan tegas menyatakan bahwa perusahaannya tidak melakukan hal yang tidak semestinya. Grafik xAI menunjukkan bahwa dua versi Grok3 - Grok3 Reasoning Beta dan Grok3 mini Reasoning - memiliki kinerja di atas model yang paling kuat yang saat ini tersedia dari OpenAI, o3-mini-high, di AIME 2025. Namun, staf OpenAI dengan cepat menunjukkan di platform X bahwa grafik xAI tidak mencakup skor AIME 2025 o3-mini-high dalam kondisi "cons@64". Babu Bushkin berpendapat di platform X bahwa OpenAI juga pernah merilis grafik uji benchmark yang menyesatkan serupa di masa lalu. Meskipun grafik tersebut digunakan untuk membandingkan kinerja model mereka sendiri.

XAI0.19%

GROK-3.57%

Lihat Asli

Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.

1 Suka

Hadiah
1
Komentar
Bagikan

Komentar

0/400

Tidak ada komentar

Topik
#BTC#
192k postingan
#ETH#
120k postingan
#PI#
94k postingan
4#GateioInto11#
76k postingan
5#ContentStar#
64k postingan
6#BOME#
59k postingan
7#GT#
56k postingan
8#DOGE#
53k postingan
9#MAGA#
52k postingan
10#SLERF#
51k postingan

Sematkan

peta situs