พนักงาน OpenAI ประชุมสาธารณะว่า xAI รุ่นล่าสุดโมเดล AI ชื่อ Grok3 มีผลทดสอบเกณฑ์เปรียบเทียบสมรรถนะที่สร้างความเข้าใจผิด

ดำเนินการเจนเนเรชั่นบทคัดย่อ

ChainCatcher รายงานว่า ตามรายงานจาก Jinshi OpenAI พนักงานหนึ่งของบริษัท xAI ภายใต้การคุมของ Elon Musk กล่าวถึงผลการทดสอบเกณฑ์เปรียบเทียบสมรรถนะของโมเดล AI ล่าสุด Grok3 ซึ่งมีความเท็จของมัน ในขณะเดียวกัน ผู้ร่วมก่อตั้งของ xAI Igor Babushkin ยืนกรานว่า บริษัทไม่ได้กระทำผิด กราฟ xAI แสดงให้เห็นว่ารุ่น Grok3 ทั้งสองรุ่น คือ Grok3 Reasoning Beta และ Grok3 mini Reasoning มีผลงานที่ดีกว่ารุ่น o3-mini-high ที่แข็งแกร่งที่สุดของ OpenAI ใน AIME 2025 อย่างไรก็ตาม พนักงานของ OpenAI รีบชี้แจงในแพลตฟอร์ม X ว่า กราฟ xAI ไม่ได้รวมคะแนน AIME 2025 ของ o3-mini-high ภายใต้เงื่อนไข "cons@64" บูชคินอ้างว่าในแพลตฟอร์ม X OpenAI ยังเคยมีการเผยแพร่กราฟทดสอบที่เปรียบเทียบเกณฑ์เปรียบเทียบสมรรถนะที่สร้างความเข้าใจผิด ๆ อย่างเดียว แม้ว่ากราฟเหล่านั้นจะถูกใช้เปรียบเทียบประสิทธิภาพโมเดลของตนเอง

XAI0.19%

GROK-3.57%

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

1ถูกใจ

รางวัล
1
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
192k โพสต์
#ETH#
120k โพสต์
#PI#
94k โพสต์
4#GateioInto11#
76k โพสต์
5#ContentStar#
64k โพสต์
6#BOME#
59k โพสต์
7#GT#
56k โพสต์
8#DOGE#
53k โพสต์
9#MAGA#
52k โพสต์
10#SLERF#
51k โพสต์

ปักหมุด

แผนผังเว็บไซต์