Google's Gemini 3 Deep Think ยกระดับครั้งใหญ่: ความสามารถในการวิเคราะห์เปรียบเทียบกับ Opus 4.6, GPT-5.2 เพื่อเป็น "AI ที่เก่งด้านงานวิจัยมากที่สุด"

動區BlockTempo
BTC1.11%

กูเกิลประกาศอัปเดตใหญ่ Gemini 3 Deep Think ในวันที่ 13 โดยในชุดทดสอบ ARC-AGI-2 ซึ่งเป็นการทดสอบเชิงตรรกะที่เน้นความสามารถในการสรุปกฎเกณฑ์จากตัวอย่างหลายๆ ตัว Gemini 3 Deep Think ทำได้ถึง 84.6% ซึ่งสูงกว่าคู่แข่งอย่าง Claude Opus 4.6 (68.8%) และ GPT-5.2 (52.9%) อย่างมาก พร้อมทั้งยังได้ระดับ “ปรมาจารย์ตำนาน” ใน Codeforces
(เรื่องราวก่อนหน้า: การเรียนรู้ของ ChatGPT เปิดตัว: ยามรุ่งอรุณของครูสอนพิเศษ หรือยุคทองของการศึกษา?)
(ข้อมูลเสริม: กูเกิลเปิดตัวอย่างเป็นทางการ “Gemini 3”! ขึ้นเป็น AI ที่ฉลาดที่สุดในโลก จุดเด่นคืออะไร?)

สารบัญบทความ

  • ไม่ใช่แค่สอบได้ ยังจับผิดมนุษย์ได้ด้วย
  • การเปลี่ยนแปลงของส่วนแบ่งตลาด
  • ผลกระทบต่ออุตสาหกรรมคริปโต
  • การเริ่มต้นของยุทธศาสตร์วิทยาศาสตร์

กูเกิลในวันนี้ (13) ได้ประกาศอัปเกรดครั้งสำคัญของ Gemini 3 Deep Think ในชุดทดสอบ ARC-AGI-2 ซึ่งเป็นการทดสอบเชิงตรรกะที่เน้นความสามารถในการสรุปกฎเกณฑ์จากตัวอย่างหลายๆ ตัว Gemini 3 Deep Think ทำคะแนนได้ถึง 84.6%

เพื่อเปรียบเทียบ Claude Opus 4.6 (ในโหมด Thinking Max) ได้ 68.8% และ GPT-5.2 (ในโหมด Thinking xhigh) ได้ 52.9% ในขณะที่มนุษย์เฉลี่ยอยู่ที่ประมาณ 60%

ที่น่าทึ่งยิ่งกว่านั้น ในชุดทดสอบ ARC-AGI-1 รุ่นเดิม Deep Think ทำได้ถึง 96% ซึ่งถือเป็นการผลักดันขีดจำกัดของการทดสอบที่เคยถูกมองว่าเป็น “หนึ่งในข้อสอบที่ยากที่สุดของ AI” ไปจนถึงเพดานสูงสุด

Deep Think ขณะนี้เปิดให้สมาชิก Google AI Ultra ใช้งานผ่าน API สำหรับองค์กรในช่วงเบต้าแรก

ไม่ใช่แค่สอบได้ ยังจับผิดมนุษย์ได้ด้วย

นอกจากผลคะแนนแล้ว กูเกิลยังเผยรายละเอียดว่า Deep Think สามารถตรวจพบข้อผิดพลาดเชิงตรรกะในบทความวิชาการคณิตศาสตร์ที่ผ่านการรีวิวโดยเพื่อนนักวิจัย ซึ่งบทความนี้ได้รับการยืนยันจากนักคณิตศาสตร์จากมหาวิทยาลัย Rutgers

ความสำคัญของกรณีนี้อยู่ที่มันไม่ใช่แค่การแสดงความสามารถในข้อสอบมาตรฐาน แต่เป็นการแสดงความสามารถในสถานการณ์วิทยาศาสตร์จริง การรีวิวโดยเพื่อนนักวิจัยเป็นกลไกควบคุมคุณภาพที่สำคัญที่สุดในวงการวิชาการ หาก AI สามารถสนับสนุนในกระบวนการนี้อย่างมั่นคง มันจะเร่งรัดการวิจัยทางวิทยาศาสตร์ได้มากกว่าการวัดผลคะแนนใดๆ

Deep Think ยังสามารถทำคะแนนระดับเหรียญทองในข้อสอบเขียนของโอลิมปิกฟิสิกส์และเคมีระดับนานาชาติในปี 2025 โดยมีคะแนน Elo ใน Codeforces อยู่ที่ 3,455 ซึ่งเทียบเท่ากับ “ปรมาจารย์ตำนาน” ระดับโลก ซึ่งมีนักเขียนโปรแกรมมนุษย์เพียงไม่กี่คนเท่านั้นที่สามารถไปถึงระดับนี้ได้

และใน “การสอบสุดท้ายของมนุษยชาติ” ซึ่งเป็นข้อสอบที่ออกแบบโดยผู้เชี่ยวชาญจากหลายสาขา เพื่อให้ AI ทำได้ยากที่สุด Deep Think ก็ทำได้ 48.4% (โดยไม่ใช้เครื่องมือเสริม) ซึ่งเป็นสถิติใหม่

การเปลี่ยนแปลงของส่วนแบ่งตลาด

การแข่งขันด้านเทคโนโลยีของบริษัทยักษ์ใหญ่ด้าน AI กำลังเปลี่ยนแปลงภาพรวมตลาดอย่างรวดเร็ว ส่วนแบ่งตลาดของ ChatGPT ลดลงจากจุดสูงสุด 87% เหลือประมาณ 68% ขณะที่ Gemini ขึ้นมาเกิน 18% จากน้อยกว่า 5% และ Claude ของ Anthropic ก็ยังคงแย่งชิงตลาดระดับองค์กรอย่างต่อเนื่อง

จุดแข็งของกูเกิลในเกมนี้คือความสามารถในการกระจายสินค้า Gemini ถูกฝังอยู่ในระบบ Android เบราว์เซอร์ Chrome Google Workspace และเครื่องมือค้นหา ซึ่งหมายความว่าแม้ความสามารถของโมเดลจะเทียบเท่าคู่แข่ง แต่กูเกิลก็สามารถใช้ช่องทางการเข้าถึงเพื่อดึงดูดผู้ใช้ได้

แต่ข้อได้เปรียบด้านการกระจายสินค้าก็เป็นดาบสองคม หากประสบการณ์ใช้งาน Gemini ไม่ดีพอ ก็อาจทำให้เสียความเชื่อมั่นของผู้ใช้ได้เร็วกว่าใคร เพราะผู้ใช้เป็น “ผู้รับ” ที่ไม่ได้เลือกเอง ในขณะที่ผู้ใช้ของ OpenAI เป็นกลุ่มที่จ่ายเงินเอง จึงมีความอดทนและความผูกพันสูงกว่า

ผลกระทบต่ออุตสาหกรรมคริปโต

ทุกครั้งที่มีการอัปเกรดในสงครามอาวุธ AI ความต้องการโครงสร้างพื้นฐานด้านการคำนวณก็จะเพิ่มขึ้น ค่าใช้จ่ายในการฝึกโมเดลระดับแนวหน้าก็พุ่งสูงจากหลักร้อยล้านดอลลาร์ในปี 2024 ไปสู่หลักพันล้านในปี 2026 ซึ่งส่งผลต่อสองเรื่องหลัก

เรื่องแรก: การเปลี่ยนแปลงของเหมืองบิทคอยน์ เมื่อกำไรจากการขุดลดลง (เช่น มอร์แกน สแตนลีย์ คาดการณ์ว่าต้นทุนการผลิต BTC อยู่ที่ 77,000 ดอลลาร์ ขณะที่ราคาบิทคอยน์อยู่ราว 66,000 ดอลลาร์) เหมืองขนาดใหญ่ที่มีโครงสร้างพื้นฐานด้านคำนวณจำนวนมากก็เริ่มเปลี่ยนไปให้บริการด้าน AI แทน

ไม่ใช่การ “ถอนตัว” แต่เป็น “เปลี่ยนสายงาน” จากการขุดบิทคอยน์เป็นการให้บริการสัญญาเช่าใช้พลังคำนวณ AI

เรื่องที่สอง: การเล่าเรื่องของโทเคน AI ทุกครั้งที่กูเกิล, OpenAI หรือ Anthropic เปิดตัวอัปเกรดสำคัญ โทเคนที่เกี่ยวข้องกับ AI บนบล็อกเชน เช่น สัญญาเช่าใช้การคำนวณแบบกระจายศูนย์ ก็จะมีการเก็งกำไรระยะสั้น

แต่พื้นฐานของโทเคนเหล่านี้ยังคงมีปัญหาอยู่ คือ การคำนวณแบบกระจายศูนย์ในด้านดีเลย์และความสามารถในการรับส่งข้อมูล ยังห่างไกลจากความต้องการของการฝึก AI ระดับองค์กรอยู่มาก เรื่องราวอาจวิ่งเร็ว แต่โครงสร้างพื้นฐานยังตามไม่ทัน

การเริ่มต้นของยุทธศาสตร์วิทยาศาสตร์

การอัปเกรดของ Deep Think ทำให้กูเกิลกลับมาอยู่ในตำแหน่งผู้นำในการแข่งขัน AI อย่างน้อยในด้านการสรุปเชิงตรรกะและวิทยาศาสตร์ แต่ถ้าสังเกตคำประกาศของกูเกิลอย่างละเอียด จะพบว่ามีการเปลี่ยนทิศทางเล็กน้อยจากการเน้น “AI ที่ฉลาดที่สุด” ไปเป็น “AI ที่เกิดมาเพื่อวิทยาศาสตร์”

เมื่อข้อสอบมาตรฐานของ AI ยิ่งเต็มไปด้วยความแออัดและความแตกต่างยากขึ้น การอ้างว่า “AI ของฉันช่วยทำวิจัยทางวิทยาศาสตร์” กลายเป็นข้อเสนอที่น่าดึงดูดมากกว่าการเน้น “คะแนนสูงสุดในข้อสอบ” หาก Deep Think สามารถสนับสนุนการตรวจสอบโดยเพื่อนนักวิจัยอย่างมั่นคง เร่งการค้นพบยา หรือช่วยในโมเดลฟิสิกส์ที่มนุษย์มองข้าม ก็จะเป็นคุณค่าที่สำคัญกว่าการจัดอันดับในตารางคะแนนเสียอีก

คำถามคือ จาก “สามารถทำคะแนนสูงในข้อสอบ” ไปสู่ “สามารถสนับสนุนงานวิจัยทางวิทยาศาสตร์ในสถานการณ์จริง” ระยะห่างอาจไกลกว่าที่กูเกิลบอกไว้ เพราะข้อสอบมีคำตอบแน่นอน แต่ในวิทยาศาสตร์ไม่มีเสมอไป

news.article.disclaimer

btc.bar.articles

พันธบัตรหนุนด้วยบิตคอยน์ของรัฐนิวแฮมป์เชียร์ได้รับการจัดอันดับโดย Moody's

พันธบัตรเทศบาลสหรัฐฯ ที่หนุนด้วยบิตคอยน์รุ่นแรกของมลรัฐนิวแฮมป์เชียร์ ซึ่งเป็นแบบเฉพาะทางเป็นครั้งแรก ตอนนี้อยู่ใกล้ความเป็นจริงมากขึ้นอีกขั้น หลังจากที่ได้รับเรตติ้งจาก Moody’s Investors Service เมื่อวันอังคาร ในการแถลงเมื่อวันอังคาร Moody's ได้ให้โครงการพันธบัตรบิตคอยน์ของนิวแฮมป์เชียร์เรตติ้งชั่วคราว Ba2 ซึ่งมีผลในระดับที่อยู่ในช่วงระดับต่ำกว่าระดับลงทุน (ซึ่งตกอยู่ในช่วง Ba2)

Cointelegraph10 นาที ที่แล้ว

กองทุน ETF ของ Bitcoin ปรับตัวขึ้นอีกครั้งด้วยเงินไหลเข้า 69 ล้านดอลลาร์ ขณะที่อีเธอร์หยุดสตรีคขาดทุน

กองทุน ETF ของ Bitcoin เริ่มต้นสัปดาห์ด้วยกระแสเงินไหลเข้าอีกครั้ง ขณะที่ ether หยุดสตรีคการไหลออกที่ยาวนานลงได้แล้ว อย่างไรก็ตาม Solana และ XRP ยังคงอยู่ภายใต้แรงกดดันพร้อมการปรับลดที่เห็นได้ชัด กองทุน Crypto ETF สลับกัน: Bitcoin, Ether เพิ่มขึ้น ขณะที่ Solana, XRP ลดลง สัปดาห์ใหม่เริ่มต้นด้วยการเปลี่ยนแปลงโทน แต่ไม่ใช่ทั้งหมดก็ถึงกับ r

Coinpedia35 นาที ที่แล้ว

หุ้นเทคโนโลยี 7 รายใหญ่ในสหรัฐฯ ดีดตัวขึ้นพร้อมกัน Meta เพิ่มขึ้น 6.67% และ Nvidia เพิ่มขึ้น 5.59%

ข่าว Gate News วันที่ 1 เมษายน หลังความเสี่ยงด้านภูมิรัฐศาสตร์ระหว่างสหรัฐฯ และอิหร่านปรับลดลงอย่างมีนัยสำคัญ ส่งผลให้หุ้นสหรัฐฯ ในกลุ่มเทคโนโลยี “7 ยักษ์” (Meta, Nvidia, Google, Tesla, Amazon, Microsoft, Apple) ดีดตัวขึ้นทั้งหมดในวันนี้ โดยในกลุ่มดังกล่าว Meta และ Nvidia นำขึ้นตามลำดับที่ 6.67% และ 5.59% ขณะที่ Google, Tesla, Amazon, Microsoft และ Apple ปรับขึ้นพร้อมกันในช่วง 2.9% ถึง 5.14% สถานการณ์ภูมิรัฐศาสตร์ที่ผ่อนคลายลงได้ลดส่วนต่างผลตอบแทนจากความเสี่ยงทั่วโลกอย่างมีประสิทธิภาพ ส่งผลให้เงินไหลกลับไปยังสินทรัพย์เติบโตที่มีเบตาสูง

GateNews44 นาที ที่แล้ว

ทอม ลี: ตลาดได้ซึมซับแรงขายที่เกิน 90% แล้ว โดยทั่วไปตลาดหุ้นจะตกแตะระดับต่ำในช่วง 10% แรกของกระบวนการสงคราม

ทอม ลี กล่าวในการให้สัมภาษณ์กับ CNBC ว่า ตลาดได้ซับแรงขายส่วนใหญ่ไปแล้ว หรือได้แตะจุดต่ำสุดแล้ว เขาระบุว่า ในประวัติศาสตร์ ตลาดหุ้นมักจะแสดงสัญญาณการแตะจุดต่ำสุดในช่วงเริ่มต้นของสงคราม และหากสภาพแวดล้อมในปัจจุบันสอดคล้องกับกฎนี้ ตลาดก็มีโอกาสที่จะเกิดการเด้งกลับแบบ V นอกจากนี้ เขายังเชื่อว่าเศรษฐกิจสหรัฐฯ สามารถรับมือกับราคาน้ำมันได้สูงถึง 120 ดอลลาร์สหรัฐต่อบาร์เรลได้

GateNews1 ชั่วโมง ที่แล้ว

Empery Digital ลดการถือครอง 79 BTC เมื่อสัปดาห์ที่แล้ว ทำให้ยอดการถือครองลดลงเหลือ 3,359 BTC

ข่าว Gate News เมื่อวันที่ 1 เมษายน บริษัท Empery Digital ซึ่งจดทะเบียนในตลาด Nasdaq เปิดเผยว่าเมื่อสัปดาห์ที่ผ่านมาได้ขายบิตคอยน์จำนวน 79 เหรียญ ด้วยราคาเฉลี่ย 71,031 ดอลลาร์สหรัฐ รวมรายได้ประมาณ 5,600,000 ดอลลาร์สหรัฐ และจำนวนบิตคอยน์ที่ถือครองทั้งหมดได้ลดลงเหลือ 3,359 เหรียญ นอกจากนี้ บริษัทดังกล่าวยังเปิดเผยว่า ณ ขณะนี้ได้ใช้เงินไปประมาณ 137 ล้านดอลลาร์สหรัฐเพื่อซื้อหุ้นสามัญคืนจำนวน 23,630,147 หุ้น และในอนาคตจะยังคงขายบิตคอยน์ต่อไปตามความจำเป็นเพื่อสนับสนุนการซื้อหุ้นคืนในอนาคต และอาจใช้เพื่อชำระหนี้บางส่วนที่ค้างชำระอยู่

GateNews1 ชั่วโมง ที่แล้ว

ETH พุ่งขึ้น 0.62% ใน 15 นาที: กระแสเงินไหลเข้า ETF สุทธิและสภาพคล่องที่ตึงตัวซึ่งส่งแรงเสริมพร้อมกัน ขับเคลื่อนการเคลื่อนไหวระยะสั้นให้แข็งแกร่งขึ้น

2026-04-01 03:00 ถึง 03:15 (UTC) ราคาของ ETH มีความผันผวนผิดปกติ โดยอัตราผลตอบแทนในช่วงอยู่ที่ +0.62% จุดต่ำสุดของกราฟแท่ง (K线) อยู่ที่ 2088.43 USDT และจุดสูงสุดอยู่ที่ 2106.93 USDT โดยมีสวิงถึง 0.89% ภายใต้บริบทที่ความผันผวนของสินทรัพย์คริปโตโดยรวมเพิ่มขึ้น ETH ในระยะสั้นมีปริมาณการซื้อขายที่คึกคัก ความนิยมบนเชนเพิ่มขึ้น และความสนใจของตลาดก็เห็นได้ชัดว่ามากขึ้น แรงผลักดันหลักของความผันผวนครั้งนี้คือกระแสเงินสุทธิไหลเข้าอย่างต่อเนื่องที่เพิ่มขึ้นของกองทุนสปอต ETF ของสหรัฐฯ โดยกระแสเงินไหลเข้า ETF ในช่วงต้นเดือนเมษายนยังคงโมเมนตัมที่แข็งแกร่งจากปลายเดือนมีนาคมต่อไป ซึ่งส่งผลให้ความต้องการสำหรับสปอต ETH เพิ่มขึ้นอย่างมีนัยสำคัญขึ้น

GateNews1 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น