Microsoft เปิดตัวฟีเจอร์ Critique และ Council ให้กับ Copilot Researcher โดยคะแนนทดสอบ DRACO อยู่ที่ 57.4 นำอยู่ในอุตสาหกรรม

GateNews

ข่าว Gate News เมื่อวันที่ 31 มีนาคม Microsoft ประกาศเมื่อวันจันทร์ว่าได้เปิดตัวฟีเจอร์ใหม่ 2 รายการสำหรับ Copilot Researcher ได้แก่ Critique และ Council โดยนำ GPT ของ OpenAI และ Claude ของ Anthropic มารวมกันเพื่อใช้กับงานวิจัยงานเดียวกัน Critique ใช้รูปแบบการทำงานร่วมกันแบบต่อเนื่อง: GPT รับผิดชอบการวางแผนการวิจัย การค้นหาข้อมูล และการร่างฉบับแรก จากนั้น Claude ทำหน้าที่เป็นผู้ตรวจทาน ตรวจสอบความถูกต้องของข้อเท็จจริงและคุณภาพของการอ้างอิง; ส่วน Council จะให้ทั้งสองโมเดลสร้างรายงานอย่างอิสระแบบขนานกัน แล้วให้โมเดลผู้ตัดสินอีกตัวหนึ่งเปรียบเทียบความแตกต่างและสรุปความเห็นที่แตกต่าง ในการทดสอบเกณฑ์มาตรฐาน DRACO ที่ครอบคลุมงานวิจัยที่ซับซ้อน 100 รายการใน 10 สาขา รวมถึงการแพทย์ กฎหมาย และเทคโนโลยี Copilot ที่ติดตั้ง Critique ได้คะแนน 57.4 นำหน้าลำดับที่สองเกือบ 14% และสูงกว่าคะแนน 42.7 ของการรัน Claude Opus เพียงลำพังอย่างมาก

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น