Alibaba Qianwen เปิดตัวโมเดลขนาดใหญ่ Qwen3.5-Omni แบบมัลติโหมดเต็มรูปแบบ รองรับการรู้จำเสียง 113 ประเภท

Gate News ข่าวสาร 30 มีนาคม อาลี คิวนเหวินประกาศว่าโมเดลแบบมัลติโหมดเต็มรูปแบบ Qwen3.5-Omni พร้อมใช้งานแล้ว ชุดนี้ประกอบด้วยเวอร์ชัน Instruct ขนาด Plus, Flash และ Light สามขนาด รองรับบริบทความยาว 256k โมเดลรองรับการป้อนข้อมูลเสียงมากกว่า 10 ชั่วโมง และรองรับการป้อนข้อมูลวิดีโอ/วิดีโอ 720P (1FPS) มากกว่า 400 วินาที โมเดลได้รับการฝึกพรีเทรนแบบมัลติโหมดดั้งเดิมจากข้อมูลข้อความจำนวนมหาศาล ภาพ และข้อมูลวิดีโอ/วิดีโอมากกว่า 100 ล้านชั่วโมง แสดงความสามารถอันโดดเด่นด้านการรับรู้และการสร้างแบบมัลติโหมด เมื่อเทียบกับรุ่นก่อน Qwen3-Omni ความสามารถด้านหลายภาษาของ Qwen3.5-Omni ได้รับการยกระดับอย่างมาก สามารถรองรับการรู้จำเสียงของภาษาและภาษาถิ่น 113 ภาษา และการสร้างเสียงของภาษาและภาษาถิ่น 36 ภาษา และภาษาถิ่น

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น