Meta ประกาศเฟรมเวิร์ก audio2photoreal AI ซึ่งสามารถสร้างฉากบทสนทนาของตัวละครโดยการป้อนไฟล์พากย์

เมื่อเร็ว ๆ นี้ Bit News Meta ได้ประกาศเฟรมเวิร์ก AI ที่เรียกว่า audio2photoreal ซึ่งสามารถสร้างชุดโมเดลตัวละคร NPC ที่สมจริงและ "ลิปซิงค์" และ "วางตัว" โมเดลตัวละครโดยอัตโนมัติด้วยความช่วยเหลือของไฟล์เสียงพากย์ที่มีอยู่

รายงานการวิจัยอย่างเป็นทางการชี้ให้เห็นว่าหลังจากได้รับไฟล์พากย์แล้วเฟรมเวิร์กโฟโตเรียล Audio2 จะสร้างชุดโมเดล NPC ก่อนจากนั้นใช้เทคโนโลยีการหาปริมาณและอัลกอริธึมการแพร่กระจายเพื่อสร้างการกระทําของแบบจําลองซึ่งเทคโนโลยีการหาปริมาณให้การอ้างอิงตัวอย่างการกระทําสําหรับเฟรมเวิร์กและอัลกอริทึมการแพร่กระจายจะใช้เพื่อปรับปรุงผลกระทบของการกระทําของตัวละครที่สร้างโดยเฟรม

สี่สิบสามเปอร์เซ็นต์ของผู้ประเมินในการทดลองที่มีการควบคุม "พอใจอย่างยิ่ง" กับฉากบทสนทนาของตัวละครที่สร้างขึ้นโดยเฟรมดังนั้นนักวิจัยจึงรู้สึกว่ากรอบแสง Audio2 สามารถสร้างการเคลื่อนไหวที่ "มีชีวิตชีวาและแสดงออก" ได้มากกว่าผลิตภัณฑ์คู่แข่งในอุตสาหกรรม มีรายงานว่าขณะนี้ทีมวิจัยได้เผยแพร่รหัสและชุดข้อมูลที่เกี่ยวข้องบน GitHub แล้ว

AUDIO3.42%

ดูต้นฉบับ

เนื้อหานี้มีสำหรับการอ้างอิงเท่านั้น ไม่ใช่การชักชวนหรือข้อเสนอ ไม่มีคำแนะนำด้านการลงทุน ภาษี หรือกฎหมาย ดูข้อจำกัดความรับผิดชอบสำหรับการเปิดเผยความเสี่ยงเพิ่มเติม

1ถูกใจ

รางวัล
1
แสดงความคิดเห็น
แชร์

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น

หัวข้อถ่ายทอดสด
#BTC#
192k โพสต์
#ETH#
120k โพสต์
#PI#
95k โพสต์
4#GateioInto11#
76k โพสต์
5#ContentStar#
64k โพสต์
6#BOME#
59k โพสต์
7#GT#
56k โพสต์
8#DOGE#
53k โพสต์
9#MAGA#
52k โพสต์
10#SLERF#
51k โพสต์

ปักหมุด

แผนผังเว็บไซต์