أطلقت Google Gemini 3.1 Flash TTS: يدعم 70 لغة وسيناريوهات متعددة لتوجيه المخرّجين، وصوت الذكاء الاصطناعي أكثر طبيعية

ChainNewsAbmedia

أعلن مدير العلاقات مع مطوري الذكاء الاصطناعي في Google، Logan Kilpatrick، في 15 أبريل عن إطلاق Gemini 3.1 Flash TTS — أحدث نموذج لتحويل النص إلى كلام من Google. يدعم هذا النموذج 70 لغة، والتحكم الدقيق على مستوى المخرجين المشهديين (scene direction)، ومستوى المتحدثين، بالإضافة إلى وسم الصوت، وهو متاح حاليًا للاستخدام في مساحة اللعب الخاصة بالصوت ضمن Google AI Studio وفي Gemini API.

الميزات الأساسية الأربعة

يحسّن Gemini 3.1 Flash TTS مقارنةً بسابقه بشكل ملحوظ عبر أربع ترقيات:

المخرج المشهدي (Scene Direction) — يمكنه ضبط سياق الصوت، مثل “الحديث بصوت منخفض في مقهى مزدحم” أو “الإعلان عن أخبار سارة بحماس”، حيث يقوم النموذج بتعديل النبرة وسرعة الكلام والتعبير العاطفي وفقًا للمشهد

التحكم على مستوى المتحدثين (Speaker-Level Specificity) — في حوارات متعددة الأدوار، يمكن تعيين خصائص صوت مختلفة لكل شخصية

وسوم الصوت (Audio Tags) — يدعم إدراج تعليمات لمؤثرات صوتية داخل النص للتحكم بالتوقفات وتغيرات النبرة وتفاصيل أخرى

دعم 70 لغة — توسيع كبير لتغطية اللغات المتعددة، بما في ذلك الصينية

أصوات أكثر طبيعية وأكثر تعبيرًا

وأكدت Google أن هذا النموذج يحقق تقدمًا في طبيعية الصوت. غالبًا ما يتعرض خرج نماذج TTS التقليدية لانتقادات لأنه “يبدو كأنه ذكاء اصطناعي”، وتُحاول Gemini 3.1 Flash TTS تضييق الفجوة مع الصوت البشري عبر تقديم تنوع أكبر في الإيقاع والتعبير العاطفي. وأشار Kilpatrick إلى أن التقدم من Gemini 2.5 إلى 3.1 “واضح للغاية”.

كيف يمكن للمطورين استخدامه

يمكن للمطورين استخدامه بطريقتين:

Google AI Studio الصوتية Playground — اختبار المعاينة مباشرة داخل واجهة الويب لتأثيرات الصوت

Gemini API — التكامل داخل التطبيقات، للاستخدام في سيناريوهات مثل المساعدات الصوتية، والكتب الصوتية، والتوليد التلقائي للـ Podcast، والدعم متعدد اللغات للعملاء

توسيع خط منتجات Gemini بشكل مستمر

يُعد Flash TTS جزءًا من السلسلة التي شهدت إطلاقًا مكثفًا مؤخرًا ضمن عائلة Gemini 3.1. وقبل ذلك كانت Google قد أطلقت Gemini Robotics ER 1.6 (استدلال رؤية الروبوتات)، وTab Tab Tab (تكملة prompt لـ Vibe Coding)، بالإضافة إلى ميزات المعاينة الخاصة بالتصميم. تعمل Google على توسيع Gemini من “نموذج محادثة” ليصبح منصة ذكاء اصطناعي متعددة الوسائط تشمل النص والصوت والرؤية والروبوتات.

هذه المقالة التي قدمت فيها Google Gemini 3.1 Flash TTS: دعم 70 لغة ومخرجين مشهديين، وصوت AI أكثر طبيعية ظهرت لأول مرة على موقع 鏈新聞 ABMedia.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

بوندسبنك يحذّر من أن نموذج Mythos لدى Anthropic قد يُظهر نقاط ضعف في أنظمة القطاع المصرفي الأوروبي

رسالة أخبار بوابة، 21 أبريل — حذّر رئيس البنك المركزي الألماني (البوندسبنك) يواخيم ناغل يوم الثلاثاء من أن نموذج الذكاء الاصطناعي الأسطوري (Mythos) الخاص بشركة Anthropic يمثل مخاطر كبيرة للأمن السيبراني على المؤسسات المالية الأوروبية ودعا إلى توفير وصول أوسع إلى هذه التكنولوجيا. ويُعد ناغل أيضًا عضوًا في مجلس محافظي البنك المركزي الأوروبي

GateNewsمنذ 39 د

South Korea's Semiconductor Exports Surge 182.5% in Early April on AI Chip Demand

AI demand boosted Korea's semiconductor exports and profits for Samsung and SK hynix; shipments to China and the US rose. Yet policy risks from U.S. tariffs loom despite a record 2025 level. Abstract: The article reports that South Korea's semiconductor exports surged in early April, driven by AI-related demand that increased memory-chip shipments and profits for Samsung Electronics and SK hynix. Exports rose to US$18.3 billion in April 1–20, with total exports up 49.4% to US$50.4 billion and a US$10.4 billion trade surplus. China and the United States were primary growth markets, and 2025 semiconductor exports reached a record US$173.4 billion, up over 20% year over year. However, policy uncertainties persist: a 25% U.S. tariff on certain advanced computing chips could affect sentiment, memory-chip exports being excluded, and tensions in the Middle East and broader tariff policies could weigh on the outlook.

GateNewsمنذ 39 د

يُحدد خبراء الاقتصاد فرص العمل بعد موجة البطالة الناتجة عن الذكاء الاصطناعي: تتحول قيمة الندرة إلى «خدمات عاطفية»

يشير إيماس إلى أن الذكاء الاصطناعي لن يحلّ بالكامل محلّ القوى البشرية، بل سيحوّل الندرة إلى اقتصاد يكون محوره المشاعر والعلاقات. تكشف تجربة ستاربكس عن نقاط العمى في الأتمتة، ويعتمد الاحتفاظ بالزبائن على أسلوب الاستقبال والجوّ المحيط. وتوضح التحولات في البنية التاريخية وظاهرة بومول أن الذكاء الاصطناعي يخفض أسعار السلع القابلة للتوحيد، وأن الندرة ستتجه إلى قيمة إدراكية عالية تتطلب تفاعلاً إنسانيًا. سيتمحور التركيز المستقبلي حول مجالات مثل الخدمات العاطفية والأعمال اليدوية، لكن ما يزال يتعين معالجة قضايا التوزيع العالمي والدخل الأساسي.

ChainNewsAbmediaمنذ 46 د

Artifacts الحية من Claude: لوحة معلومات متصلة مباشرة بالتطبيق لتحديثات تلقائية في الوقت الفعلي

وفقًا لإعلان X الرسمي من Claude، قامت شركة Anthropic بإطلاق ميزة Live Artifacts في Cowork لتطبيق سطح المكتب في 20 أبريل، حيث تتيح للمستخدمين ربط المخططات ولوحات المعلومات وتتبعّات يتم إنشاؤها بواسطة الذكاء الاصطناعي مباشرةً بتطبيقاتهم وملفاتهم، بحيث يتم تحديثها تلقائيًا بالبيانات الأحدث عند فتحها. يتم توفير Live Artifacts لجميع مستخدمي Cowork ضمن جميع باقات Claude المدفوعة (Pro وMax وTeam وEnterprise). الوظائف الأساسية لـ Live Artifacts: من المخرجات الثابتة إلى الترابط الفوري في الماضي، انفصلت مخرجات Claude Artifacts عن الواقع—فإذا أراد المستخدم تحديث البيانات، لم يكن أمامه سوى نسخ البيانات يدويًا ولصقها وطلب من Claude توليد نسخة جديدة. L

ChainNewsAbmediaمنذ 1 س

الشركة الناشئة الكورية الجنوبية لتخزين بيانات الذكاء الاصطناعي Dnotitia ترفع 61.2 مليون دولار في تمويل Series A

رسالة أخبار بوابة، 21 أبريل — شركة ناشئة كورية جنوبية لتخزين بيانات الذكاء الاصطناعي Dnotitia جمعت 90 مليار وون (61.2 مليون دولار أمريكي) في جولة تمويل أولية (Series A) بقيادة Elohim Partners. شاركت أيضًا Kiwoom Investment وShinhan Venture Investment في الجولة. المنتجات الرئيسية لـ Dnotitia هي قاعدة بيانات Seahorse للمتجهات

GateNewsمنذ 1 س

مؤسس شبكة Pi في 7 مايو ناقش تحديد هوية البشر في عصر الذكاء الاصطناعي خلال Consensus 2026

مؤسس شبكة Pi Nicolas Kokkalis سيحضر في 7 مايو مؤتمر Consensus 2026 الذي يُقام في ميامي، لينضم إلى فريق خبراء يناقش موضوع التعرف على الهوية البشرية في عصر الذكاء الاصطناعي (AI) عبر الإنترنت. ووفقًا لجدول الفعالية الرسمي، سيتضمن هذا النقاش مشاركة خبراء في مجالات الهوية والخصوصية والثقة الرقمية.

MarketWhisperمنذ 2 س
تعليق
0/400
لا توجد تعليقات