Dasar
Spot
Perdagangkan kripto dengan bebas
Perdagangan Margin
Perbesar keuntungan Anda dengan leverage
Konversi & Investasi Otomatis
0 Fees
Perdagangkan dalam ukuran berapa pun tanpa biaya dan tanpa slippage
ETF
Dapatkan eksposur ke posisi leverage dengan mudah
Perdagangan Pre-Market
Perdagangkan token baru sebelum listing
Futures
Akses ribuan kontrak perpetual
TradFi
Emas
Satu platform aset tradisional global
Opsi
Hot
Perdagangkan Opsi Vanilla ala Eropa
Akun Terpadu
Memaksimalkan efisiensi modal Anda
Perdagangan Demo
Pengantar tentang Perdagangan Futures
Bersiap untuk perdagangan futures Anda
Acara Futures
Gabung acara & dapatkan hadiah
Perdagangan Demo
Gunakan dana virtual untuk merasakan perdagangan bebas risiko
Peluncuran
CandyDrop
Koleksi permen untuk mendapatkan airdrop
Launchpool
Staking cepat, dapatkan token baru yang potensial
HODLer Airdrop
Pegang GT dan dapatkan airdrop besar secara gratis
Pre-IPOs
Buka akses penuh ke IPO saham global
Poin Alpha
Perdagangkan aset on-chain, raih airdrop
Poin Futures
Dapatkan poin futures dan klaim hadiah airdrop
Investasi
Simple Earn
Dapatkan bunga dengan token yang menganggur
Investasi Otomatis
Investasi otomatis secara teratur
Investasi Ganda
Keuntungan dari volatilitas pasar
Soft Staking
Dapatkan hadiah dengan staking fleksibel
Pinjaman Kripto
0 Fees
Menjaminkan satu kripto untuk meminjam kripto lainnya
Pusat Peminjaman
Hub Peminjaman Terpadu
Google DeepMind, merilis 'Gemini 3.1 Flash TTS'… dapat menyesuaikan nada dan kecepatan bicara melalui teks
Organisasi kecerdasan buatan Google DeepMind mengungkapkan model sintesis suara baru “Gemini 3.1 Flash TTS”. Inti dari model ini adalah tidak hanya mampu berbicara secara lebih alami dibandingkan suara mekanis yang ada saat ini, tetapi pengguna juga dapat menyesuaikan nada, kecepatan, dan suasana hati secara rinci hanya melalui instruksi teks.
Mengontrol nada, intonasi, dan kecepatan melalui instruksi teks
Google LLC baru-baru ini mengumumkan peluncuran Gemini 3.1 Flash TTS melalui blog. Model ini mampu mencerminkan kata-kata perintah seperti “bersemangat”, “terkejut”, “penyampai informasi” untuk mengubah intonasi dan warna suara saat mengubah respons chatbot menjadi suara.
Berdasarkan video demonstrasi yang dipublikasikan, pengguna tidak hanya dapat memilih suara, tetapi juga dapat menyesuaikan cara penyampaian suara dan suasana hati. Jika generasi TTS sebelumnya terasa “seperti robot”, maka generasi ini lebih fokus pada pencapaian ekspresi yang lebih mendekati manusia.
Mendukung aksen dari berbagai wilayah bahasa Inggris hingga format podcast
Gemini 3.1 Flash TTS juga menyediakan berbagai aksen regional dari bahasa utama. Sebagai contoh, untuk bahasa Inggris, pengguna dapat memilih aksen Amerika “Valley” dan “Southern”, serta berbagai varian seperti Inggris “Brixton” dan “RP”. Selain itu, juga termasuk opsi aksen khusus seperti “Transatlantik”.
Google juga menambahkan fitur “kontrol sutradara” ke model ini. Pengguna dapat menyesuaikan gaya bicara dan kecepatan secara lebih rinci, serta menggunakan template dalam bentuk dialog podcast, narasi buku audio, mentor bahasa, asisten suara, panduan kesehatan, pembawa berita, petugas dukungan pelanggan, dan lain-lain.
Yang istimewa, ketika pengguna mengatur skenario dan lingkungan, bahkan memasukkan panduan dialog, model ini dirancang agar dapat melakukan percakapan multi-putaran sambil mempertahankan gaya bicara yang konsisten. Google menjelaskan bahwa pengaturan yang selesai dapat diekspor sebagai kode API Gemini, sehingga suara yang sama dapat direproduksi di berbagai proyek dan platform.
Mendukung lebih dari 70 bahasa… dan menerapkan watermark
Menurut Google, tujuan Gemini 3.1 Flash TTS adalah memberikan pengalaman suara yang lebih alami. Mendukung lebih dari 70 bahasa, termasuk Jepang, Hindi, Jerman, dan lainnya.
Selain itu, semua output disematkan watermark SynthID. Langkah ini dianggap bertujuan memudahkan identifikasi konten suara yang dihasilkan AI, sebagai langkah antisipasi terhadap potensi penyebaran deepfake atau informasi palsu di masa depan.
Peringkat kedua dalam pengujian buta… pengembang dapat langsung menggunakan
Kinerja model ini juga telah divalidasi dalam tingkat tertentu. Dalam “Artificial Analysis TTS Ranking” yang menilai preferensi manusia secara buta sebanyak ribuan kali, Gemini 3.1 Flash TTS meraih skor 1211 dan menempati posisi kedua secara keseluruhan. Google menyatakan bahwa ini menunjukkan model ini mendapatkan penilaian yang lebih tinggi dibandingkan beberapa model TTS populer lainnya.
Saat ini, pengembang dapat langsung menggunakan model ini melalui Gemini API dan Google AI Studio. Pelanggan perusahaan dapat mengaksesnya melalui Vertex AI, sementara pengguna umum dapat mencoba fitur ini di Google Biz.
Peluncuran ini menunjukkan bahwa kompetisi dalam AI generatif sedang berkembang dari teks dan gambar ke bidang suara. Terutama dengan meningkatnya permintaan dari pasar dukungan pelanggan perusahaan, produksi media, pendidikan, dan pembuatan konten digital untuk “suara AI yang alami”, Gemini 3.1 Flash TTS kemungkinan akan semakin meningkatkan tingkat persaingan di pasar terkait.