Pada akhir Maret lalu, Openai mengumumkan “pratinjau skala kecil” dari layanan AI, Mesin suarabahwa perusahaan mengatakan bahwa suara seseorang dapat mengkloning hanya dengan 15 detik pidato. Kira -kira setahun kemudian, alat ini tetap ada dalam pratinjau, dan Operai belum memberikan indikasi kapan akan diluncurkan, atau jika akan diluncurkan sama sekali.
Keengganan perusahaan untuk menyebarkan layanan dapat secara luas menunjukkan ketakutan akan penyalahgunaan, tetapi itu juga bisa mencerminkan upaya untuk menghindari mengundang pengawasan peraturan. Openai secara historis telah dituduh untuk memprioritaskan “produk brilian” dengan mengorbankan keamanan dan Diluncurkan melalui darat untuk mengatasi perusahaan saingan ke pasar.
Dalam sebuah pernyataan, seorang juru bicara OpenAI mengatakan kepada TechCrunch bahwa perusahaan terus menguji mesin suara dengan serangkaian “mitra tepercaya” terbatas.
“[We’re] Belajar dari caranya [our partners are] Penggunaan teknologi sehingga kita dapat meningkatkan kegunaan dan keamanan model, ”kata juru bicara itu. “Kami sangat senang melihat berbagai cara di mana mereka digunakan, dari terapi wicara, hingga pembelajaran bahasa, hingga layanan pelanggan, hingga karakter video game, hingga avatar AI.”
Didorong kembali
Mesin Suara, yang menggerakkan suara yang tersedia di API teks untuk suara Openai, serta chatgpt. Mode suaraIni menghasilkan pidato suara alami yang sangat mirip dengan pembicara asli. Alat ini mengubah karakter yang ditulis dalam pidato, hanya dibatasi oleh pagar tertentu dalam konten. Tetapi dapat berubah penundaan dan jendela dari awal.
Seperti Operai dijelaskan dalam sebuah Juni 2024 BlogModel mesin suara belajar memprediksi suara yang paling mungkin dilakukan oleh pembicara untuk transkripsi teks yang diberikan, dengan mempertimbangkan suara, aksen, dan gaya bicara yang berbeda. Setelah ini, model dapat menghasilkan tidak hanya versi berbicara tentang teks, tetapi juga “pernyataan lisan” yang mencerminkan bagaimana berbagai jenis pembicara akan membaca teks dengan keras.
Awalnya, Operai bermaksud membawa mesin suara, awalnya disebut Voices Custom, ke API -nya pada 7 Maret 2024, menurut sebuah draft blog yang dilihat oleh TechCrunch. Rencananya adalah untuk memberikan sekelompok hingga 100 akses “pengembang tepercaya” sebelum debut yang lebih luas, dengan prioritas diberikan kepada pengembang aplikasi yang memberikan “manfaat sosial” atau menunjukkan “penggunaan yang inovatif dan bertanggung jawab” dari teknologi. Openai memiliki genap Merek dagang terdaftar Dan dia mengaturnya: $ 15 per juta karakter untuk suara “standar” dan $ 30 per juta karakter untuk suara “kualitas HD”.
Kemudian, pada saat kesebelas, perusahaan menunda pengumuman. Operai akhirnya menyajikan mesin suara beberapa minggu kemudian tanpa opsi pendaftaran. Akses ke alat ini akan tetap terbatas pada kelompok sekitar 10 pengembang yang dengannya perusahaan mulai bekerja pada akhir 2023, kata Openai.
“Kami berharap untuk memulai dialog tentang penyebaran suara sintetis yang bertanggung jawab dan bagaimana masyarakat dapat beradaptasi dengan kemampuan baru ini,” Openai menulis dalam publikasi Blog Iklan Mesin Suara Pada akhir Maret 2024. “Berdasarkan percakapan ini dan hasil tes skala kecil ini, kami akan membuat keputusan yang lebih tepat tentang apakah akan menerapkan teknologi ini pada skala.”
Proses panjang
Mesin suara telah dalam proses sejak 2022, menurut OpenAI. Perusahaan klaim Dia mendemonstrasikan alat itu ke “perumusan kebijakan global di level tertinggi” pada musim panas 2023 untuk menunjukkan potensi dan risiko mereka.
Beberapa mitra memiliki akses ke mesin suara hari ini, termasuk Startup Livox, yang membangun perangkat yang memungkinkan para penyandang cacat untuk berkomunikasi lebih alami. CEO Carlos Pereira mengatakan kepada TechCrunch, sementara Livox akhirnya tidak dapat memasukkan mesin suara ke dalam suatu produk karena persyaratan alat online (banyak pelanggan Livox tidak memiliki internet), ia menemukan bahwa teknologi “sangat mengesankan.”
“Kualitas suara dan kemungkinan suara berbicara dalam berbagai bahasa adalah unik, terutama untuk orang -orang cacat, klien kami,” kata Pereira kepada TechCrunch melalui email. “Ini benar -benar yang paling mengesankan dan mudah digunakan [tool to] Buat suara yang telah saya lihat […] Kami berharap Operai mengembangkan versi off -line segera. “
Pereira mengatakan bahwa dia belum menerima orientasi openai dalam kemungkinan peluncuran mesin suara, dia juga tidak melihat tanda bahwa perusahaan berencana untuk mulai mengenakan biaya untuk layanan tersebut. Sampai sekarang, Livox tidak harus membayar untuk penggunaannya.
Pada bulan Juni 2024 yang disebutkan di atas, Operai mengisyaratkan bahwa salah satu pertimbangannya untuk menunda mesin suara adalah potensi penyalahgunaan selama siklus pemilihan Amerika Serikat tahun lalu. Diinformasikan oleh diskusi dengan pihak -pihak yang berkepentingan, mesin suara memiliki beberapa langkah keselamatan yang meringankan, termasuk merek air untuk melacak asal audio yang dihasilkan.
Pengembang harus memperoleh “persetujuan eksplisit” dari pembicara asli sebelum menggunakan mesin suara, menurut Openai, dan harus membuat “wahyu yang jelas” kepada audiens mereka bahwa suara -suara tersebut dihasilkan oleh AI. Namun, perusahaan belum mengatakan bagaimana kebijakan ini ditegakkan. Melakukannya dalam skala bisa sangat menantang, bahkan untuk perusahaan dengan sumber daya operai.
Dalam posting blognya, Openai juga menyiratkan bahwa ia berharap dapat membangun “pengalaman otentikasi suara” untuk memverifikasi speaker dan daftar “tidak pergi” yang menghindari penciptaan suara yang terdengar terlalu mirip dengan tokoh -tokoh terkemuka. Keduanya adalah proyek yang ambisius secara teknologi, dan melakukannya dengan buruk akan sangat tercermin dalam perusahaan yang sering dituduh Rilis Inisiatif Keselamatan.
Penyaringan dan verifikasi V yang efektif dengan cepat menjadi persyaratan referensi untuk teknologi kloning suara yang bertanggung jawab. Kloning suara AI adalah penipuan yang paling cepat berkembang dari tahun 2024, Menurut sebuah sumber. Telah mengarah ke tipuan Dan Pemeriksaan Keselamatan Bank Dihindari sebagai undang -undang privasi dan hak cipta berjuang untuk mengimbangi. Aktor jahat telah menggunakan kloning suara untuk menciptakan pembakar yang dalam Selebriti Dan politisiDan mereka yang dalam menyebar dengan cepat Di jejaring sosial.
Operai dapat meluncurkan mesin suara minggu depan, atau tidak pernah. Perusahaan telah berulang kali mengatakan bahwa sedang menimbang pemeliharaan layanan dalam ruang lingkup. Tetapi satu hal yang jelas: untuk alasan optik, alasan keamanan atau keduanya, pandangan terbatas dari mesin suara telah menjadi salah satu yang terpanjang dalam sejarah openai.