Breaking News

PlayAI mengkloning suara sesuai permintaan

PlayAI mengkloning suara sesuai permintaan

Pada tahun 2016, Hammad Syed dan Mahmoud Felfel, mantan insinyur WhatsApp, berpikir akan keren jika membuat ekstensi Chrome text-to-speech untuk artikel Medium. Ekstensi, yang dapat membacakan cerita Medium apa pun, muncul di Product Hunt. Setahun kemudian, seluruh bisnis muncul.

“Kami melihat peluang lebih besar dalam membantu orang dan organisasi membuat konten audio realistis untuk aplikasi mereka,” kata Syed kepada TechCrunch. “Tanpa perlu membuat model sendiri, mereka dapat menerapkan pengalaman berbicara berkualitas manusia dengan lebih cepat dari sebelumnya.”

Perusahaan Syed dan Felfel, Mainkan AI (sebelumnya PlayHT), menyebut dirinya sebagai “antarmuka suara AI”. Pelanggan dapat memilih dari beberapa suara yang telah ditentukan sebelumnya atau mengkloning suara dan menggunakan API PlayAI untuk mengintegrasikan text-to-speech ke dalam aplikasi mereka.

Sakelar tersebut memungkinkan pengguna untuk mengatur intonasi, irama, dan tenor suara.

PlayAI juga menawarkan “ruang bermain” di mana pengguna dapat mengunggah file untuk menghasilkan versi baca dengan lantang dan panel untuk membuat narasi audio dan sulih suara yang lebih halus. Baru-baru ini, perusahaan memasuki “Agen AI”Saya bermain dengan alat yang dapat digunakan untuk mengotomatiskan tugas-tugas seperti menjawab panggilan pelanggan di sebuah perusahaan.

Fitur agen PlayAI, yang membangun alat otomatisasi di sekitar mesin text-to-speech perusahaan. Kredit gambar:Mainkan AI

Salah satu eksperimen PlayAI yang paling menarik adalah PlayNote, yang mengubah PDF, video, foto, lagu, dan file lainnya menjadi acara bergaya podcast, ringkasan yang dibacakan, diskusi empat mata, dan bahkan cerita anak-anak. Seperti milik Google Buku CatatanLMPlayNote menghasilkan skrip dari file atau URL yang diunggah dan mengirimkannya ke kumpulan model AI, yang bersama-sama menghasilkan produk jadi.

Saya mencobanya dan hasilnya tidak terlalu buruk. Pengaturan “podcast” PlayNote menghasilkan klip yang kira-kira setara dengan NotebookLM dalam hal kualitas, dan kemampuan alat untuk menyerap foto dan video menghasilkan kreasi yang menarik. Melihat gambar hidangan tahi lalat ayam yang saya makan baru-baru ini, PlayNote menulis skrip podcast berdurasi lima menit tentangnya. Sungguh, kita hidup di masa depan.

Tentu saja, alat tersebut, seperti semua alat AI, menghasilkan artefak aneh dan halusinasi dari waktu ke waktu. Dan meskipun PlayNote akan melakukan yang terbaik untuk mengadaptasi file ke format pilihan Anda, jangan berharap, katakanlah, presentasi hukum yang kering untuk mendapatkan materi sumber terbaik. Lihat: itu Gugatan antara Musk dan OpenAI dibingkai sebagai cerita pengantar tidur:

Format podcast PlayNote dimungkinkan oleh model terbaru PlayAI, PlayDialog, yang menurut Syed dapat menggunakan “konteks dan riwayat” percakapan untuk menghasilkan ucapan yang mencerminkan alur percakapan. “Menggunakan konteks historis percakapan untuk mengontrol prosodi, emosi, dan tempo, PlayDialog menghadirkan percakapan dengan penyampaian yang natural dan nada yang sesuai,” lanjutnya.

PlayAI, yang merupakan saingan dekat ElevenLabs, telah melakukannya dikritik di masa lalu karena pendekatan laissez-faire terhadap keamanan. Alat kloning suara perusahaan mengharuskan pengguna untuk mencentang kotak yang menunjukkan bahwa mereka “memiliki semua hak atau persetujuan yang diperlukan” untuk mengkloning suara, namun tidak ada mekanisme penegakan hukum. Saya tidak kesulitan membuat tiruan suara Kamala Harris dari sebuah rekaman.

Hal ini mengkhawatirkan mengingat potensi penipuan Dan palsu.

Dialog pemutaran
Model PlayDialog PlayAI dapat menghasilkan percakapan “dupleks” dua hari yang terdengar relatif alami. Kredit gambar:Mainkan AI

PlayAI juga mengklaim bahwa mereka secara otomatis mendeteksi dan memblokir “konten seksual, menyinggung, rasis, atau mengancam.” Tapi itu tidak terjadi dalam pengujian saya. Saya menggunakan tiruan Harris untuk menghasilkan pidato yang, sejujurnya, tidak dapat saya sematkan di sini, dan saya tidak pernah melihat pesan peringatan.

Sementara itu, portal komunitas PlayNote, yang penuh dengan konten yang dibuat secara publik, memiliki file judul yang eksplisit sebagai “Wanita yang melakukan seks oral.”

Syed memberi tahu saya bahwa PlayAI merespons laporan suara yang dikloning tanpa persetujuan, seperti inimemblokir pengguna yang bertanggung jawab dan segera menghapus suara kloning. Dia juga berpendapat bahwa klon suara dengan ketelitian lebih tinggi dari PlayAI, yang memerlukan sampel suara berdurasi 20 menit, harganya lebih tinggi ($49 per bulan ditagih setiap tahun atau $99 per bulan) daripada yang bersedia dibayar oleh sebagian besar penipu.

“PlayAI memiliki beberapa perlindungan etika,” kata Syed. “Kami telah menerapkan mekanisme yang kuat untuk mengidentifikasi apakah suatu suara disintesis menggunakan teknologi kami, misalnya. Jika ada penyalahgunaan yang dilaporkan, kami segera memverifikasi asal konten dan mengambil tindakan tegas untuk memperbaiki situasi dan mencegah pelanggaran etika lebih lanjut.”

Saya tentu berharap hal ini terjadi dan PlayAI akan menjauh dari hal tersebut Kampanye pemasaran dengan selebriti teknologi yang sudah meninggal.. Jika moderasi PlayAI tidak kuat, PlayAI dapat menghadapi tantangan hukum Tennesseeyang memiliki undang-undang yang mencegah platform menampung AI untuk membuat rekaman suara seseorang tanpa izin.

Pendekatan PlayAI untuk melatih AI kloning suaranya juga agak teduh. Perusahaan tidak akan mengungkapkan dari mana mereka mendapatkan data untuk modelnya, tampaknya karena alasan persaingan.

“PlayAI terutama menggunakan kumpulan data terbuka, [as well as licensed data] dan kumpulan data eksklusif yang dibuat sendiri,” kata Syed. “Kami tidak menggunakan data dari pengguna produk dalam pelatihan atau dari pencipta untuk melatih model. “Model kami dilatih dengan jutaan jam ucapan manusia di kehidupan nyata, menghasilkan suara dalam gender pria dan wanita dalam berbagai bahasa dan aksen.”

Sebagian besar model AI dilatih dengan data dari web publik, beberapa di antaranya mungkin memiliki hak cipta atau lisensi terbatas. Banyak vendor AI yang mempertahankan hal itu penggunaan wajar Doktrin ini melindungi mereka dari klaim hak cipta. Namun hal itu tidak menghentikan pemilik data dari Ajukan tuntutan hukum class action yang menuduh bahwa penyedia menggunakan data Anda tanpa izin..

PlayAI belum dituntut. Namun, persyaratan layanan mereka. menyarankan Ini tidak akan membantu pengguna jika mereka berada di bawah ancaman hukum.

Platform kloning suara seperti PlayAI menghadapi kritik dari para aktor yang khawatir bahwa pekerjaan suara pada akhirnya akan digantikan oleh suara yang dihasilkan oleh AI dan bahwa para aktor hanya memiliki sedikit kendali atas bagaimana digital ganda mereka digunakan.

Persatuan aktor Hollywood SAG-AFTRA telah mencapai kesepakatan dengan beberapa perusahaan rintisan, termasuk pasar bakat online Narrativ dan Replica Studios, untuk apa yang mereka gambarkan sebagai kesepakatan kloning suara yang “adil” dan “etis”. Namun tautan ini pun terpengaruh pengawasan yang intensbahkan dari anggota SAG-AFTRA sendiri.

Di California, undang-undang mewajibkan perusahaan yang mengandalkan replika digital artis (misalnya, suara kloning) untuk memberikan deskripsi tujuan penggunaan replika tersebut dan bernegosiasi dengan penasihat hukum artis. Mereka juga mengharuskan perusahaan hiburan untuk mendapatkan persetujuan dari harta milik almarhum artis sebelum menggunakan tiruan digital dari orang tersebut.

Syed mengatakan PlayAI “menjamin” bahwa setiap klon suara yang dihasilkan melalui platformnya adalah unik bagi pembuatnya. “Eksklusivitas ini sangat penting untuk melindungi hak kreatif pengguna,” tambahnya.

Meningkatnya beban hukum menjadi kendala bagi PlayAI. Lainnya adalah persaingan. cangkir kertas, sulih suara yang dalam, Acapella, HormatDan Suara.aiserta perusahaan teknologi besar Amazon, Microsoft dan Google, menawarkan alat kloning suara dan sulih suara AI. ElevenLabs yang disebutkan di atas, salah satu penyedia kloning suara paling terkenal, dikatakan demikian pengangkatan dana baru dengan penilaian lebih dari $3 miliar.

Meski demikian, PlayAI tidak kesulitan mencari investor. Bulan ini, perusahaan yang didukung Y Combinator menutup putaran pendanaan senilai $20 juta yang dipimpin bersama oleh 500 Startups dan Kindred Ventures, sehingga total modalnya terkumpul menjadi $21 juta. Race Capital dan 500 Global juga berpartisipasi.

“Modal baru ini akan digunakan untuk berinvestasi pada model suara AI generatif dan platform agen suara kami, dan untuk mempersingkat waktu yang diperlukan bagi perusahaan untuk menciptakan pengalaman bicara berkualitas manusia,” kata Syed, seraya menambahkan bahwa PlayAI berencana untuk memperluas tenaga kerjanya sebesar 40 orang. .

Sumber