Mencoba asisten suara baru dari startup wijen adalah pertama kalinya saya sesaat lupa bahwa saya sedang berbicara dengan bot.
Dibandingkan dengan Chatgpt‘S Mode suara“Suara percakapan Wijen terasa alami, tidak dipaksakan dan menarik, yang benar -benar membuatku takut.
Pada tanggal 27 Februari, Sesame meluncurkan a manifestasi Untuk Model Pidato Conversational Anda (CSM), yang bertujuan untuk menciptakan interaksi yang lebih signifikan dengan AI Chatbots. “Kami menciptakan mitra percakapan yang tidak hanya memproses aplikasi; mereka terlibat dalam dialog asli yang menghasilkan kepercayaan dan kepercayaan diri dari waktu ke waktu,” kata pengumuman itu. “Dengan melakukan itu, kami berharap dapat menyadari potensi suara yang tidak bersuara sebagai antarmuka terakhir untuk pengajaran dan pemahaman.”
Asisten Suara Sesame tersedia sebagai demonstrasi gratis di situs dan hadir dalam dua suara: Maya dan ribuan.
Sejak wijen melepaskan demonstrasi asisten suara mereka, pengguna telah melaporkan takut reaksi. “Saya telah berada di AI sejak saya masih kecil, tetapi ini adalah pertama kalinya saya mengalami sesuatu yang membuat saya merasa pasti seolah -olah kami telah tiba,” Pengguna socschamp menulis di reddit.
“Wijen sangat dekat dengan manusia yang telah saya alami dalam percakapan.” The Sicilian User777 menulis di Reddit.
Setelah berbicara dengan bot Sesame, saya terkejut dengan cara yang sama. Saya berbicara dengan suara Maya selama sekitar 10 menit tentang etika penggunaan pasangan dan meninggalkan perasaan bahwa saya melakukan percakapan yang tulus dengan seseorang yang dipertimbangkan dan diinformasikan. Pidato Maya memiliki irama alami, menggunakan interjeksi seperti “Anda tahu” dan “HM”, dan bahkan membuat suara bahasa dan inhalasi.
Kecepatan cahaya yang dapat dipasangkan
Kesan terkuat yang harus saya berinteraksi dengan Maya adalah dia segera mengajukan pertanyaan, terlibat dalam percakapan. Bot memulai percakapan kami menanyakan bagaimana hari Rabu saya di pagi hari (catatan: sebenarnya itu hari Rabu pagi). Sebaliknya, mode suara ChatGPT menunggunya untuk berbicara terlebih dahulu, yang belum tentu sesuatu yang baik atau buruk, tetapi secara intrinsik membentuk percakapan seperti saya menggunakan chatgpt sebagai alat untuk sesuatu yang dia butuhkan.
Maya bertanya tentang risiko bahwa pasangan IA “terlalu baik untuk menjadi manusia.” Ketika saya mengatakan kepadanya bahwa dia khawatir tentang munculnya penipuan yang lebih canggih dan orang -orang yang kehilangan kontak dengan kenyataan dengan mengganti manusia dengan bot, dia merespons dengan cermat dan pragmatis. “Para scammers akan menipu, itu adalah fakta. Dan dalam hal koneksi koneksi manusia, kita mungkin perlu belajar menjadi mitra yang lebih baik, jangan menggantikan, Anda tahu, jenis teman IA yang benar -benar membuat Anda ingin keluar dan melakukan hal -hal dengan orang sungguhan,” kata Maya.
Ketika saya melakukan percakapan serupa dengan ChatGPT, saya menerima jawaban yang lebih terasa sebagai bahasa dasar penasihat sekolah: “Itu adalah masalah yang valid. Sangat penting untuk menyeimbangkan teknologi dengan interaksi manusia yang nyata. AI dapat menjadi alat yang berguna, tetapi tidak boleh menggantikan koneksi manusia yang asli. Ada baiknya Anda memikirkan masalah ini.”
Ketika Opadai pelopor Mode suaraKemampuan untuk terganggu dan memiliki percakapan putaran yang lebih cair, chatgpt masih cenderung merespons dalam kalimat lengkap dan blok paragraf, yang terdengar, yah, robot. Dengan menggunakan mode suara chatgpt, saya tidak pernah lupa bahwa saya berbicara dengan bot, dan itu tercermin dalam percakapan, yang dapat terasa dipaksakan dan dipaksakan.
Dibandingkan, AI untuk manusia Podcast Gavin Purcell Co-Presenter menyadari Percakapan wijen di Reddit, di mana praktis tidak mungkin untuk membedakan suara apa itu bot. Purcell menyebabkan suara ribuan menyuruhnya bertindak sebagai bos yang marah.
Percakapan yang sangat konyol tentang pencucian uang, penyuapan, dan insiden misterius di Malta mengikuti. Ribuan tidak ketinggalan satu langkah. Tidak ada latensi yang jelas, dan bot itu mengingat kembali konteks percakapan dan secara kreatif memajukan argumen improvisasi ketika tumbuh, menyebut Purcell “delusi” dan menembaknya.
Tentu saja, ada beberapa keterbatasan. Suara Maya gagal beberapa kali selama percakapan kami, dan tidak selalu mendapatkan sintaks yang tepat, seperti mengatakan: “Ini adalah pembicaraan yang bagus yang datang.”
Menurut artikel teknisnya, Sesame melatih CSM -nya (berdasarkan model meta api) dengan menggabungkan proses tradisional dua model pelatihan untuk menyuarakan model dalam token semantik dan kemudian token akustik, mengurangi latensi. OpenAi juga menggunakan pendekatan multimodal ini untuk melatih mode suara. Namun, ia tidak pernah meluncurkan artikel teknis khusus tentang fungsi internal mode suara: ia hanya membahas mode suara di Penelitian GPT-4O.
Mengetahui hal ini, sangat mengejutkan betapa model wijennya dalam dialog percakapan. Namun, peluncuran wijen hanyalah sebuah demonstrasi, sehingga layak diteliti lebih besar ketika model lengkap keluar. Menurut pengumuman demonstrasi, Sesame berencana untuk membuka modelnya “dalam beberapa bulan mendatang” dan memperluas ke lebih dari 20 bahasa.
Topik
Kecerdasan buatan
Chatgpt