Dalam apa yang tampaknya merupakan pukulan tambahan untuk kemampuan di mana kita berpikir bahwa komputer tidak akan pernah mengatasi kita, para ilmuwan sekarang menyarankan agar AI memahami emosi lebih baik daripada kita.
Para ilmuwan telah menemukan bahwa AI memahami emosi lebih baik dari kita, mencetak skor jauh lebih tinggi dari rata -rata orang untuk memilih jawaban yang benar untuk menyebarkan beberapa situasi dengan beban emosional
Dalam studi baru diterbitkan 21 Mei di koran Psikologi KomunikasiIlmuwan dari University of Geneva (Unige) dan Tes University of Bern (Unibe) menerapkan Tes Kecerdasan Emosional (IE) yang digunakan (TANGKAI, Steu, Gemok-Blends, Regulasi GECO dan manajemen GECO) Untuk model bahasa besar (LLM), termasuk chatgpt-4, chatgpt-O1, Gemini 1.5 Flash, Claude 3.5 Haiku, Copilot 365 dan Deepseek V3.
Mereka sedang menyelidiki dua hal: pertama, membandingkan kinerja AI dan subjek manusia, dan kedua, kemampuan untuk membuat pertanyaan uji coba baru yang mematuhi keperluan tes EI.
Ketika mempelajari respons manusia divalidasi dari penelitian sebelumnya, LLMS memilih respons “benar” dalam tes kecerdasan emosional 81% dari waktu, tergantung pada pendapat para ahli manusia, dibandingkan dengan 56% untuk manusia.
Ketika ChatGPT diminta untuk membuat pertanyaan persidangan baru, penasihat manusia mengatakan upaya ini menghadapi bukti asli dalam hal kesulitan yang setara dan membersihkan persepsi bahwa mereka tidak memparafrasekan pertanyaan asli. Korelasi antara tes yang dihasilkan oleh AI dan asli digambarkan sebagai “kuat”, dengan koefisien korelasi 0,46 (di mana 1.0 mengacu pada korelasi yang sempurna dan 0 mengacu pada korelasi apa pun).
Kesimpulan umum adalah bahwa AI lebih baik “memahami” emosi daripada kita.
Cerita terdalam
Ketika Live Science berkonsultasi dengan beberapa ahli, masalah umum dalam jawaban mereka adalah memiliki metodologi yang kuat dalam pikiran. Setiap tes umum yang digunakan adalah pilihan ganda, nyaris tidak berlaku untuk skenario dunia nyata di mana ketegangan antara orang -orang tinggi, kata mereka.
“Perlu dicatat bahwa manusia tidak selalu menyetujui apa yang dirasakan orang lain, dan bahkan psikolog dapat menafsirkan sinyal emosional secara berbeda,” kata industri keuangan dan pakar keamanan informasi Taimur Ijlal. “Lalu, ‘memukul’ manusia dalam tes seperti ini tidak berarti bahwa AI memiliki visi yang lebih dalam. Ini berarti bahwa itu memberikan respons yang secara statistik lebih sering diharapkan.”
Kemampuan studi bukanlah kecerdasan emosional, tetapi sesuatu yang lain, tambah mereka. “Sistem IA sangat baik dalam pengenalan pola, terutama ketika sinyal emosional mengikuti struktur yang dapat dikenali sebagai ekspresi wajah atau sinyal linguistik,” kata Nauman Jaffar, pendiri dan CEO klinis, alat dokumentasi yang dibuat untuk para profesional kesehatan mental. “Tetapi menyamakan bahwa dengan” pemahaman “yang lebih dalam tentang emosi manusia berisiko melebih -lebihkan apa yang sebenarnya dilakukan AI.”
Kuesioner dalam lingkungan terstruktur dan kuantitatif, alih -alih apresiasi dari nuansa terdalam yang dibutuhkan oleh pemahaman emosional sejati, adalah tempat AI bersinar, dan beberapa ahli menunjukkan poin penting: bahwa AI bekerja paling baik dalam tes pada situasi emosional yang tidak dalam panasnya momen, cara di mana manusia mengalaminya.
Jason Hennessey, pendiri dan CEO Hennessy Digital – Siapa yang telah menghabiskan waktu bertahun -tahun menganalisis bagaimana pencarian dan sistem AI generatif memproses bahasa bahasa? Tes membaca pikiran di mata. Ini adalah alat umum untuk mengukur keadaan emosi suatu subjek dan AI telah menunjukkan janji di. Tetapi seperti yang dikatakan Hennessey, ketika variabel -variabel sama rutinnya dengan pencahayaan dalam konteks fotografi atau budaya perubahan dalam tes tersebut, “ketepatan AI menjatuhkan tebing.”
Secara umum, sebagian besar ahli menemukan bahwa pernyataan “memahami” emosi lebih baik daripada manusia secara berlebihan.
“Apakah itu menunjukkan bahwa LLM berguna untuk mengklasifikasikan reaksi emosional umum?” kata Wyatt Mayham, pendiri Northwest IT Consulting. “Tentu saja. Tapi itu seperti mengatakan bahwa seseorang adalah terapis yang hebat karena mereka mencetak gol dengan baik dalam kuesioner buzzfeed dengan tema emosional.”
Tetapi ada peringatan akhir, dengan bukti bahwa meskipun AI menggunakan pengakuan pola alih -alih pemahaman emosional sejati, ia telah melampaui manusia untuk mengidentifikasi dan menanggapi keadaan emosi dalam setidaknya satu contoh.
Aílton, AI percakapan yang digunakan oleh lebih dari 6.000 pengemudi truk jarak panjang di Brasil, adalah asisten multimoda WhatsApp yang menggunakan suara, teks dan gambar, dan pengembang, CEO dan Kepala Ilmuwan Marcos Alves Hal-aiDia mengatakan bahwa Aílton mengidentifikasi stres, kemarahan atau kesedihan dengan sekitar 80% presisi, sekitar 20 poin di atas rekan manusia mereka, semua dalam konteks dalam situasi emosional ketika pengemudi berinteraksi dengannya secara real time.
Dalam satu kasus, Aílton merespons dengan cepat dan tepat ketika seorang pengemudi mengirim catatan suara tertekan 15 detik setelah kecelakaan fatal seorang kolega, menanggapi dengan belasungkawa yang bernuansa, menawarkan sumber daya kesehatan mental dan secara otomatis memperingatkan manajer armada.
“Ya, sketsa teks pilihan ganda menyederhanakan pengakuan emosi,” kata Alves. “Empati nyata adalah kontinu dan multimodal. Tetapi mengisolasi lapisan kognitif berguna. Ini mengungkapkan jika LLM dapat mendeteksi sinyal emosional sebelum menambahkan kebisingan situasional.”
Dia menambahkan kemampuan LLM untuk menyerap miliaran doa dan ribuan jam audio percakapan berarti bahwa dia dapat menyandikan tanda -tanda mikro manusia. “Konfigurasi laboratorium terbatas,” katanya tentang penelitian ini, “tetapi data WhatsApp kami menegaskan bahwa LLM modern sudah mendeteksi dan merespons lebih baik daripada kebanyakan orang, menawarkan empati yang dapat diskalakan pada skala.”