Breaking News

Operai rata -rata untuk membuat perubahan untuk menghindari sycophancy chatgpt di masa depan

Operai rata -rata untuk membuat perubahan untuk menghindari sycophancy chatgpt di masa depan

Opadai Dia bilang dia akan membuat perubahan Dengan cara di mana AI memodelkan pembaruan power chatgpt, setelah insiden yang menyebabkan platform menjadi terlalu sycopophant bagi banyak pengguna.

Akhir pekan lalu, setelah Operai meluncurkan penyesuaian GPT-4O – Model yang telah ditentukan yang memberi makan chatgpt – pengguna di jejaring sosial menunjukkan bahwa chatgpt mulai merespons terlalu valid dan menyenangkan. Dia dengan cepat menjadi meme. Pengguna menerbitkan screenshot chatgpt memuji semua jenis bermasalah, berbahaya keputusan Dan Ide.

Di sebuah posting X pada hari Minggu lalu, CEO Sam Altman Diakui Masalahnya dan mengatakan Openai akan bekerja dalam koreksi “sesegera mungkin.” Selasa, Altman diumumkan Pembaruan GPT-4O akan kembali dan Openai sedang mengerjakan “solusi tambahan” untuk kepribadian model.

Perusahaan menerbitkan a autopsi Pada hari Selasa, dan dalam posting blog pada hari Jumat, OpenAI memperluas penyesuaian spesifik yang berencana untuk melakukan proses implementasinya.

Operai mengatakan dia berencana untuk memperkenalkan “fase alpha” berlangganan untuk beberapa model yang memungkinkan pengguna chatgpt tertentu untuk menguji model dan memberikan umpan balik sebelum diluncurkan. Perusahaan juga mengatakan bahwa itu akan mencakup penjelasan tentang “keterbatasan yang diketahui” untuk pembaruan bertahap di masa mendatang untuk model di ChatGpt, dan menyesuaikan proses peninjauan keamanannya untuk secara resmi mempertimbangkan “masalah perilaku model” seperti kepribadian, penipuan, keandalan dan halusinasi (yaitu, ketika model menciptakan sesuatu) sebagai kekhawatiran “peluncuran blok”.

“Di masa depan, kami akan berkomunikasi secara proaktif pada pembaruan yang kami lakukan pada model di ChatGPT, apakah” halus “atau tidak,” tulis Openai dalam publikasi blog. “Bahkan jika masalah ini tidak dapat diukur dengan sempurna hari ini, kami berkomitmen untuk memblokir rilis berdasarkan pengukuran proxy atau sinyal kualitatif, bahkan ketika metrik seperti tes A/B terlihat bagus.”

Solusi yang dijanjikan terjadi karena lebih banyak orang menggunakan chatgpt untuk mendapatkan saran. Menurut survei terbaru Dengan permintaan keuangan mengekspresikan pembiayaan hukum, 60% orang dewasa Amerika telah menggunakan chatgpt untuk mencari nasihat atau informasi. Ketergantungan chatgpt yang berkembang, dan basis pengguna yang sangat besar dari platform, meningkatkan taruhan ketika masalah seperti Sycophycia ekstrem muncul, belum lagi halusinasi dan kekurangan teknis lainnya.

Acara TechCrunch

Berkeley, CA.
|
5 Juni


Pesan sekarang

Sebagai langkah yang meringankan, awal pekan ini, Openai mengatakan bahwa ia akan bereksperimen dengan cara untuk memungkinkan pengguna memberikan “komentar nyata waktu” untuk “secara langsung mempengaruhi interaksi mereka” dengan chatgpt. Perusahaan juga mengatakan bahwa mereka akan memperbaiki teknik untuk menjauhkan model Skofancia, berpotensi memungkinkan orang untuk memilih di antara berbagai model kepribadian di chatgpt, mengembangkan pagar keamanan tambahan dan memperluas evaluasi untuk membantu mengidentifikasi masalah di luar Skica.

“Salah satu pelajaran terpenting adalah sepenuhnya mengenali bagaimana orang -orang mulai menggunakan chatgpt untuk saran yang sangat pribadi, sesuatu yang tidak banyak kita lihat setahun yang lalu,” lanjut Openai dalam posting blognya. “Pada waktu itu, ini bukan pendekatan utama, tetapi karena AI dan masyarakat telah berkembang bersama, jelas bahwa kita perlu menangani kasus yang sangat berhati-hati. Sekarang ini akan menjadi bagian yang lebih signifikan dari pekerjaan keamanan kita.”



Sumber