Operai rata -rata untuk membuat perubahan untuk menghindari sycophancy chatgpt di masa depan

Opadai Dia bilang dia akan membuat perubahan Dengan cara di mana AI memodelkan pembaruan power chatgpt, setelah insiden yang menyebabkan platform menjadi terlalu sycopophant bagi banyak pengguna.

Akhir pekan lalu, setelah Operai meluncurkan penyesuaian GPT-4O – Model yang telah ditentukan yang memberi makan chatgpt – pengguna di jejaring sosial menunjukkan bahwa chatgpt mulai merespons terlalu valid dan menyenangkan. Dia dengan cepat menjadi meme. Pengguna menerbitkan screenshot chatgpt memuji semua jenis bermasalah, berbahaya keputusan Dan Ide.

Di sebuah posting X pada hari Minggu lalu, CEO Sam Altman Diakui Masalahnya dan mengatakan Openai akan bekerja dalam koreksi “sesegera mungkin.” Selasa, Altman diumumkan Pembaruan GPT-4O akan kembali dan Openai sedang mengerjakan “solusi tambahan” untuk kepribadian model.

Perusahaan menerbitkan a autopsi Pada hari Selasa, dan dalam posting blog pada hari Jumat, OpenAI memperluas penyesuaian spesifik yang berencana untuk melakukan proses implementasinya.

Operai mengatakan dia berencana untuk memperkenalkan “fase alpha” berlangganan untuk beberapa model yang memungkinkan pengguna chatgpt tertentu untuk menguji model dan memberikan umpan balik sebelum diluncurkan. Perusahaan juga mengatakan bahwa itu akan mencakup penjelasan tentang “keterbatasan yang diketahui” untuk pembaruan bertahap di masa mendatang untuk model di ChatGpt, dan menyesuaikan proses peninjauan keamanannya untuk secara resmi mempertimbangkan “masalah perilaku model” seperti kepribadian, penipuan, keandalan dan halusinasi (yaitu, ketika model menciptakan sesuatu) sebagai kekhawatiran “peluncuran blok”.

“Di masa depan, kami akan berkomunikasi secara proaktif pada pembaruan yang kami lakukan pada model di ChatGPT, apakah” halus “atau tidak,” tulis Openai dalam publikasi blog. “Bahkan jika masalah ini tidak dapat diukur dengan sempurna hari ini, kami berkomitmen untuk memblokir rilis berdasarkan pengukuran proxy atau sinyal kualitatif, bahkan ketika metrik seperti tes A/B terlihat bagus.”

Kami melewatkan merek dengan pembaruan GPT-4 minggu lalu.

Apa yang terjadi, apa yang kami pelajari dan beberapa hal yang akan kami lakukan secara berbeda di masa depan: https://t.co/er1gmyric

– Sam Altman (@sama) 2 Mei 2025

Solusi yang dijanjikan terjadi karena lebih banyak orang menggunakan chatgpt untuk mendapatkan saran. Menurut survei terbaru Dengan permintaan keuangan mengekspresikan pembiayaan hukum, 60% orang dewasa Amerika telah menggunakan chatgpt untuk mencari nasihat atau informasi. Ketergantungan chatgpt yang berkembang, dan basis pengguna yang sangat besar dari platform, meningkatkan taruhan ketika masalah seperti Sycophycia ekstrem muncul, belum lagi halusinasi dan kekurangan teknis lainnya.

Acara TechCrunch

Berkeley, CA.
|
5 Juni

Pesan sekarang

Sebagai langkah yang meringankan, awal pekan ini, Openai mengatakan bahwa ia akan bereksperimen dengan cara untuk memungkinkan pengguna memberikan “komentar nyata waktu” untuk “secara langsung mempengaruhi interaksi mereka” dengan chatgpt. Perusahaan juga mengatakan bahwa mereka akan memperbaiki teknik untuk menjauhkan model Skofancia, berpotensi memungkinkan orang untuk memilih di antara berbagai model kepribadian di chatgpt, mengembangkan pagar keamanan tambahan dan memperluas evaluasi untuk membantu mengidentifikasi masalah di luar Skica.

“Salah satu pelajaran terpenting adalah sepenuhnya mengenali bagaimana orang -orang mulai menggunakan chatgpt untuk saran yang sangat pribadi, sesuatu yang tidak banyak kita lihat setahun yang lalu,” lanjut Openai dalam posting blognya. “Pada waktu itu, ini bukan pendekatan utama, tetapi karena AI dan masyarakat telah berkembang bersama, jelas bahwa kita perlu menangani kasus yang sangat berhati-hati. Sekarang ini akan menjadi bagian yang lebih signifikan dari pekerjaan keamanan kita.”

Sumber

Breaking News

Will Levis mengatakan bahwa situasinya saat ini ‘bau’ saat bersaing dengan Cam Ward untuk menjadi Titans ‘QB1

Mengapa Immobi bertaruh pada Lucknow sebagai pusat pertumbuhan teknologi berikutnya

$ 5,2 juta jet pemula terus menerangi: ‘Tuhanku’

Chelsea Menang Final Liga Europa Conference 2024-2025 Untuk menyelesaikan gelar UEFA yang ditetapkan dalam pendapatan untuk pemilik AS

CEO Zepto, Aadit Palicha, menuduh CFO perusahaan saingannya ras Ruestis, kampanye spam melawan mereka selama hari -hari terakhir untuk menyebarkan narasi negatif

Menteri Iklim Pakistan yang baru tentang air, keadilan dan dunia pemanasan | Berita | Ekologis

Keluarga terkaya di dunia bernilai lebih dari dua negara gabungan Eropa | Dunia | Berita

Bisakah agen atau nol datang ke olahraga sekolah menengah?

Josh Allen memalingkan kepalanya pada hari pertama dengan tagihan

Apa yang digunakan untuk peluncuran di Australian Cricket League? Temukan jawaban yang benar untuk membuka kunci pencarian google googly hari ini

Operai rata -rata untuk membuat perubahan untuk menghindari sycophancy chatgpt di masa depan

Karna Kadur, Musa Sherif Top APRC, INRC untuk ganda yang bagus

Rob Pelinka de Lakers membuat rencana yang jelas untuk memperbaiki perdagangan Anthony Davis

Breaking News

Related Post