Breaking News

Platform Evaluasi Komparatif AI membantu perusahaan utama untuk memanipulasi tindakan model mereka, kata penelitian ini

Platform Evaluasi Komparatif AI membantu perusahaan utama untuk memanipulasi tindakan model mereka, kata penelitian ini

Titik referensi untuk kecerdasan buatan (AI) Chatbots menghadapi pengawasan para peneliti yang mengklaim bahwa bukti mereka mendukung model yang dipatenkan dari perusahaan teknologi besar.

LM Arena secara efektif menempatkan dua model besar tidak teridentifikasi (LLM) dalam pertempuran untuk melihat mana yang paling dapat membahas pemberitahuan, dengan pengguna titik referensi yang memberikan suara untuk hasil yang paling mereka sukai. Hasilnya diumpankan dalam tabel klasifikasi yang melacak model mana yang bekerja lebih baik dan bagaimana mereka telah meningkat.

Sumber