Breaking News

Bagaimana chatbots dari AI menyukai chatgpt dan alasan careseek

Bagaimana chatbots dari AI menyukai chatgpt dan alasan careseek

Pada bulan September, Openai merilis versi baru chatgpt Dirancang untuk bernalar melalui tugas yang melibatkan matematika, sains dan pemrograman komputer. Berbeda dengan versi chatbot sebelumnya, teknologi baru ini dapat menghabiskan waktu “berpikir” melalui masalah yang rumit sebelum memutuskan jawaban.

Segera, perusahaan mengatakan teknologi penalaran baru melampaui sistem industri terkemuka Dalam serangkaian Menguji yang melacak kemajuan kecerdasan buatan.

Sekarang perusahaan lain, seperti Google, Antropik dan Cina VeteranMenawarkan teknologi serupa.

Tapi bisakah AI benar -benar beralasan sebagai manusia? Apa artinya dipikirkan komputer? Apakah sistem ini benar -benar mendekati kecerdasan sejati?

Ini panduannya.

Penalaran hanya berarti bahwa Chatbot menghabiskan waktu tambahan untuk mengatasi masalah.

“Alasannya adalah ketika sistem melakukan pekerjaan tambahan setelah pertanyaan diajukan,” kata Dan Klein, seorang profesor ilmu komputer di University of California, Berkeley, dan direktur teknologi di Scaled Cognition, sebuah perusahaan AI baru.

Anda dapat menghentikan masalah dalam langkah -langkah individual atau mencoba menyelesaikannya melalui bukti dan kesalahan.

CHATGPT asli segera menjawab pertanyaan. Sistem penalaran baru dapat memecahkan masalah selama beberapa detik, atau bahkan menit, sebelum merespons.

Dalam beberapa kasus, sistem penalaran akan memperbaiki pendekatan Anda terhadap suatu pertanyaan, berulang kali mencoba meningkatkan metode yang telah Anda pilih. Di lain waktu, Anda dapat mencoba beberapa cara berbeda untuk mengatasi masalah sebelum memutuskan salah satunya. Atau Anda dapat kembali dan memverifikasi beberapa pekerjaan yang melakukan beberapa detik sebelumnya, hanya untuk melihat apakah itu benar.

Pada dasarnya, sistem mencoba apa yang bisa menjawab pertanyaan Anda.

Ini seperti siswa sekolah dasar yang berjuang untuk menemukan cara untuk memecahkan masalah matematika dan menulis beberapa opsi berbeda pada selembar kertas.

Berpotensi itu bisa beralasan tentang apa saja. Tetapi penalaran lebih efektif ketika mengajukan pertanyaan yang melibatkan matematika, sains dan pemrograman komputer.

Saya bisa meminta chatbots sebelumnya untuk menunjukkan kepadanya bagaimana mereka telah mencapai tanggapan tertentu atau untuk memverifikasi pekerjaan mereka sendiri. Karena chatgpt asli telah belajar dari internet, di mana orang menunjukkan bagaimana mereka telah menerima jawaban atau memverifikasi pekerjaan mereka sendiri, juga dapat melakukan refleksi diri jenis ini.

Tetapi sistem penalaran melangkah lebih jauh. Anda dapat melakukan hal semacam ini tanpa diminta. Dan dapat membuatnya lebih luas dan kompleks.

Perusahaan menyebutnya sistem penalaran karena tampaknya ia bekerja lebih sebagai orang yang berpikir tentang masalah yang sulit.

Perusahaan seperti Openai percaya bahwa ini adalah cara terbaik untuk meningkatkan chatbots mereka.

Selama bertahun -tahun, perusahaan -perusahaan ini didasarkan pada konsep sederhana: semakin banyak data internet memompa chatbots mereka, Semakin baik sistem tersebut akan dilakukan.

Tapi pada tahun 2024, mereka menggunakan hampir semua teks di internet.

Itu berarti bahwa mereka membutuhkan cara baru untuk meningkatkan chatbots mereka. Kemudian mereka mulai membangun sistem penalaran.

Tahun lalu, perusahaan seperti Openai mulai mendukung sebagian besar dalam teknik yang disebut Refory Learning.

Melalui proses ini, yang dapat diperpanjang selama berbulan -bulan, sistem AI dapat mempelajari perilaku melalui tes dan kesalahan yang luas. Saat bekerja melalui ribuan masalah matematika, misalnya, Anda dapat mempelajari metode mana yang mengarah pada jawaban yang benar dan mana yang tidak.

Para peneliti telah merancang mekanisme umpan balik yang kompleks yang menunjukkan sistem ketika telah melakukan sesuatu yang benar dan ketika telah melakukan sesuatu yang salah.

“Ini seperti melatih seekor anjing,” kata Jerry Tworek, seorang peneliti opera. “Jika sistem bekerja dengan baik, Anda memberikannya cookie. Jika tidak berfungsi dengan baik, Anda mengatakan ‘anjing buruk’.”

(The New York Times terdakwa Operai dan mitranya, Microsoft, pada bulan Desember untuk pelanggaran hak cipta konten berita yang terkait dengan sistem AI).

Ini bekerja dengan cukup baik di bidang -bidang tertentu, seperti matematika, sains dan pemrograman komputer. Ini adalah area di mana perusahaan dapat dengan jelas mendefinisikan perilaku yang baik dan buruk. Masalah matematika memiliki jawaban yang pasti.

Pembelajaran penguatan tidak berfungsi dengan baik di bidang sebagai penulisan kreatif, filsafat dan etika, di mana Perbedaan antara baik dan buruk Lebih sulit untuk diperbaiki. Para peneliti mengatakan bahwa proses ini umumnya dapat meningkatkan kinerja sistem AI, bahkan ketika Anda menjawab pertanyaan di luar matematika dan sains.

“Secara bertahap belajar pola penalaran mana yang membawanya ke arah yang benar dan mana yang tidak,” kata Jared Kaplan, direktur ilmiah Anthrope.

Tidak. Pembelajaran Penguatan adalah metode yang digunakan perusahaan untuk membangun sistem penalaran. Ini adalah tahap pelatihan yang akhirnya memungkinkan chatbots untuk bernalar.

Sangat. Segala sesuatu yang dilakukan chatbot didasarkan pada probabilitas. Pilih rute yang paling terlihat pada data yang Anda pelajari, apakah data ini berasal dari internet atau dihasilkan melalui pembelajaran penguatan. Terkadang memilih opsi yang salah atau tidak masuk akal.

IA para ahli dibagi menjadi pertanyaan ini. Metode -metode ini masih relatif baru, dan para peneliti masih berusaha memahami batasannya. Di bidang AI, metode baru sering berkembang sangat cepat di awal, sebelum mengurangi kecepatan.

Sumber