A analisa Dengan AI Epoch, sebuah nirlaba, AI Research Institute menunjukkan bahwa industri AI mungkin tidak dapat memperoleh keuntungan kinerja besar -besaran dari model AI yang beralasan lebih lama. Segera setelah dalam satu tahun, kemajuan model penalaran dapat berkurang, menurut laporan laporan.
Model penalaran sebagai openai O3 Mereka telah menyebabkan keuntungan substansial pada titik referensi AI dalam beberapa bulan terakhir, terutama poin referensi yang mengukur keterampilan matematika dan pemrograman. Model dapat menerapkan lebih banyak komputasi untuk masalah, yang dapat meningkatkan kinerja mereka, dengan kelemahan yang mereka ambil lebih dari model konvensional untuk menyelesaikan tugas.
Model penalaran pertama kali mengembangkan dalam melatih model konvensional dalam sejumlah besar data, kemudian menerapkan teknik yang disebut pembelajaran penguatan, yang secara efektif memberikan model “umpan balik” tentang solusinya untuk masalah sulit.
Sampai sekarang, Frontier AI Labs sebagai OpenAI belum menerapkan sejumlah besar daya komputer pada tahap pembelajaran penguatan dari model penalaran, menurut Pofoch.
Itu berubah. Operai telah mengatakan bahwa ia menerapkan sekitar 10 kali lebih banyak ilmu komputer untuk melatih O3 daripada pendahulunya, O1, dan Epoch berspekulasi bahwa sebagian besar komputasi ini didedikasikan untuk pembelajaran penguatan. Dan peneliti operai Dan Roberts baru -baru ini mengungkapkan bahwa rencana masa depan perusahaan membutuhkan Memprioritaskan pembelajaran penguatan Gunakan lebih banyak daya komputer, bahkan lebih dari untuk pelatihan model awal.
Tetapi masih ada batasan untuk jumlah komputasi yang dapat diterapkan pada pembelajaran penguatan, per waktu.
Josh You, seorang analis zaman dan penulis analisis, menjelaskan bahwa keuntungan kinerja model standar saat ini kentut setiap tahun, sementara keuntungan kinerja pembelajaran penguatan tumbuh sepuluh kali setiap 3-5 bulan. Kemajuan pelatihan penalaran “mungkin akan bertemu dengan perbatasan umum pada tahun 2026,” lanjutnya.
Analisis Epoch membuat serangkaian asumsi dan sebagian didasarkan pada komentar publik para eksekutif perusahaan AI. Tetapi ia juga membela bahwa model penalaran skala dapat menjadi tantangan karena alasan selain ilmu komputer, termasuk biaya umum yang tinggi untuk penelitian.
“Jika diperlukan biaya penelitian yang gigih untuk penelitian, model penalaran mungkin tidak naik sejauh yang diharapkan,” tulisnya. “Skala komputasi yang cepat berpotensi merupakan bahan yang sangat penting dalam kemajuan model penalaran, jadi ada baiknya melacak ini dengan cermat.”
Sangat mungkin bahwa indikasi bahwa model penalaran dapat mencapai beberapa jenis batas dalam waktu dekat menyangkut industri AI, yang telah menginvestasikan sumber daya besar dalam pengembangan jenis model ini. Studi telah menunjukkan bahwa model penalaran, yang bisa sangat mahal untuk dijalankanMereka memiliki cacat serius, sebagai kecenderungan Halusinat lebih banyak Itu model konvensional tertentu.