Model AI yang ‘bernalar’ telah menjadi tren, baik atau buruk

Sebut saja itu kebangkitan penalaran.

Di dalamnya setelah peluncuran o1 OpenAIyang disebut model penalaran, telah terjadi ledakan model penalaran dari laboratorium AI saingannya. Pada awal November, DeepSeek, sebuah perusahaan riset AI yang didanai oleh pedagang kuantitas, merilis pratinjau algoritma penalaran pertamanya. DeepSeek-R1. Pada bulan yang sama, tim Qwen Alibaba tdk dpt tidur apa yang dia klaim adalah penantang “terbuka” pertama untuk o1.

Lalu apa yang membuka pintu air tersebut? Di satu sisi, pencarian pendekatan baru untuk menyempurnakan teknologi AI generatif. Seperti yang dikatakan rekan saya Max Zeff baru-baru ini dilaporkanTeknik “brute force” untuk memperluas model tidak lagi menghasilkan perbaikan seperti dulu.

Ada tekanan persaingan yang kuat terhadap perusahaan AI untuk mempertahankan laju inovasi saat ini. Menurut Menurut sebuah perkiraan, pasar AI global akan mencapai $196,63 miliar pada tahun 2023 dan dapat bernilai $1,81 triliun pada tahun 2030.

OpenAI, misalnya, mengklaim bahwa model penalaran dapat “memecahkan masalah yang lebih sulit” dibandingkan model sebelumnya dan mewakili langkah perubahan dalam pengembangan AI generatif. Namun tidak semua orang yakin bahwa model penalaran adalah cara terbaik.

Ameet Talwalkar, profesor pembelajaran mesin di Carnegie Mellon mengatakan mereka menganggap hasil awal dari model penalaran “cukup mengesankan.” Namun, pada saat yang sama, dia mengatakan kepada saya bahwa dia akan “mempertanyakan motif” siapa pun yang menyatakan dengan pasti bahwa mereka tahu sejauh mana model penalaran akan membawa industri ini.

“Perusahaan AI mempunyai insentif finansial untuk menawarkan proyeksi optimis mengenai kemampuan versi masa depan teknologi mereka,” kata Talwalkar. “Kami berisiko terlalu fokus pada satu paradigma saja, itulah mengapa sangat penting bagi komunitas riset AI pada umumnya untuk tidak mempercayai secara membabi buta upaya pemasaran dan hype dari perusahaan-perusahaan ini dan sebaliknya fokus pada hasil yang nyata.”

Dua kelemahan model penalaran adalah (1) mahal dan (2) boros energi.

Misalnya, di OpenAI API, perusahaan mengenakan biaya $15 untuk setiap ~750.000 kata analisis dan $60 untuk setiap ~750.000 kata yang dihasilkan model. Itu 3 hingga 4 kali lipat biaya model “tanpa alasan” terbaru OpenAI. GPT-4o.

O1 tersedia di platform chatbot bertenaga AI OpenAI, ObrolanGPTgratis dan terbatas. Namun awal bulan ini, OpenAI dimasukkan level o1 yang lebih canggih, mode o1 pro, yang biayanya $2.400 per tahun.

“Total biaya [large language model] Penalarannya tentu saja tidak berkurang,” kata Guy Van Den Broeck, profesor ilmu komputer di UCLA, kepada TechCrunch.

Salah satu alasan mengapa model penalaran sangat mahal adalah karena model tersebut memerlukan banyak sumber daya komputasi untuk dijalankan. Tidak seperti kebanyakan AI, o1 dan model penalaran lainnya mencoba memeriksa pekerjaan mereka sendiri saat melakukannya. Ini membantu mereka menghindari beberapa hal perangkap yang biasanya membuat model tersandung, namun kelemahannya adalah model tersebut sering kali membutuhkan waktu lebih lama untuk sampai pada solusi.

OpenAI membayangkan model penalaran masa depan yang akan “berpikir” selama berjam-jam, berhari-hari, atau bahkan berminggu-minggu. Biaya penggunaan akan lebih tinggi, perusahaan mengakui, namun manfaatnya (dari dari baterai inovatif hingga obat kanker baru – itu mungkin sepadan.

Proposisi nilai model penalaran saat ini kurang jelas. Costa Huang, peneliti dan insinyur pembelajaran mesin di organisasi nirlaba Ai2, mencatat bahwa o1 Ini bukan kalkulator yang sangat andal.. Dan penelusuran dangkal di media sosial menghasilkan a nomor o1 modus pro kesalahan.

“Model penalaran ini terspesialisasi dan mungkin berkinerja buruk di domain umum,” kata Huang kepada TechCrunch. “Beberapa keterbatasan akan diatasi lebih cepat dibandingkan yang lain.”

Van den Broeck menyatakan bahwa model penalaran tidak berhasil saat ini penalaran dan oleh karena itu terbatas pada jenis tugas yang dapat mereka selesaikan dengan sukses. “Penalaran yang benar berhasil dalam semua masalah, bukan hanya masalah yang paling mungkin terjadi. [in a model’s training data]”, dikatakan. “Itulah tantangan utama yang masih harus diatasi.”

Mengingat kuatnya insentif pasar untuk mendorong model penalaran ke depan, model ini pasti akan semakin membaik seiring berjalannya waktu. Lagi pula, bukan hanya OpenAI, DeepSeek, dan Alibaba yang berinvestasi dalam bidang penelitian AI baru ini. Pemodal ventura dan pendiri industri yang berdekatan adalah penggabungan seputar gagasan masa depan yang didominasi oleh AI rasional.

Namun, Talwalkar khawatir laboratorium besar akan mengendalikan perbaikan ini.

“Dapat dimengerti bahwa laboratorium-laboratorium besar mempunyai alasan kompetitif untuk tetap merahasiakannya, namun kurangnya transparansi ini sangat menghambat kemampuan komunitas riset untuk terlibat dengan ide-ide ini,” katanya. “Saya berharap semakin banyak orang yang bekerja ke arah ini [reasoning models to] bergerak cepat. Namun meskipun beberapa ide akan datang dari akademisi, mengingat adanya insentif finansial di sini, saya berharap sebagian besar, jika tidak semua, model akan ditawarkan oleh laboratorium industri besar seperti OpenAI.”

Sumber

Breaking News

Sensor serat optik baru dapat membantu mempercepat pemulihan gangguan daya

3 prediksi berani untuk Chicago Bears sebelum musim 2025

Inv Bahan Teknologi Baru dari Instalasi Big Boost Penang untuk Ambisi Regional EV Hub of Malaysia

Google merangkul AI di kelas dengan alat Gemini baru untuk pendidik, chatbots untuk siswa dan banyak lagi

Pembaruan Kontrak TJ Watt: Beberapa tim bertanya tentang ketersediaan komersial Star Pass Rusher, dengan laporan

Penawaran terbaik dari Galaxy Samsung Galaxy dari yang terbaik

Hakim: 3 saksi yang dicari oleh Kohberger harus bersaksi dalam persidangan tentang penikaman siswa Idaho

Sensor serat optik baru dapat membantu mempercepat pemulihan gangguan daya

Ringkasan ‘Rhoa’, S16 E17: Petty Peaches

Dimana Iowa, ISU?

Model AI yang ‘bernalar’ telah menjadi tren, baik atau buruk

Women’s Youth Asia Cup 2024: India kalahkan China 3-2 lewat adu penalti dan sukses pertahankan gelar juara

Atletik Remaja Nasional | Empat rekor pertandingan ditulis ulang pada hari penutup

Breaking News

Related Post