Breaking News

Deepseek menyatakan bahwa model ‘penalaran’ melebihi OpenAI O1 pada titik referensi tertentu

Deepseek menyatakan bahwa model ‘penalaran’ melebihi OpenAI O1 pada titik referensi tertentu

Laboratorium Tiongkok Deepseek telah meluncurkan versi terbuka Depseek-R1, model penalaran yang disebutnya, yang menyatakan bahwa ia bekerja serta openai dari Openai O1 pada titik referensi AI tertentu.

R1 tersedia di platform AI Dev yang merangkul wajah di bawah lisensi MIT, yang berarti dapat digunakan secara komersial tanpa batasan. Menurut Depseek, R1 kedaluwarsa O1 di AIME, Math-500 dan SWE Bench Reference Points. AIME menggunakan model lain untuk mengevaluasi kinerja model, sedangkan Math-500 adalah kumpulan masalah kata. Sementara itu, swe-bench terverifikasi berfokus pada tugas pemrograman.

Menjadi model penalaran, R1 secara efektif memverifikasi dirinya sendiri, yang Membantu menghindari beberapa perangkap yang biasanya tersandung pada model. Model penalaran membutuhkan waktu sedikit lebih lama, umumnya detik lebih banyak menit, untuk mencapai solusi dibandingkan dengan model khas tidak mengevaluasi. Keuntungannya adalah mereka cenderung lebih dapat diandalkan dalam domain seperti fisika, sains dan matematika.

R1 berisi 671 miliar parameter, Veteran terungkap dalam a Laporan Teknis. Parameter sesuai dengan keterampilan pemecahan masalah suatu model, dan model parameter terbanyak biasanya bekerja lebih baik daripada yang memiliki parameter yang lebih sedikit.

Faktanya, 671 miliar parameter sangat besar, tetapi Deepseek juga meluncurkan versi “suling” R1 yang bervariasi dalam ukuran 1,5 miliar parameter hingga 70 miliar parameter. Yang terkecil dapat bekerja di laptop. Adapun R1 lengkap, itu membutuhkan perangkat keras yang lebih kuat, tetapi adalah Tersedia melalui API Depseek dengan harga 90% -95% lebih murah daripada OpenAI O1.

Clem Delangue, CEO memeluk wajah, mengatakan dalam a Publikasikan di x Pada hari Senin, pengembang platform telah menciptakan lebih dari 500 model “turunan” dari R1 yang telah mengumpulkan 2,5 juta unduhan gabungan, lima kali jumlah unduhan yang diperoleh oleh R1 resmi.

Ada ketidaknyamanan R1. Menjadi model Cina, itu tunduk margin evaluasi Untuk regulator internet China untuk memastikan bahwa tanggapan mereka “mewujudkan nilai -nilai sosialis pusat.” R1 tidak akan menjawab pertanyaan tentang Tiananmen Square, misalnya, atau otonomi Taiwan.

R1 Penyaringan Beraksi. Kredit gambar:Veteran

Banyak Sistem AI Cinatermasuk Model penalaran lainnya, menolak Untuk menanggapi masalah yang dapat meningkatkan kemarahan regulator di negara ini, seperti spekulasi tentang Xi Jinping rezim.

R1 tiba beberapa hari setelah administrasi Biden yang keluar diajukan lebih sulit Ekspor Aturan dan Pembatasan Teknologi AI untuk Perusahaan Cina. Mereka telah dicegah dari pembelian chip canggih, tetapi jika aturan baru mulai berlaku saat ditulis, perusahaan akan menghadapi yang lebih ketat yang lebih tua baik dalam teknologi semikonduktor dan dalam model yang diperlukan untuk memulai sistem IA AI canggih .

Di dalam Dokumen Politik Pekan lalu, Openai mendesak pemerintah Amerika Serikat untuk mendukung pengembangan AI Amerika Serikat, sehingga model Cina tidak bertepatan atau mengatasinya dalam kapasitas. Di sebuah wawancara Dengan informasi tersebut, Wakil Presiden Openai Openai Chris Lehane menyoroti High Flyer Capital Management, orang tua perusahaan Deepseek, sebagai organisasi yang menjadi perhatian khusus.

Sampai sekarang, setidaknya tiga laboratorium Cina: Deepseek, Alibaba dan Kimiyang dimiliki oleh unicorn Cina AI MUSTHOT – Mereka telah menghasilkan model yang mengklaim saingannya O1. (Jadi itu menonjol, Depseek adalah yang pertama: diumumkan Pratinjau R1 pada akhir November.) Dalam a surat Di X, Dean Ball, seorang peneliti AI di Universitas George Mason, mengatakan tren itu menunjukkan bahwa laboratorium IA Cina akan terus menjadi “pengikut cepat.”

“Kinerja mengesankan dari model suling Deepseek […] Ini berarti bahwa penalaran yang sangat cakap akan terus berkembang secara luas dan dapat dieksekusi dalam perangkat keras lokal, “tulis Ball,” jauh dari mata rezim kontrol dari atas ke bawah. “

Kisah ini awalnya diterbitkan pada 20 Januari dan diperbarui pada 27 Januari dengan informasi lebih lanjut.

TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini Untuk mendapatkannya di baki masuk Anda setiap hari Rabu.



Sumber