Breaking News

Model Penalaran AI DeepSeek-R1-Lite-Preview Mengungguli OpenAI o1

Model Penalaran AI DeepSeek-R1-Lite-Preview Mengungguli OpenAI o1


Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Informasi lebih lanjut


pencarian mendalamcabang AI dari dana lindung nilai kuantitatif Tiongkok Manajemen modal tingkat tinggi berfokus pada peluncuran teknologi sumber terbuka berkinerja tinggi, telah meluncurkan R1-Lite-Preview, model bahasa besar (LLM) terbaru yang berfokus pada penalaran, tersedia untuk saat ini secara eksklusif melalui Obrolan Pencarian Mendalamchatbot AI berbasis web Anda.

Dikenal karena kontribusi inovatifnya terhadap ekosistem AI open source, rilis baru DeepSeek bertujuan untuk menghadirkan kemampuan penalaran tingkat tinggi kepada publik sambil mempertahankan komitmennya terhadap AI yang dapat diakses dan transparan.

Dan R1-Lite-Preview, meskipun saat ini hanya tersedia melalui aplikasi chat, telah menarik perhatian dengan menawarkan kinerja yang mendekati, dan dalam beberapa kasus melampaui, model o1-preview yang banyak dibanggakan dari OpenAI.

Jadi model diluncurkan pada Pada bulan September 2024, DeepSeek-R1-Lite-Preview menampilkan penalaran “rantai pemikiran”, menunjukkan kepada pengguna berbagai rantai atau rangkaian “pemikiran” yang diikuti untuk menanggapi pertanyaan dan masukan mereka, mendokumentasikan proses dengan menjelaskan apa yang sedang dilakukan dan Mengapa.

Meskipun beberapa rantai/rangkaian pemikiran mungkin tampak tidak masuk akal atau bahkan salah bagi manusia, DeepSeek-R1-Lite-Preview tampaknya sangat akurat, bahkan menjawab pertanyaan “menipu” yang membuat orang lain tersandung namun kuat. Model AI seperti GPT-4o dan keluarga Anthropic milik Claude, termasuk “berapa banyak huruf R di kata Strawberry?” dan “mana yang lebih besar, 9.11 atau 9.9?” Lihat tangkapan layar di bawah pengujian saya terhadap pesan-pesan ini di Obrolan DeepSeek:

Pendekatan baru terhadap penalaran AI

DeepSeek-R1-Lite-Preview dirancang untuk unggul dalam tugas-tugas yang memerlukan inferensi logis, penalaran matematis, dan pemecahan masalah waktu nyata.

Menurut DeepSeek, model ini mengungguli tingkat pratinjau OpenAI o1 pada tolok ukur yang sudah ada seperti AIME (American Invitational Mathematics Examination) dan MATH.

Hasil benchmark DeepSeek-R1-Lite-Preview dipublikasikan di X.

Kemampuan penalarannya ditingkatkan dengan proses pemikirannya yang transparan, sehingga memungkinkan pengguna untuk mengikuti model tersebut dalam mengatasi tantangan kompleks selangkah demi selangkah.

DeepSeek juga telah menerbitkan data penskalaan, yang menunjukkan peningkatan akurasi yang konsisten ketika model diberi lebih banyak waktu atau “token pemikiran” untuk memecahkan masalah. Grafik kinerja menyoroti kemampuan Anda untuk mencapai skor yang lebih tinggi pada tolok ukur seperti AIME seiring dengan meningkatnya kedalaman pemikiran.

Tolok ukur dan aplikasi dunia nyata

DeepSeek-R1-Lite-Preview telah bekerja secara kompetitif pada tolok ukur utama.

Hasil yang dipublikasikan perusahaan ini menyoroti kemampuannya untuk menangani berbagai tugas, mulai dari matematika kompleks hingga skenario berbasis logika, sehingga menghasilkan skor kinerja yang menyaingi model papan atas dalam tolok ukur penalaran seperti GPQA dan Codeforces.

Transparansi proses penalarannya semakin membedakannya. Pengguna dapat mengamati langkah-langkah logis model secara real-time, menambahkan elemen akuntabilitas dan kepercayaan yang tidak dimiliki oleh banyak sistem AI berpemilik.

Namun, DeepSeek belum merilis kode lengkap untuk analisis atau pembandingan pihak ketiga yang independen, juga belum menyediakan DeepSeek-R1-Lite-Preview melalui API yang memungkinkan jenis pengujian independen yang sama.

Selain itu, perusahaan belum menerbitkan postingan blog atau buku putih yang menjelaskan bagaimana DeepSeek-R1-Lite-Preview dilatih atau dirancang, sehingga meninggalkan banyak tanda tanya mengenai asal usulnya.

Aksesibilitas dan paket sumber terbuka

R1-Lite-Preview sekarang dapat diakses melalui DeepSeek Chat di obrolan.deepseek.com. Meskipun gratis untuk penggunaan umum, mode “Deep Think” yang canggih pada model ini memiliki batas harian sebanyak 50 pesan, sehingga menawarkan banyak peluang bagi pengguna untuk merasakan kemampuannya.

Ke depan, DeepSeek berencana untuk merilis versi open source dari model seri R1 dan API terkait, menurut publikasi perusahaan di X.

Langkah ini selaras dengan sejarah perusahaan dalam mendukung komunitas AI open source.

Rilisan sebelumnya, DeepSeek-V2.5, Ia mendapat pujian karena menggabungkan pemrosesan bahasa umum dan kemampuan pengkodean tingkat lanjut, menjadikannya salah satu model AI sumber terbuka paling kuat pada saat itu.

Membangun warisan

DeepSeek melanjutkan tradisinya dalam mendorong batas-batas AI open source. Model sebelumnya seperti DeepSeek-V2.5 dan Encoder DeepSeek menunjukkan kemampuan yang mengesankan dalam tugas-tugas bahasa dan pengkodean, dengan tolok ukur yang menempatkannya sebagai pemimpin di bidangnya.

Peluncuran R1-Lite-Preview menambahkan dimensi baru, dengan fokus pada penalaran dan skalabilitas yang transparan.

Saat perusahaan dan peneliti mengeksplorasi aplikasi AI yang intensif penalaran, komitmen DeepSeek terhadap keterbukaan memastikan bahwa modelnya tetap menjadi sumber daya penting untuk pengembangan dan inovasi.

Dengan menggabungkan kinerja tinggi, operasi transparan, dan aksesibilitas sumber terbuka, DeepSeek tidak hanya memajukan AI, tetapi juga mengubah cara AI dibagikan dan digunakan.

R1-Lite-Preview sekarang tersedia untuk pengujian publik. Model open source dan API diperkirakan akan menyusul, sehingga semakin memperkuat posisi DeepSeek sebagai pemimpin dalam teknologi AI yang canggih dan mudah diakses.


Sumber