Deepseek sudah viral.
Laboratorium Tiongkok Deepseek menerobos kesadaran konvensional minggu ini kemudian Aplikasi chatbotnya naik ke bagian atas daftar Apple App Store (Dan Google Play juga). Model AI Deepseek, yang dilatih menggunakan komputer, efisien, teknik upaya, Mereka telah mengarahkan analis Wall Street – dan Teknolog – Untuk mempertanyakan apakah Amerika Serikat dapat mempertahankan kepemimpinannya dalam karier AI dan jika permintaan chip AI akan tetap ada.
Tapi dari mana Deepseek datang dan bagaimana dia naik ke ketenaran internasional begitu cepat?
Origins Trader Deepseek
Deepseek didukung oleh manajemen modal flyer tinggi, dana pertanggungan kuantitatif Cina yang menggunakan AI untuk menginformasikan keputusan komersialnya.
Penggila Liang Wenfeng Dia ikut mendirikan High-Flyer pada tahun 2015. Wenfeng, yang, menurut laporan, mulai menjelajah ke perdagangan, sementara seorang mahasiswa dari University of Zhejiang meluncurkan manajemen modal Alto terbang sebagai dana pertanggungan pada tahun 2019 yang berfokus pada pengembangan dan penggalian algoritma AI.
Pada tahun 2023, High-Flyer memulai Deepseek sebagai laboratorium yang didedikasikan untuk meneliti alat yang dipisahkan dari bisnis keuangannya. Dengan High-Flyer sebagai salah satu investornya, laboratorium menyimpang di perusahaannya sendiri, juga disebut Depseek.
Sejak hari pertama, Depseek membangun kelompok pusat data sendiri untuk pelatihan model. Tapi seperti perusahaan AI lainnya di Cina, Deepseek telah dipengaruhi oleh larangan ekspor AS.. Untuk melatih salah satu model terbaru, perusahaan ini terpaksa menggunakan chip NVIDIA H800, versi chip yang kurang kuat, H100, tersedia untuk perusahaan AS.
Dikatakan bahwa tim teknis Deepseek Biggish. Perusahaan Seperti dilaporkan, rekrutan secara agresif Peneliti AI doktoral dari universitas Cina terbaik. Deepseek juga mempekerjakan orang tanpa sejarah ilmu komputer Untuk membantu teknologi mereka lebih memahami berbagai topik, menurut New York Times.
Model Deepseek yang kuat
Deepseek mengumumkan serangkaian model pertamanya: Depseek Coder, Deepseek LLM dan Deepseek Chat, pada November 2023. Tetapi baru pada musim semi lalu, ketika startup meluncurkan keluarga model Deepseek-V2 generasi berikutnya, industri AI mulai disadari.
Deepseek-V2, sistem analisis teks dan gambar penggunaan umum, dilakukan dengan baik di beberapa titik referensi AI, dan jauh lebih murah untuk dieksekusi daripada model yang sebanding pada waktu itu. Paksa Kompetisi Deepseek Nasional, termasuk Bytedance dan Alibaba, untuk mengurangi harga penggunaan beberapa model mereka dan membuat yang lain benar -benar gratis.
Deepseek-V3Dirilis pada bulan Desember 2024, itu hanya bergabung dengan ketenaran Deepseek.
Menurut tes referensi internal Deepseek, Depseek V3 melebihi model yang dapat diunduh dan terbuka yang tersedia sebagai tujuan Panggilan dan model “tertutup” yang hanya dapat diakses melalui API, seperti Openai GPT-4O.
Yang sama mengesankannya adalah model “penalaran” Deepseek. Dirilis pada bulan Januari, Depseek menyatakan R1 bekerja serta model O1 Openai dalam titik referensi utama.
Menjadi model penalaran, R1 secara efektif diverifikasi, yang membantu menghindari beberapa perangkap yang biasanya tersandung pada model. Model penalaran membutuhkan waktu sedikit lebih lama, umumnya detik lebih banyak menit, untuk mencapai solusi dibandingkan dengan model non -rumus yang khas. Keuntungannya adalah mereka cenderung lebih dapat diandalkan dalam domain seperti fisika, sains dan matematika.
Namun, ada ketidaknyamanan R1, Deepseek V3 dan model Deepseek lainnya. Saat dikembangkan oleh orang Cina, mereka tunduk margin evaluasi Untuk regulator internet China untuk memastikan bahwa tanggapan mereka “mewujudkan nilai -nilai sosialis pusat.” Dalam aplikasi Chatbot Deepseek, misalnya, R1 tidak akan menjawab pertanyaan tentang otonomi Tiananmen Square atau Taiwan.
Pendekatan yang mengganggu
Jika Deepseek memiliki model bisnis, tidak jelas apa itu model itu. Perusahaan menghasilkan produk dan layanannya jauh di bawah nilai pasar, dan membuat yang lain gratis.
Cara Deepseek memberi tahu Anda bahwa kemajuan efisiensi telah memungkinkan Anda untuk mempertahankan daya saing dari biaya ekstrem. Beberapa ahli sengketa Namun, angka -angka yang telah disediakan perusahaan.
Apa pun masalahnya, pengembang telah memimpin model Deepseek, yang bukan open source, karena frasa ini umumnya dipahami, tetapi tersedia di bawah lisensi permisif yang memungkinkan penggunaan komersial. Menurut Clem Delitue, CEO Hugging Face, salah satu platform yang menampung model Deepseek, Pengembang di The Hug Face telah menciptakan lebih dari 500 model “turunan” dari R1 yang telah mengumpulkan 2,5 juta unduhan gabungan.
Keberhasilan Deepseek melawan saingan yang lebih besar dan lebih mapan telah digambarkan sebagai “ai bertempat” Dan “Overded.” Keberhasilan perusahaan setidaknya bertanggung jawab menyebabkan harga saham NVIDIA menurun sebesar 18% di bulan Januari dan untuk publik CEO Operai Sam Altman.
Microsoft Dia mengumumkan bahwa Depseek tersedia di Layanan Pengecaran AIure AI -nyaPlatform Microsoft yang menyatukan layanan AI untuk perusahaan di bawah satu spanduk. Ketika ditanya tentang dampak Depseek pada target pengeluaran AI selama kuartal pertamanya, kata CEO Mark Zuckerberg Biaya infrastruktur AI akan terus menjadi “keuntungan strategis” Meta.
Selama panggilan keuntungan kuartal keempat NVIDIA, CEO Jensen Huang menekankan “inovasi luar biasa” dari Deepseek Untuk mengatakan itu dan model “penalaran” lainnya sangat baik untuk NVIDIA karena mereka membutuhkan lebih banyak komputasi.
Pada saat yang sama, Beberapa perusahaan melarang depseekDan mereka juga utuh negara Dan Pemerintah, termasuk Korea Selatan. Negara Bagian New York juga Memperdalam bahwa agee yang dalam digunakan di perangkat pemerintah.
Adapun apa yang bisa dimiliki masa depan Deepseek, tidak jelas. Model yang ditingkatkan adalah fakta. Tetapi pemerintah Amerika Serikat tampaknya Tumbuh memikat apa yang ia anggap sebagai pengaruh asing yang berbahaya. Pada bulan Maret, The Wall Street Journal melaporkan itu Amerika Serikat cenderung melarang Deepseek di perangkat pemerintah.
Kisah ini awalnya diterbitkan pada 28 Januari 2025 dan akan diperbarui secara berkala.