Laboratorium Cina Veteran Hal ini menyebabkan kebangkitan Lembah Silikon pertama tahun 2025 setelah meluncurkan versi terbuka model AI yang bersaing dengan OpenAi terbaik, meta dan teknologi Google yang ditawarkan.
Deepseek mengklaim telah membangun modelnya dengan cara yang sangat efisien dan cepat (meskipun beberapa skeptis terhadap pernyataan ini), dan menyediakan model -model ini untuk sebagian kecil dari harga yang dibebankan oleh perusahaan AI. Pembangunan memiliki Dia tidak hanya mengguncang raksasa teknologi Tetapi tingkat tertinggi pemerintah Amerika Serikat, yang khawatir China akan maju dalam perlombaan senjata AI.
“Saya tidak akan terkejut jika banyak laboratorium AI memiliki ruang perang saat ini,” kata Robert Nishihara, salah satu pendiri startup infrastruktur AnyScale, dalam sebuah wawancara dengan TechCrunch.
Promosi Deepseek menandai titik balik untuk lanskap Lembah Silikon. CEO, pendiri, peneliti, dan investor AI memberi tahu TechCrunch bahwa model Depseek memiliki implikasi penting bagi kebijakan Amerika. Selain itu, para ahli ini mengatakan, model berfungsi sebagai indikator tingkat percepatan kemajuan AI.
“Tentu saja [DeepSeek] Itu dibesar-besarkan, ”kata Ravid Shwartz-Ziv, asisten profesor di Pusat Ilmu Data NYU, dalam sebuah wawancara. “Tapi itu masih sangat menarik, dan ada banyak yang bisa kita dapatkan darinya.”
Cara berpikir baru tentang AI
Salah satu inovasi utama Depseek dalam penciptaan model R1 -nya adalah “pembelajaran penguatan murni”, pendekatan tes dan kesalahan, menurut CEO pekerja dan guru yang terlampir Stanford, Kian Katanforoosh.
Katanforosh membandingkan kemajuan Deepseek dengan seorang anak yang menemukan untuk tidak menyentuh piring panas yang secara tidak sengaja terbakar.
“[A kid] Saya bisa menyentuh hidangan panas, membakar dan belajar dengan cepat untuk tidak melakukannya lagi, ”kata Katanforosh melalui pesan teks. “Itu adalah pembelajaran penguatan murni: belajar dari coba -coba berdasarkan umpan balik […] Metode Deepseek adalah tentang membiarkan model belajar hanya melalui pengalaman. “
Deepseek tampaknya telah menuai pembelajaran penguatan lebih dari model avant -garde lainnya. Operai juga menggunakan teknik pembelajaran penguatan Untuk mengembangkan O1bahwa perusahaan mengungkapkan berminggu -minggu sebelum Depseek mengumumkan R1. Operai Model utama O3 Ini mencapai kinerja yang lebih baik menggunakan metode serupa, tetapi juga komputasi tambahan, kata perusahaan.
Pembelajaran penguatan merupakan salah satu cara paling menjanjikan untuk meningkatkan model Yayasan AI saat ini, menurut Katanforoosh. Istilah “model dasar” umumnya mengacu pada model yang terlatih dalam sejumlah besar data, seperti gambar dan teks web. Laboratorium AI lain tampaknya akan melanjutkan batas pembelajaran penguatan untuk meningkatkan model AI mereka, terutama mengingat keberhasilan Depseek.
Hanya beberapa bulan yang lalu, perusahaan AI ditemukan Berjuang untuk meningkatkan kinerja model dasar mereka. Tetapi keberhasilan metode seperti pembelajaran penguatan dan lainnya, seperti penyesuaian yang baik dan skala waktu tes, menunjukkan bahwa kemajuan AI mungkin mendukung.
“R1 telah memberi saya lebih percaya diri pada ritme kemajuan yang tetap tinggi,” kata Nathan Lambert, seorang peneliti AI2, dalam sebuah wawancara dengan TechCrunch.
Titik balik Untuk kebijakan AI
R1, yang dapat diunduh dan dieksekusi di mesin apa pun yang memenuhi persyaratan perangkat keras, kebetulan, atau ritme O1 dalam berbagai titik referensi AI. Meskipun ini bukan pertama kalinya kami melihat kesenjangan kinerja yang erat antara model “tertutup” seperti openai dan model yang tersedia secara terbuka, kecepatan Depseek melakukannya telah membuat industri membuat industri ini.
Ini dapat meningkatkan Amerika Serikat untuk meningkatkan investasinya di AI, atau bahkan open source, AI untuk bersaing dengan Cina. Martin Casado, mitra umum Andreessen Horowitz (A16Z), mengatakan kepada TechCrunch bahwa Deepseek menunjukkan bagaimana “bisu” telah menjadi logika peraturan dalam dua tahun terakhir.
“Untuk AI, saya pikir ini hanya menunjukkan kepada kita itu [the United States] Dia tidak sendirian dalam kapasitas teknis kami, ”kata Casado dalam sebuah wawancara. “Solusi yang sangat kompetitif dapat datang dari mana saja, tetapi khususnya, Cina. Alih -alih menghambat inovasi AS, kita harus berinvestasi dengan kuat di dalamnya. Sumber terbuka tidak mengizinkan Cina. Faktanya, menolak perusahaan kami untuk membuat open source berarti bahwa teknologi kami tidak terlalu berkembang biak. “
Menikah sepertinya merujuk pada mantan Presiden Biden Perintah Eksekutif yang Baru Dicabut dan Veded California Bill SB 1047yang menentang secara agresif. A16Z berpendapat kedua langkah yang diprioritaskan untuk mencegah skenario “boros” dari AI dari Hari Penghakiman Akhir tentang Inovasi Amerika. Dalam istilah yang lebih umum, Lembah Silikon umumnya berhasil Mengencangkan Gerakan “AI Doom” pada tahun 2024. Kekhawatiran sebenarnya tentang AI, A16Z dan yang lainnya telah berulang kali, adalah bahwa Amerika Serikat kehilangan keunggulan kompetitifnya atas Cina.
Skenario itu tampaknya jauh lebih nyata dalam terang kenaikan Deepseek.
Bukan untuk apa pun, A16Z sangat berinvestasi pada banyak pemain terbesar di dunia AI Open AI, termasuk databricks, Mistral dan Black Forest Labs. Mantan mitra A16Z Sriram Krishnan sekarang adalah penasihat kebijakan senior Trump untuk AI.
Presiden Trump mengatakan pada hari Senin bahwa Depseek harus menjadi “Panggilan perhatian“Untuk perusahaan Amerika, puji laboratorium Cina untuk pendekatan terbuka. Itu cukup selaras dengan posisi A16Z di AI.
“Deepseek R1 adalah waktu Sputnik,” kata co -founder A16Z Marc Andreessen di a Publikasikan di xMengacu pada peluncuran pesawat ruang angkasa Bumi Uni Soviet yang lalu yang mendorong Amerika Serikat untuk berinvestasi dengan serius dalam program luar angkasa.
Kenaikan Deepseek juga tampaknya telah mengubah pikiran skeptis terbuka, seperti CEO Google Eric Schmidt. Tahun lalu, Schmidt menyatakan keprihatinan tentang proliferasi IA Open Western Open Models di seluruh dunia. Tetapi dalam sebuah artikel opini yang diterbitkan pada hari Selasa, Schmidt mengatakan kenaikan Depseek menandai “titik balik” Dalam karier global AI, dan meminta investasi yang lebih besar di American Open.
Melihat ke Masa Depan
Penting untuk tidak membesar -besarkan pencapaian Depseek.
Sebagai contoh, beberapa analis skeptis tentang pernyataan Depseek yang melatih salah satu model perbatasannya, Deepseek V3, hanya $ 5,6 juta, kesengsaraan dalam industri AI, menggunakan sekitar 2.000 GPU Nvidia tertua. Laboratorium Tiongkok tidak tumbuh dalam semalam, dan sangat mencari dilaporkan Ini memiliki cadangan lebih dari 50.000 GPU Nvidia Hopper lebih mampu.
Model Deepseek juga rusak. Menurut tes Menurut Newsguard dari Organisasi Keandalan Informasi, R1 memberikan tanggapan yang tidak akurat atau non -transwers 83% dari waktu ketika ditanya tentang masalah yang terkait dengan berita tersebut. Tes terpisah Dia menemukan bahwa R1 menolak untuk merespons 85% indikasi terkait dengan Cina, mungkin konsekuensi dari Penyensoran Pemerintah tempat model AI yang dikembangkan di negara ini menjadi subjek.
Lalu, ada klaim pencurian IP. Opadai Dia bilang dia punya bukti Deepseek itu menggunakan model AI -nya untuk melatihnya sendiri, menggunakan proses yang disebut distilasi. Jika itu benar, ini akan menjadi pelanggaran terhadap persyaratan opera, dan itu juga akan membuat pencapaian Depseek kurang mengesankan. Misalnya, Peneliti Berkeley baru -baru ini menciptakan model penalaran suling hanya $ 450. (Tentu saja, opera digugat untuk beberapa pihak karena Seharusnya melakukan pelanggaran hak cipta dalam pelatihan model mereka sendiri.
Meski begitu, Depseek memindahkan jarum dengan model yang lebih efisien, dan berinovasi. Lambert mengatakan bahwa tidak seperti O1, R1 mengungkapkan “proses berpikir” untuk pengguna. Lambert telah mengamati bahwa beberapa pengguna mempercayai atau percaya bahwa model penalaran AI ketika mereka melihat proses internal mereka, di mana mereka “menjelaskan pekerjaan mereka.”
Sekarang, kita harus melihat bagaimana rumulator kebijakan Amerika Serikat dan laboratorium IA merespons.
TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini Untuk mendapatkannya di baki masuk Anda setiap hari Rabu.