Breaking News

Soneta Claude 3.7 dari Anthrope Points ke Operai dan Deepseek di Pertempuran AI berikutnya berikutnya

Soneta Claude 3.7 dari Anthrope Points ke Operai dan Deepseek di Pertempuran AI berikutnya berikutnya


Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terbaru dan konten eksklusif tentang liputan pemimpin industri. Dapatkan informasi lebih lanjut


Antropik Saya hanya melepaskan tembakan peringatan Opadai, Veteran dan seluruh industri AI dengan peluncuran Melemparkan 3.7 SonetModel yang memberi pengguna kontrol yang belum pernah terjadi sebelumnya tentang berapa lama AI berlalu “pikiran“Sebelum menghasilkan jawaban. Peluncuran, bersama dengan debut Melemparkan KodeAgen pengkodean AI dari baris perintah, menunjukkan dorongan agresif antrop di pasar perusahaan, sebuah dorongan hati yang dapat merombak bagaimana perusahaan membuat perangkat lunak dan mengotomatiskan pekerjaan.

Taruhan tidak bisa lebih tinggi. Bulan lalu, Depseek mengejutkan dunia teknologi dengan model AI yang bertepatan dengan kapasitas sistem AS di a Fraksi biayamengirim ke nvidia Stok turun 17% dan meningkatkan alarm tentang kepemimpinan Amerika Serikat. Sekarang Anthrope bertaruh bahwa kontrol yang tepat atas alasan AI, tidak hanya kecepatan mentah atau penghematan biaya, akan memberikan keuntungan.

Claude 3.7 Sonnet menyajikan pergantian ‘mode pemikiran’, yang memungkinkan pengguna untuk mengoptimalkan waktu respons AI berdasarkan kompleksitas tugas. (Kredit: Antropik)

“Kami hanya percaya bahwa penalaran adalah bagian sentral dan komponen sentral dari AI, alih -alih hal terpisah yang harus Anda bayar secara terpisah untuk mengakses,” kata Dianne Penn, yang mengarahkan manajemen produk untuk penelitian di antrope, di dalam Wawancara dengan VentureBeat. “Seperti manusia, AI harus menangani respons cepat dan pemikiran kompleks. Untuk pertanyaan sederhana seperti ‘Jam berapa sekarang?’ Tetapi untuk tugas -tugas yang rumit, seperti merencanakan perjalanan dua minggu di Italia sambil mengakomodasi kebutuhan diet bebas gluten, diperlukan waktu pemrosesan yang lebih luas. “

“Kami tidak melihat alasan, perencanaan, dan koreksi otomatis sebagai kemampuan terpisah,” tambahnya. “Oleh karena itu, ini pada dasarnya adalah cara kita untuk mengungkapkan perbedaan filosofis itu … idealnya, model itu sendiri harus mengenali ketika suatu masalah membutuhkan pemikiran dan penyesuaian yang lebih intensif, alih -alih menuntut pengguna untuk secara eksplisit memilih berbagai cara penalaran”.

Perbandingan model AI menunjukkan kinerja Claude 3.7 sonnet dalam beberapa tugas, dengan laba penting dalam kemampuan berpikir yang diperluas dibandingkan dengan pendahulunya. (Kredit: Antropik)

Data referensi mendukung visi ambisius Anthrope. Dalam cara berpikir yang tersebar luas, claude 3.7 sonnet mencapai 78,2% presisi Dalam tugas penalaran di tingkat pascasarjana, menantang model OpenAI terbaru dan melebihi Deepseek-R1.

Tetapi metrik yang paling terbuka berasal dari aplikasi dunia nyata. Skor model 81,2% dalam penggunaan alat ritel dan menunjukkan peningkatan yang nyata Instruksi berikut (93,2%) – Area di mana pesaing memiliki masalah atau belum menerbitkan hasil.

Sedangkan Depseek dan Openai Drive Poin Referensi Matematika TradisionalPendekatan terpadu Claude 3.7 menunjukkan bahwa model unik dapat secara efektif berubah antara respons cepat dan analisis mendalam, berpotensi menghilangkan kebutuhan perusahaan untuk mempertahankan sistem AI terpisah untuk berbagai jenis tugas.

Bagaimana hibrida antrope dapat merombak komputasi bisnis

Momen pembebasan sangat penting. Kemunculan Deepseek bulan lalu dikirim gelombang kejut Melalui Lembah Silikon, menunjukkan bahwa penalaran AI yang canggih dapat dicapai dengan Jauh lebih sedikit daya komputer dari yang diperkirakan sebelumnya. Ini menantang asumsi mendasar tentang biaya pengembangan persyaratan AI dan infrastruktur. Ketika Depseek menerbitkan hasilnya, tindakan Nvidia 17% turun Dalam satu hari, investor tiba -tiba mempertanyakan apakah chip mahal sangat penting untuk AI tingkat lanjut.

Untuk perusahaan, taruhan tidak bisa lebih tinggi. Perusahaannya Menghabiskan jutaan Mengintegrasikan AI dalam operasinya, taruhan tentang pendekatan mana yang akan mendominasi. Model hibrida antrope menawarkan rute rata -rata yang meyakinkan: kemampuan untuk menyesuaikan kinerja AI berdasarkan tugas yang dimaksud, dari respons layanan pelanggan instan hingga analisis keuangan yang kompleks. Sistem menjaga antropik harga di atas Token input $ 3 per juta dan token tamasya $ 15 per juta, bahkan dengan karakteristik penalaran tambahan.

Claude 3.7 Sonnet menyajikan pergantian ‘mode pemikiran’, yang memungkinkan pengguna untuk mengoptimalkan waktu respons AI berdasarkan kompleksitas tugas. (Kredit: Antropik)

“Klien kami berusaha mencapai hasil untuk pelanggan mereka,” kata Michael Gerstenhaber, Kepala Platform Antrop. “Menggunakan model yang sama dan memprovokasi model yang sama dengan cara yang berbeda memungkinkan seseorang seperti Thompson Reuters Untuk melakukan penelitian hukum, ini memungkinkan mitra pengkodean kami Kursor salah satu GitHub untuk dapat mengembangkan aplikasi dan memenuhi tujuan tersebut. “

Pendekatan hibrida Anthrope mewakili evolusi teknis dan gambit strategis. Sementara Openai mempertahankan Model terpisah untuk kemampuan yang berbeda Dan Deepseek berfokus pada efisiensi profitabilitasAnthrope mencari sistem terpadu yang dapat menangani tugas rutin dan penalaran yang kompleks. Ini adalah filosofi yang dapat merombak bagaimana perusahaan menerapkan AI dan menghilangkan kebutuhan untuk menyulap dengan beberapa model khusus.

Ketahui Kode Claude: Asisten Pengembang AI Baru

Anthrope hari ini juga terungkap Melemparkan KodeAlat baris perintah yang memungkinkan pengembang untuk mendelegasikan tugas rekayasa kompleks langsung ke AI. Sistem ini membutuhkan persetujuan manusia sebelum melakukan perubahan dalam kode, yang mencerminkan pendekatan industri yang berkembang dalam pengembangan AI yang bertanggung jawab.

Antarmuka terminal Claude Code, bagian dari suite alat pengembang antrope baru menekankan kesederhanaan dan interaksi langsung. (Kredit: Antropik)

“Sebenarnya, Anda masih harus menerima perubahan Claude. Anda adalah pengulas dengan tangan [the] Rueda, ”kata Penn. “Pada dasarnya ada semacam daftar verifikasi yang pada dasarnya harus diterima sehingga model mengambil tindakan tertentu.”

Iklan datang di tengah kompetensi intens dalam pengembangan AI. Peneliti Stanford Baru -baru ini dibuat a Model Penalaran Sumber Terbuka Kurang dari $ 50, sementara Microsoft hanya terintegrasi Model Openai O3-Mini Biru. Keberhasilan Deepseek juga telah merangsang pendekatan baru untuk pengembangan AI, dan beberapa perusahaan mengeksplorasi teknik distilasi model yang selanjutnya dapat mengurangi biaya.

Antarmuka baris perintah CLAUDE COMFAND memungkinkan pengembang untuk mendelegasikan tugas teknik yang kompleks sambil mempertahankan pengawasan manusia. (Kredit: Antropik)

Dari Pokémon ke Enterprise: Coba Kecerdasan Baru AI

Penn mengilustrasikan kemajuan dramatis dalam kemampuan AI dengan contoh yang tidak terduga: “Kami telah meminta berbagai versi Claude untuk memainkan Pokémon … versi ini telah mencapai sampai Kota BermellonesDia menangkap banyak Pokémon, dan bahkan menggiling untuk naik level. Dia memiliki Pokémon yang tepat untuk melawan saingannya. “

“Saya pikir itu akan melihat kami terus berinovasi dan mempromosikan kualitas penalaran, mendorong hal -hal seperti penalaran dinamis,” jelas Penn. “Kami selalu menganggapnya sebagai bagian utama dari kecerdasan, bukan sesuatu yang terpisah.”

Tes nyata dari pendekatan antrope akan datang dari adopsi bisnis. Saat bermain Pokémon mungkin tampak sepele, menunjukkan jenis kecerdasan adaptif yang dibutuhkan perusahaan: AI yang dapat menangani operasi rutin dan keputusan strategis yang kompleks tanpa mengubah antara model khusus. Versi Claude sebelumnya tidak dapat menavigasi melampaui kota awal permainan. Versi terbaru menciptakan strategi, mengelola sumber daya dan membuat keputusan taktis, kapasitas yang mencerminkan kompleksitas tantangan komersial dunia nyata.

Untuk klien bisnis, ini bisa berarti perbedaan antara mempertahankan beberapa sistem AI untuk berbagai tugas dan menerapkan solusi yang unik dan lebih mampu. Bulan -bulan berikutnya akan mengungkapkan apakah komitmen Anthrope terhadap alasan merombak pasar bisnis yang terpadu atau menjadi percobaan lain dalam evolusi cepat industri.


Sumber