Model Antrope Claude 4 AI yang baru dapat bernalar dalam banyak langkah

Selama konferensi pengembang perdananya pada hari Kamis, Anthrope meluncurkan dua model baru AI bahwa pernyataan awal adalah yang terbaik dalam industri ini, setidaknya dalam hal bagaimana mereka mencetak pada titik referensi populer.

Claude Opus 4 dan Claude Sonnet 4, bagian dari keluarga baru model Anthrope Claude 4, dapat menganalisis set data besar, melaksanakan tugas Horizon Panjang dan mengambil tindakan kompleks, menurut perusahaan. Kedua model disempurnakan untuk berfungsi dengan baik dalam tugas pemrograman, kata Anthrope, membuatnya sangat cocok untuk menulis dan mengedit kode.

Baik pengguna maupun pengguna aplikasi chatbot gratis perusahaan akan mendapatkan akses ke Sonnet 4, tetapi hanya pengguna yang membayar akan mendapatkan akses ke Opus 4. Untuk Anthrope API, melalui platform Amazon Bedrock dan Google AI AI AI, Opus 4 akan dihargai $ 15/$ 75 per juta token (entrance/exit/exit) dan santai).. Perlengkapan $ 3 per juta (entri/exit/exit).

Token adalah bit data yang tidak diproses dengan mana model AI bekerja. Satu juta token setara dengan sekitar 750.000 kata, sekitar 163.000 kata lebih dari “perang dan perdamaian.”

Kredit gambar:Antropik

Model Claude 4 Anthrope mencapai saat perusahaan berupaya meningkatkan pendapatan secara substansial. DilaporkanPakaian, yang didirikan oleh mantan peneliti Openai, bertujuan untuk mendapatkan $ 12 miliar dalam keuntungan pada tahun 2027, di atas $ 2,2 miliar yang diproyeksikan tahun ini. Antropik Baru -baru ini ditutup Jalur kredit $ 2,5 miliar dan dikumpulkan miliaran dolar dari Amazon dan Investor lainnya dalam perkiraan Biaya yang berkembang terkait dengan pengembangan model perbatasan.

Para pesaing belum memfasilitasi untuk mempertahankan posisi pole dalam karier AI. Saat antrope meluncurkan a Model baru lencana Awal tahun ini, Claude Sonnet 3.7, bersama -sama dengan alat pengkodean agen yang disebut Claude Code, para pesaing, termasuk Openai dan Google, telah mencalonkan diri untuk mengatasi perusahaan dengan model yang kuat dan alat pengembangan mereka sendiri.

Anthrope sedang bermain untuk tugas dengan Claude 4.

Yang paling mampu dari dua model yang diperkenalkan saat ini, Opus 4, dapat mempertahankan “upaya terfokus” dalam banyak langkah dalam alur kerja, kata Anthrope. Sementara itu, Sonnet 4, dirancang sebagai “penggantian pengiriman” untuk Sonnet 3.7, meningkatkan pengkodean dan matematika dibandingkan dengan model antropi sebelumnya dan berlanjut dengan presisi yang lebih besar instruksi, menurut perusahaan.

Keluarga Claude 4 juga lebih kecil kemungkinannya bahwa Sonnet 3.7 berpartisipasi dalam “Piracy of Rewards,” kata Anthropic. Pembajakan imbalan, juga dikenal sebagai spesifikasi, adalah perilaku di mana model mengambil jalan pintas dan laguna untuk menyelesaikan tugas.

Untuk lebih jelasnya, perbaikan ini belum menghasilkan dunia lebih baik model untuk setiap titik referensi. Misalnya, sementara Opus 4 mengatasi Google Gemini 2.5 Pro dan openai O3 Dan GPT-4.1 Dalam SWE Bank yang diverifikasi, yang dirancang untuk mengevaluasi keterampilan pengkodean model, tidak dapat mengatasi O3 dalam evaluasi multimodal MMMU atau berlian GPQA, serangkaian pertanyaan yang terkait dengan biologi, fisika dan kimia tingkat doktoral.

Meski begitu, antrop merilis Opus 4 di bawah perlindungan yang ketat, termasuk detektor konten berbahaya yang diperkuat dan pertahanan keamanan siber. Perusahaan menyatakan bahwa bukti internalnya menemukan bahwa Opus 4 dapat “secara substansial meningkatkan” kemampuan seseorang dengan riwayat batang untuk memperoleh, memproduksi atau menggunakan senjata kimia, biologis atau nuklir, mencapai Spesifikasi model antrop “ASL-3”.

Baik Opus 4 dan Sonnet 4 adalah model “hibrida”, kata Anthrope, mampu hampir momen dan lebih banyak pemikiran untuk penalaran yang lebih dalam (sejauh AI dapat “bernalar” dan “berpikir” bagaimana manusia memahami konsep -konsep ini). Dengan mode penalaran, model dapat membutuhkan lebih banyak waktu untuk mempertimbangkan kemungkinan solusi untuk masalah yang diberikan sebelum menanggapi.

Sebagai alasan model, mereka akan menunjukkan ringkasan “mudah digunakan” dari proses pemikiran mereka, kata Anthrope. Mengapa tidak menunjukkan semuanya? Sebagian untuk melindungi “keunggulan kompetitif” dari Anthrope, perusahaan mengakui dalam rancangan publikasi blog yang diberikan kepada TechCrunch.

Opus 4 dan Sonnet 4 dapat menggunakan banyak alat, seperti mesin pencari, secara paralel, dan alternatif antara penalaran dan alat untuk meningkatkan kualitas jawaban mereka. Mereka juga dapat mengekstraksi dan menyimpan “memori” untuk menangani tugas yang lebih dapat diandalkan, membangun apa yang digambarkan antrope sebagai “pengetahuan diam -diam” dari waktu ke waktu.

Untuk membuat model lebih ramah untuk programmer, Anthrope menerapkan pembaruan dalam kode Claude yang disebutkan di atas. Kode Claude, yang memungkinkan pengembang untuk menjalankan tugas -tugas tertentu melalui model antrope langsung dari terminal, sekarang terintegrasi dengan ID dan menawarkan SDK yang memungkinkan pengembang untuk menghubungkannya dengan aplikasi pihak ketiga.

Kode Claude SDK, yang diumumkan awal pekan ini, memungkinkan kode Claude untuk dieksekusi sebagai subproses dalam sistem operasi yang kompatibel, menyediakan cara membangun asisten pengkodean dan alat dengan AI Motor untuk memanfaatkan kemampuan model Claude.

Anthrope telah meluncurkan ekstensi kode Claude dan konektor kode untuk Microsoft JetBrains dan Github Code. Konektor GitHub memungkinkan pengembang untuk memberi label kode Claude untuk menanggapi cek -up, serta mencoba untuk memperbaiki kesalahan dalam kode atau memodifikasi sebaliknya.

Model AI masih berjuang untuk menyandikan perangkat lunak berkualitas. Generator kode cenderung memperkenalkan kerentanan keamanan Dan Kesalahankarena kelemahan Di bidang -bidang seperti kemampuan untuk memahami logika pemrograman. Namun, janjinya untuk meningkatkan produktivitas pengkodean adalah untuk meningkatkan perusahaan dan pengembang Mengadopsi mereka dengan cepat.

Antrop, sangat sadar akan hal ini, menjanjikan pembaruan model yang lebih sering.

“Kami … mengubah pembaruan model yang lebih sering, menawarkan aliran perbaikan yang konstan yang memberikan kemampuan inovatif kepada pelanggan lebih cepat,” tulis startup dalam drafnya. “Pendekatan ini membuatnya berada di garis depan karena kami menolak dan meningkatkan model kami.”

Sumber

Breaking News

Perbendaharaan Amerika Serikat untuk menyelesaikan produksi sen pada awal 2026

Kamera setengah frame fitur modern Fujifilm untuk kesenangan retro

Karyawan Microsoft Menghadap Blok ‘Palestina’ untuk mengirim email ke ribuan staf sebagai protes

Ide Komersial Bravos Pemenang Tanah Menarik dari Sarung Tangan Gold Yankees

The Full Nerd: TechTubers Debat yang Terbaik dan Terburuk dari PC Computex PC

Prancis Terbuka 2025: Jannik Sinner kembali ke tenis Grand Slam setelah larangan dopingnya

Pemerintah Amerika Serikat tidak dapat menemukan pria Venezuela yang dideportasi oleh Houston – Houston Public Media

Bintang Thunder Shai Gilgeous-Alexander bernama MVP dari NBA, menjadi orang Kanada kedua yang memenangkan penghargaan

Legislatif Texas di tepi sepenuhnya melarang produk THC setelah pemungutan suara utama Dewan Perwakilan Rakyat

Playoff Sepak Bola Universitas mengubah proses penanaman: Mengapa Notre Dame muncul sebagai pemenang utama dalam format baru

Model Antrope Claude 4 AI yang baru dapat bernalar dalam banyak langkah

Tinggalkan Balasan Batalkan balasan

Harvard menuntut administrasi Trump untuk kemungkinan larangan internasional bagi siswa internasional

Renaisans Nuklir: JFAC Kunjungi INL, temukan tempat kecerdasan buatan dalam energi nuklir

Breaking News

Tinggalkan Balasan Batalkan balasan

Related Post