Selama konferensi pengembang perdananya pada hari Kamis, Anthrope meluncurkan dua model baru AI bahwa pernyataan awal adalah yang terbaik dalam industri ini, setidaknya dalam hal bagaimana mereka mencetak pada titik referensi populer.
Claude Opus 4 dan Claude Sonnet 4, bagian dari keluarga baru model Anthrope Claude 4, dapat menganalisis set data besar, melaksanakan tugas Horizon Panjang dan mengambil tindakan kompleks, menurut perusahaan. Kedua model disempurnakan untuk berfungsi dengan baik dalam tugas pemrograman, kata Anthrope, membuatnya sangat cocok untuk menulis dan mengedit kode.
Baik pengguna maupun pengguna aplikasi chatbot gratis perusahaan akan mendapatkan akses ke Sonnet 4, tetapi hanya pengguna yang membayar akan mendapatkan akses ke Opus 4. Untuk Anthrope API, melalui platform Amazon Bedrock dan Google AI AI AI, Opus 4 akan dihargai $ 15/$ 75 per juta token (entrance/exit/exit) dan santai).. Perlengkapan $ 3 per juta (entri/exit/exit).
Token adalah bit data yang tidak diproses dengan mana model AI bekerja. Satu juta token setara dengan sekitar 750.000 kata, sekitar 163.000 kata lebih dari “perang dan perdamaian.”
Model Claude 4 Anthrope mencapai saat perusahaan berupaya meningkatkan pendapatan secara substansial. DilaporkanPakaian, yang didirikan oleh mantan peneliti Openai, bertujuan untuk mendapatkan $ 12 miliar dalam keuntungan pada tahun 2027, di atas $ 2,2 miliar yang diproyeksikan tahun ini. Antropik Baru -baru ini ditutup Jalur kredit $ 2,5 miliar dan dikumpulkan miliaran dolar dari Amazon dan Investor lainnya dalam perkiraan Biaya yang berkembang terkait dengan pengembangan model perbatasan.
Para pesaing belum memfasilitasi untuk mempertahankan posisi pole dalam karier AI. Saat antrope meluncurkan a Model baru lencana Awal tahun ini, Claude Sonnet 3.7, bersama -sama dengan alat pengkodean agen yang disebut Claude Code, para pesaing, termasuk Openai dan Google, telah mencalonkan diri untuk mengatasi perusahaan dengan model yang kuat dan alat pengembangan mereka sendiri.
Anthrope sedang bermain untuk tugas dengan Claude 4.
Yang paling mampu dari dua model yang diperkenalkan saat ini, Opus 4, dapat mempertahankan “upaya terfokus” dalam banyak langkah dalam alur kerja, kata Anthrope. Sementara itu, Sonnet 4, dirancang sebagai “penggantian pengiriman” untuk Sonnet 3.7, meningkatkan pengkodean dan matematika dibandingkan dengan model antropi sebelumnya dan berlanjut dengan presisi yang lebih besar instruksi, menurut perusahaan.
Keluarga Claude 4 juga lebih kecil kemungkinannya bahwa Sonnet 3.7 berpartisipasi dalam “Piracy of Rewards,” kata Anthropic. Pembajakan imbalan, juga dikenal sebagai spesifikasi, adalah perilaku di mana model mengambil jalan pintas dan laguna untuk menyelesaikan tugas.
Untuk lebih jelasnya, perbaikan ini belum menghasilkan dunia lebih baik model untuk setiap titik referensi. Misalnya, sementara Opus 4 mengatasi Google Gemini 2.5 Pro dan openai O3 Dan GPT-4.1 Dalam SWE Bank yang diverifikasi, yang dirancang untuk mengevaluasi keterampilan pengkodean model, tidak dapat mengatasi O3 dalam evaluasi multimodal MMMU atau berlian GPQA, serangkaian pertanyaan yang terkait dengan biologi, fisika dan kimia tingkat doktoral.

Meski begitu, antrop merilis Opus 4 di bawah perlindungan yang ketat, termasuk detektor konten berbahaya yang diperkuat dan pertahanan keamanan siber. Perusahaan menyatakan bahwa bukti internalnya menemukan bahwa Opus 4 dapat “secara substansial meningkatkan” kemampuan seseorang dengan riwayat batang untuk memperoleh, memproduksi atau menggunakan senjata kimia, biologis atau nuklir, mencapai Spesifikasi model antrop “ASL-3”.
Baik Opus 4 dan Sonnet 4 adalah model “hibrida”, kata Anthrope, mampu hampir momen dan lebih banyak pemikiran untuk penalaran yang lebih dalam (sejauh AI dapat “bernalar” dan “berpikir” bagaimana manusia memahami konsep -konsep ini). Dengan mode penalaran, model dapat membutuhkan lebih banyak waktu untuk mempertimbangkan kemungkinan solusi untuk masalah yang diberikan sebelum menanggapi.
Sebagai alasan model, mereka akan menunjukkan ringkasan “mudah digunakan” dari proses pemikiran mereka, kata Anthrope. Mengapa tidak menunjukkan semuanya? Sebagian untuk melindungi “keunggulan kompetitif” dari Anthrope, perusahaan mengakui dalam rancangan publikasi blog yang diberikan kepada TechCrunch.
Opus 4 dan Sonnet 4 dapat menggunakan banyak alat, seperti mesin pencari, secara paralel, dan alternatif antara penalaran dan alat untuk meningkatkan kualitas jawaban mereka. Mereka juga dapat mengekstraksi dan menyimpan “memori” untuk menangani tugas yang lebih dapat diandalkan, membangun apa yang digambarkan antrope sebagai “pengetahuan diam -diam” dari waktu ke waktu.
Untuk membuat model lebih ramah untuk programmer, Anthrope menerapkan pembaruan dalam kode Claude yang disebutkan di atas. Kode Claude, yang memungkinkan pengembang untuk menjalankan tugas -tugas tertentu melalui model antrope langsung dari terminal, sekarang terintegrasi dengan ID dan menawarkan SDK yang memungkinkan pengembang untuk menghubungkannya dengan aplikasi pihak ketiga.
Kode Claude SDK, yang diumumkan awal pekan ini, memungkinkan kode Claude untuk dieksekusi sebagai subproses dalam sistem operasi yang kompatibel, menyediakan cara membangun asisten pengkodean dan alat dengan AI Motor untuk memanfaatkan kemampuan model Claude.
Anthrope telah meluncurkan ekstensi kode Claude dan konektor kode untuk Microsoft JetBrains dan Github Code. Konektor GitHub memungkinkan pengembang untuk memberi label kode Claude untuk menanggapi cek -up, serta mencoba untuk memperbaiki kesalahan dalam kode atau memodifikasi sebaliknya.
Model AI masih berjuang untuk menyandikan perangkat lunak berkualitas. Generator kode cenderung memperkenalkan kerentanan keamanan Dan Kesalahankarena kelemahan Di bidang -bidang seperti kemampuan untuk memahami logika pemrograman. Namun, janjinya untuk meningkatkan produktivitas pengkodean adalah untuk meningkatkan perusahaan dan pengembang Mengadopsi mereka dengan cepat.
Antrop, sangat sadar akan hal ini, menjanjikan pembaruan model yang lebih sering.
“Kami … mengubah pembaruan model yang lebih sering, menawarkan aliran perbaikan yang konstan yang memberikan kemampuan inovatif kepada pelanggan lebih cepat,” tulis startup dalam drafnya. “Pendekatan ini membuatnya berada di garis depan karena kami menolak dan meningkatkan model kami.”