Startup Prancis dari Mistral AI mempresentasikan pada hari Rabu agen baru tugas rekayasa perangkat lunak.
Startup meluncurkan Devstral dalam hubungan dengan semua tangan AI, a Agen ai rintisan.
Mistral mengatakan model baru ini dirancang untuk menyelesaikan “masalah gitub nyata” dan berjalan pada agen kode perancah seperti OpenHands dan Agen SWE.
Perancah adalah struktur atau alur kerja sementara yang memungkinkan pengembang untuk mencapai tujuan tertentu. Sistem SWE-Agent memberi makan model bahasa besar (LLM) yang bertindak sebagai agen rekayasa perangkat lunak untuk melakukan tugas-tugas rekayasa.
LLM juga membahas masalah mengontekstualisasikan kode dalam basis kode besar dan mengidentifikasi berbagai komponen dan kesalahan.
Jendela konteks terbesar
Apa yang pada dasarnya mistikus dengan Devstral adalah memperluas Jendela konteks Oleh karena itu, LLM dapat “mempertimbangkan lebih banyak saling ketergantungan dalam basis kode saat ini saat membuat kode baru,” kata Torsten Volk, seorang analis Omdia, divisi target Tech.
“Ini mirip dengan encoder manusia, yang perlu memastikan bahwa mereka menggunakan logika otentikasi yang konsisten, manajemen kesalahan, konvensi nama, validasi data, pola pendaftaran atau struktur API,” kata Volk.
Dia menambahkan bahwa model harus tetap melakukan tugasnya untuk menjadi optimal.
“Model ini masih harus terus mengidentifikasi bagian penting dalam jendela konteks yang semakin besar ini, yang merupakan tantangan yang lebih besar daripada sekadar meningkatkan ukuran jendela,” lanjutnya.
Bagian lain yang menarik dari apa yang dilakukan Mistral dengan Devstral adalah fitur yang memungkinkan model untuk fokus pada peningkatan kode yang ada tanpa menulis ulang file lengkap.
“Ini memungkinkan pengembang untuk meningkatkan kode saat ini tanpa mempertaruhkan karakteristik dalam proses, yang telah terbukti menjadi masalah penting di masa lalu,” kata Volk.
Sifat tantangan AI dan agen
Selain berguna bagi pengembang, model berbicara tentang tren yang lebih besar di pasar generatif AI.
Agen yang sepenuhnya Devstral berbicara tentang bagaimana Agen telah mengubah narasinya Tentang apa yang dapat dicapai dengan AI generatif, kata Bradley Shimmin, analis Futurum Group.
“Kapasitas bagi model -model ini untuk mengambil tugas tingkat yang lebih tinggi, tugas penalaran tingkat yang lebih tinggi, adalah masa depan,” kata Shimmin.
Dilihat sebagai gelar bisnis dan siap untuk perusahaan adalah tantangan terbesarnya.
Bradley ShimminAnalis, Futurum Group
Dia menambahkan bahwa meskipun Mistral, yang bersaing dengan pemasok generatif independen lainnya seperti Openai, Anthropic dan Cohere, serta raksasa teknologi, bertujuan untuk meningkatkan inovasi bagi komunitas open source, masih harus bekerja pada posisinya.
“Dilihat sebagai gelar bisnis dan siap untuk perusahaan adalah tantangan terbesarnya,” lanjut Shimmin. “Di mana kamu cocok?”
Dia menambahkan bahwa tidak jelas apakah pemasok bertujuan untuk menggantikan Openai dan Microsoft Co -rivers atau sudut besar konsumen sebagai Gemini tetapi dengan pengakuan bisnis.
“Itu bukan dari mereka,” lanjutnya. “Ini adalah ruangnya sendiri. Tantangan terbesar adalah bagaimana mereka berkembang dari waktu ke waktu untuk mencapai keseimbangan antara pendekatan dan kapasitas bisnis dan bisnis.”
Mistral mengatakan Devstral cukup ringan untuk bekerja dengan satu GPU NVIDIA RTX 4090 atau MAC dengan 32 GB RAM.
Tersedia secara gratis di bawah Apache Lisensi 2.0.
Sementara itu, Openai juga menambahkan alat baru yang dimasukkan ke dalamnya Respons APIAPI untuk membangun aplikasi agen. Alat tersebut termasuk dukungan untuk protokol konteks model jarak jauh, pembuatan gambar, juru bahasa dan file untuk pencarian file. Mereka tersedia dalam seri GPT-4O, Seri GPT-4.1 dan model penalaran OpenAI O-Series.
Operai pada hari Rabu juga mengatakan bahwa dia akan membeli IO Jony Ivesebesar $ 6,5 miliar.
Esther Shittu adalah penulis berita dan presenter podcast TechTarget yang meliput sistem perangkat lunak dan kecerdasan buatan.