Breaking News

Operai meluncurkan alat baru untuk membantu perusahaan membangun agen AI

Operai meluncurkan alat baru untuk membantu perusahaan membangun agen AI

Pada hari Selasa, Openai meluncurkan alat -alat baru yang dirancang untuk membantu pengembang dan perusahaan untuk membangun agen AI, sistem otomatis yang dapat mencapai tugas secara mandiri, menggunakan model AI dan Marcos perusahaan sendiri.

Alat -alat ini adalah bagian dari API Respons Openai yang baru, yang memungkinkan perusahaan Produk operator openai. API dari jawaban secara efektif menggantikan Openai Asisten APIbahwa perusahaan merencanakan matahari di paruh pertama tahun 2026.

Yang berlebihan dari agen AI telah tumbuh secara dramatis dalam beberapa tahun terakhir terlepas dari kenyataan bahwa industri teknologi telah berjuang untuk menunjukkan kepada orang -orang, atau bahkan mendefinisikanApa saja “agen AI”? Dalam contoh terbaru dari berlebihan agen yang berada di depan utilitas, startup kupu -kupu Cina pada awal minggu ini menjadi viral Untuk platform agen manus AI baru Yang ditemukan pengguna dengan cepat tidak memenuhi banyak janji perusahaan.

Dengan kata lain, taruhan tinggi untuk openai untuk mendapatkan agen yang tepat.

“Cukup mudah untuk diperlihatkan kepada agennya,” kata Olivier Godement, kepala produk API Openai, TechCrunch dalam sebuah wawancara. “Mendaki agen cukup sulit, dan membuat orang menggunakannya sering sangat sulit.”

Earl tahun ini, Operai mempresentasikan dua agen AI Chatgpt: Operator, yang berlayar di situs web atas namanya dan Penelitian yang mendalamItu menyusun laporan penelitian untuk Anda. Kedua alat menawarkan gagasan tentang apa yang dapat dicapai oleh teknologi agen, tetapi mereka cukup banyak untuk diinginkan di departemen “otonomi”.

Sekarang, dengan API jawaban, OpenAI ingin menjual akses ke komponen yang mempromosikan agen AI, yang memungkinkan pengembang untuk membangun aplikasi agen operator mereka sendiri dan investigasi mendalam. Operai berharap pengembang dapat membuat beberapa aplikasi dengan teknologi agen mereka yang terasa lebih otonom daripada yang tersedia saat ini.

Menggunakan API jawaban, pengembang dapat menyentuh model AI yang sama (dalam tampilan) di bawah kap Openai Pencarian chatgpt Alat Pencarian Web: Pencarian GPT-4O dan Pencarian Mini GPT-4O. Model dapat mencari web ke pertanyaan, mengutip sumber saat menghasilkan jawaban.

Operai menyatakan bahwa pencarian GPT-4O dan pencarian mini GPT-4O sangat tepat. Dalam tolok ukur SimpleQA perusahaan, yang mengukur kemampuan model untuk menjawab pertanyaan singkat dan untuk mencari fakta, skor pencarian 90% GPT-4O, sedangkan skor pencarian GPT-4O mini 88% (lebih tinggi lebih baik). Dibandingkan, GPT-4.5 – Model Openai yang jauh lebih besar dan baru -baru ini diluncurkan – hanya memperoleh 63%.

API Jawaban juga mencakup utilitas pencarian file yang dapat dengan cepat memindai file dalam database perusahaan untuk memulihkan informasi. (Openai menyatakan bahwa ia tidak akan melatih model dalam file -file ini). Selain itu, pengembang yang menggunakan API jawaban dapat menyentuh model agen penggunaan komputer openai (CUA), yang mendorong operator. Model ini menghasilkan tindakan mouse dan keyboard, yang memungkinkan pengembang untuk mengotomatisasi tugas penggunaan komputer seperti entri data dan alur kerja aplikasi.

Perusahaan dapat secara opsional menjalankan Cu -model, yang diluncurkan pada pandangan penyelidikan sebelumnya, secara lokal dalam sistem mereka sendiri, kata Openai. Versi CUA yang tersedia di operator hanya dapat mengambil langkah -langkah di web.

Untuk lebih jelasnya, respons API tidak akan menyelesaikan semua masalah teknis yang mempengaruhi agen saat ini.

Sementara alat pencarian dengan AI lebih tepat daripada model AI tradisional, fakta yang tidak mengejutkan karena mereka dapat mencari jawaban yang benar, pencarian web tidak berfungsi AI Halusinasi masalah terpecahkan. Pencarian GPT-4O masih mendapat 10% dari pertanyaan faktual yang salah. Di luar ketepatannya, alat pencarian AI juga cenderung Bertarung dengan konsultasi navigasi pendek (sebagai “skor Lakers hari ini”), dan laporan terbaru menunjukkan hal itu Janji chatgpt tidak selalu dapat diandalkan.

Dalam posting blog yang disediakan untuk TechCrunch, Openai mengatakan bahwa model CA “belum sangat dapat diandalkan untuk mengotomatiskan tugas dalam sistem operasi”, dan rentan membuat kesalahan “tidak disengaja”.

Namun, Openai mengatakan bahwa ini adalah iterasi awal alat agen mereka, dan itu terus -menerus bekerja untuk memperbaikinya.

Bersama dengan API jawaban, OpenAI meluncurkan kit alat open source yang disebut SDK Agents, yang menawarkan alat gratis pengembang untuk mengintegrasikan model dengan sistem internal mereka, membangun perlindungan dan memantau kegiatan agen AI untuk tujuan pemurnian dan optimisasi. Agen SDK adalah sejenis pelacakan untuk Openai Swarm, kerangka kerja untuk orkestrasi beberapa agen yang diluncurkan perusahaan pada akhir tahun lalu.

Dewa mengatakan dia berharap bahwa opera dapat menutup kesenjangan antara demonstrasi dan produk agen AI tahun ini, dan bahwa, menurut pendapatnya, “agen adalah aplikasi AI yang paling mengejutkan yang akan terjadi.” Itu menggemakan CEO proklamasi Openai Sam Altman yang dibuat pada bulan Januari: Bahwa 2025 adalah tahun di mana agen AI memasuki tenaga kerja.

Jika 2025 benar -benar menjadi “Tahun Agen AI”, peluncuran terbaru Openai menunjukkan bahwa perusahaan ingin beralih dari demonstrasi agen yang mencolok ke alat yang mengejutkan.

Sumber