Breaking News

Alat Agen OpenAI Mungkin Akan Segera Diluncurkan

Alat Agen OpenAI Mungkin Akan Segera Diluncurkan

OpenAI mungkin akan segera meluncurkan alat kecerdasan buatan yang dapat mengendalikan PC Anda dan melakukan tindakan atas nama Anda.

Tibor Blaho, seorang insinyur perangkat lunak dengan reputasi menyaring produk AI yang akan datang secara akurat, klaim setelah menemukan bukti OpenAI yang telah lama dirumorkan Operator alat. Publikasi termasuk Bloomberg sebelumnya dilaporkan di Operator, yang dikatakan sebagai “agen”sistem yang mampu menangani tugas-tugas seperti menulis kode dan memesan perjalanan secara mandiri.

Menurut Menurut The Information, OpenAI menargetkan bulan Januari sebagai bulan peluncuran Operator. Kode yang ditemukan oleh Blaho akhir pekan ini menambah kredibilitas laporan tersebut.

OpenAI ObrolanGPT Klien untuk macOS telah mendapatkan opsi, yang tersembunyi untuk saat ini, untuk menentukan pintasan ke “Toggle Operator” dan “Force Operator Quit,” menurut Blaho. Dan OpenAI telah menambahkan referensi ke Operator di situsnya, kata Blaho, meskipun referensi tersebut belum dapat dilihat publik.

Menurut Blaho, situs OpenAI juga memuat tabel-tabel yang belum dipublikasikan yang membandingkan kinerja Operator dengan sistem AI lain yang menggunakan komputer. Sangat mungkin bahwa tabel tersebut adalah placeholder. Namun jika angkanya akurat, hal ini menunjukkan bahwa Operator tidak 100% dapat diandalkan, tergantung pada tugasnya.

Di OSWorld, tolok ukur yang mencoba meniru lingkungan komputasi nyata, “OpenAI Compute Usage Agent (CUA),” bisa dibilang model AI yang mendukung Operator, mendapat skor 38,1%, di depan Anthropic. model yang dikendalikan komputer namun jauh di bawah skor 72,4% pada manusia. OpenAI CUA mengungguli kinerja manusia di WebVoyager, yang mengevaluasi kemampuan AI untuk menavigasi dan berinteraksi dengan situs web. Namun model tersebut tidak mencapai skor tingkat manusia pada benchmark berbasis web lainnya, WebArena, menurut benchmark yang bocor.

Operator juga kesulitan dengan tugas-tugas yang dapat dilakukan dengan mudah oleh manusia, jika kebocoran tersebut dapat dipercaya. Dalam pengujian yang menugaskan Operador untuk mendaftar ke penyedia cloud dan meluncurkan mesin virtual, Operador hanya berhasil 60% saja. Dengan tugas membuat dompet Bitcoin, operator hanya berhasil 10% saja.

Kami telah menghubungi OpenAI untuk memberikan komentar dan akan memperbarui artikel ini jika kami mendengarnya kembali.

Masuknya OpenAI ke dalam ruang agen AI datang sebagai saingan seperti Anthropic yang disebutkan di atas, Googledan lainnya membuat drama untuk segmen yang baru lahir. Agen AI bisa saja berisiko dan spekulatifnamun raksasa teknologi sudah mempromosikannya sebagai hal besar berikutnya di AI. Menurut Menurut perusahaan analitik Markets and Markets, pasar agen AI bisa bernilai $47,1 miliar pada tahun 2030.

Agen masa kini cukup primitif. Namun beberapa ahli telah menyatakan kekhawatirannya mengenai keselamatan mereka, jika teknologi berkembang pesat.

Salah satu grafik yang bocor menunjukkan bahwa Operator berkinerja baik dalam penilaian keamanan tertentu, termasuk pengujian yang berupaya membuat sistem melakukan “aktivitas terlarang” dan mencari “data pribadi sensitif.” KabarnyaPengujian keamanan adalah salah satu alasan siklus pengembangan operator yang panjang. Dalam X baru-baru ini suratSalah satu pendiri OpenAI Wojciech Zaremba mengkritik Anthropic karena merilis agen yang menurutnya tidak memiliki mitigasi keamanan.

“Saya hanya bisa membayangkan reaksi negatifnya jika OpenAI melakukan peluncuran serupa,” tulis Zaremba.

Perlu dicatat bahwa OpenAI telah melakukannya dikritik oleh para peneliti AI, termasuk mantan karyawannya, karena diduga meremehkan pekerjaan keamanan demi mempercepat produksi teknologi mereka.



Sumber