Alat Agen OpenAI Mungkin Akan Segera Diluncurkan

OpenAI mungkin akan segera meluncurkan alat kecerdasan buatan yang dapat mengendalikan PC Anda dan melakukan tindakan atas nama Anda.

Tibor Blaho, seorang insinyur perangkat lunak dengan reputasi menyaring produk AI yang akan datang secara akurat, klaim setelah menemukan bukti OpenAI yang telah lama dirumorkan Operator alat. Publikasi termasuk Bloomberg sebelumnya dilaporkan di Operator, yang dikatakan sebagai “agen”sistem yang mampu menangani tugas-tugas seperti menulis kode dan memesan perjalanan secara mandiri.

Menurut Menurut The Information, OpenAI menargetkan bulan Januari sebagai bulan peluncuran Operator. Kode yang ditemukan oleh Blaho akhir pekan ini menambah kredibilitas laporan tersebut.

OpenAI ObrolanGPT Klien untuk macOS telah mendapatkan opsi, yang tersembunyi untuk saat ini, untuk menentukan pintasan ke “Toggle Operator” dan “Force Operator Quit,” menurut Blaho. Dan OpenAI telah menambahkan referensi ke Operator di situsnya, kata Blaho, meskipun referensi tersebut belum dapat dilihat publik.

Dikonfirmasi: Aplikasi desktop macOS ChatGPT memiliki opsi tersembunyi untuk menentukan pintasan peluncur desktop untuk “Toggle Operator” dan “Force Operator Quit”. https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS

— Tibor Blaho (@btibor91) 19 Januari 2025

Menurut Blaho, situs OpenAI juga memuat tabel-tabel yang belum dipublikasikan yang membandingkan kinerja Operator dengan sistem AI lain yang menggunakan komputer. Sangat mungkin bahwa tabel tersebut adalah placeholder. Namun jika angkanya akurat, hal ini menunjukkan bahwa Operator tidak 100% dapat diandalkan, tergantung pada tugasnya.

Website OpenAI telah memiliki referensi ke Operator/OpenAI CUA (Agen Penggunaan Komputer): “Tabel Kartu Sistem Operator”, “Tabel Evaluasi Riset Operator” dan “Tabel Tingkat Penolakan Operator”.

Termasuk perbandingan dengan penggunaan komputer Claude 3.5 Sonnet, Google Mariner, dll.

(pratinjau tabel… pic.twitter.com/OOBgC3ddkU

— Tibor Blaho (@btibor91) 20 Januari 2025

Di OSWorld, tolok ukur yang mencoba meniru lingkungan komputasi nyata, “OpenAI Compute Usage Agent (CUA),” bisa dibilang model AI yang mendukung Operator, mendapat skor 38,1%, di depan Anthropic. model yang dikendalikan komputer namun jauh di bawah skor 72,4% pada manusia. OpenAI CUA mengungguli kinerja manusia di WebVoyager, yang mengevaluasi kemampuan AI untuk menavigasi dan berinteraksi dengan situs web. Namun model tersebut tidak mencapai skor tingkat manusia pada benchmark berbasis web lainnya, WebArena, menurut benchmark yang bocor.

Operator juga kesulitan dengan tugas-tugas yang dapat dilakukan dengan mudah oleh manusia, jika kebocoran tersebut dapat dipercaya. Dalam pengujian yang menugaskan Operador untuk mendaftar ke penyedia cloud dan meluncurkan mesin virtual, Operador hanya berhasil 60% saja. Dengan tugas membuat dompet Bitcoin, operator hanya berhasil 10% saja.

Kami telah menghubungi OpenAI untuk memberikan komentar dan akan memperbarui artikel ini jika kami mendengarnya kembali.

Masuknya OpenAI ke dalam ruang agen AI datang sebagai saingan seperti Anthropic yang disebutkan di atas, Googledan lainnya membuat drama untuk segmen yang baru lahir. Agen AI bisa saja berisiko dan spekulatifnamun raksasa teknologi sudah mempromosikannya sebagai hal besar berikutnya di AI. Menurut Menurut perusahaan analitik Markets and Markets, pasar agen AI bisa bernilai $47,1 miliar pada tahun 2030.

Agen masa kini cukup primitif. Namun beberapa ahli telah menyatakan kekhawatirannya mengenai keselamatan mereka, jika teknologi berkembang pesat.

Salah satu grafik yang bocor menunjukkan bahwa Operator berkinerja baik dalam penilaian keamanan tertentu, termasuk pengujian yang berupaya membuat sistem melakukan “aktivitas terlarang” dan mencari “data pribadi sensitif.” KabarnyaPengujian keamanan adalah salah satu alasan siklus pengembangan operator yang panjang. Dalam X baru-baru ini suratSalah satu pendiri OpenAI Wojciech Zaremba mengkritik Anthropic karena merilis agen yang menurutnya tidak memiliki mitigasi keamanan.

“Saya hanya bisa membayangkan reaksi negatifnya jika OpenAI melakukan peluncuran serupa,” tulis Zaremba.

Perlu dicatat bahwa OpenAI telah melakukannya dikritik oleh para peneliti AI, termasuk mantan karyawannya, karena diduga meremehkan pekerjaan keamanan demi mempercepat produksi teknologi mereka.

Sumber

Breaking News

Pembiayaan Olahraga Olimpiade Chip negosiasi sejak NCAA mencari bantuan antimonopoli, kata sumber AP

Abbott menandatangani undang-undang anti-SD, yang akan menjadi undang-undang Texas di akhir media publik Houston tahun ini

Dalam informasi yang salah, apakah teknologi besar siap untuk undang -undang layanan digital?

Perubahan titik pusat setelah Badai Beryl, benar

Rookie of the Bears bisa menjadi kandidat pemotongan yang tidak terduga

Video komedi terbaik pencuri seni hotel

Keberhasilan yang spektakuler atau janji yang kurang terpenuhi … kesan pertama Gennext of India

Sirene New York Pilih Striker Ceko Kristýna Kaltounková pada umumnya dalam draft PWHL

Keluarga Philadelphia prihatin dengan tarif yang memengaruhi olahraga pemuda – NBC10 Philadelphia

Dalam informasi yang salah, apakah teknologi besar siap untuk undang -undang layanan digital?

Alat Agen OpenAI Mungkin Akan Segera Diluncurkan

El Greco memberikan gambaran kemenangan dalam Karl Umrigar Salver

Menjadi lebih baik: kemajuan dalam teknologi rotasi rahasia

Breaking News

Related Post