Breaking News

Agen operator Openai membantu saya pindah, tetapi saya juga harus membantunya

Agen operator Openai membantu saya pindah, tetapi saya juga harus membantunya

Openai memberi saya seminggu untuk mencoba Agen AI baru Anda, operatorSuatu sistem yang dapat melakukan tugas secara mandiri untuk Anda di internet.

Operator adalah yang terdekat yang pernah saya lihat dengan industri teknologi Visi Agen AI – Sistem yang dapat mengotomatiskan bagian kehidupan yang membosankan, membebaskan kita untuk melakukan hal -hal yang sangat kita sukai. Namun, dilihat dari pengalaman saya dengan agen opera, sistem yang benar -benar “otonom” masih di luar jangkauan.

Opadai Melatih model baru untuk operator energiyang menggabungkan pemahaman visual GPT-4O dengan kemampuan penalaran O1.

Model itu tampaknya bekerja dengan baik untuk tugas -tugas dasar; Saya melihat tombol untuk mengklik operator, menavigasi menu di situs web dan formulir lengkap. AI sesekali berhasil mengambil tindakan secara mandiri, dan bekerja lebih cepat daripada agen berbasis web yang telah saya lihat dalam apa yang telah saya lihat Antropik Dan Google.

Tetapi selama penilaian saya, saya mendapati diri saya membantu agen openai lebih dari yang saya inginkan. Rasanya seolah -olah saya sedang melatih operator melalui setiap masalah, sementara saya ingin mendapatkan tugas -tugas tertentu dari hidangan saya sepenuhnya.

Terlalu sering selama tes saya, saya harus menjawab beberapa pertanyaan, memberikan izin, menyelesaikan informasi pribadi dan membantu agen saat macet.

Dalam hal mobil, operator seperti mengendarai mobil dengan kendali jelajah, kadang -kadang melepas kaki pedal dan membiarkan mobil mengendarai itu sendiri, tetapi jauh dari autopilot penuh.

Faktanya, Openai mengatakan bahwa jeda yang sering dari operator adalah dengan desain.

Operator pemberian makan AI, seperti chatbots AI yang mendorong Openai Chatgpt, tidak dapat bekerja dengan andal secara mandiri untuk jangka waktu yang lama, dan rentan terhadap jenis menakjubkan yang sama. Karena itu, Operai tidak ingin memberikan sistem pengambilan keputusan atau rahasia atau informasi rahasia pengguna. Mungkin itu adalah opsi yang aman untuk Openai, tetapi mengurangi kepraktisan operator.

Yang mengatakan, agen Openai pertama adalah bukti konsep yang mengesankan, dan antarmuka, untuk AI yang dapat menggunakan ujung frontal dari situs web mana pun. Tetapi untuk menciptakan sistem AI yang benar -benar independen, perusahaan teknologi perlu membangun model yang lebih andal yang tidak memerlukan banyak arah.

Sedikit terlalu “praktis”

Tes operator saya bertepatan dengan minggu saya pindah apartemen, jadi saya mendapat bantuan agen OpenAI untuk memindahkan logistik.

Saya meminta operator untuk membantu saya membeli izin parkir baru. Agen Operai memberi tahu saya: “Tentu saja,” lalu membuka jendela ke browsernya di layar PC saya.

Kemudian, operator melakukan izin parkir San Francisco di browser, membawa saya ke situs web kota yang tepat dan bahkan halaman yang tepat.

Operator masih memungkinkan Anda untuk menggunakan sisa komputer Anda saat berfungsi, sesuatu yang tidak dapat dikatakan untuk proyek Google Mariner. Ini karena agen Openai tidak benar -benar bekerja di komputer, tetapi di cloud di suatu tempat.

Antarmuka operatorKredit gambar:Maxwell Zeff dan Openai

Untuk izin parkir saya, saya harus memberikan izin kepada operator untuk memulai proses yang berbeda terlalu sering. Dia juga berhenti untuk meminta saya untuk mengisi formulir dengan informasi pribadi, seperti nama saya, nomor telepon, dan alamat email. Kadang -kadang, operator juga hilang, memaksa saya untuk mengendalikan browser dan menempatkan agen di jalan lagi.

Dalam tes lain, saya meminta operator untuk membuat reservasi di restoran Yunani. Untuk kreditnya, operator menemukan saya tempat yang baik di daerah saya dengan harga yang wajar. Tetapi saya harus menjawab lebih dari setengah lusin pertanyaan di seluruh arus.

Beberapa langkah untuk membuat reservasi dengan operatorKredit gambar:Maxwell Zeff dan Openai

Jika Anda harus campur tangan enam kali atau lebih hanya untuk memesan reservasi melalui agen AI, pada jam berapa lebih mudah melakukannya sendiri? Itu adalah pertanyaan yang banyak saya tanyakan saat mencoba operator.

Agen sebagai platform

Dalam beberapa tes saya, saya bertemu situs web yang memblokir operator dengan alasan apa pun. Sebagai contoh, saya mencoba memesan tukang listrik menggunakan TaskRabbit, tetapi agen Openai mengatakan kepada saya bahwa dia menemukan kesalahan dan bertanya apakah dia bisa menggunakan layanan alternatif. Expedia, Reddit dan YouTube juga mencegah agen AI mengakses platform mereka.

Namun, layanan lain mengadopsi operator dengan tangan terbuka. Instacart, Uber dan Ebay berkolaborasi dengan OpenAi untuk peluncuran operator, yang memungkinkan agen untuk berlayar di situs web mereka atas nama manusia.

Perusahaan -perusahaan ini sedang mempersiapkan masa depan di mana agen AI memfasilitasi sebagian dari interaksi pengguna.

“Pelanggan menggunakan Instacart melalui berbagai titik masuk yang berbeda,” kata Daniel Danker, direktur produk instan, dalam sebuah wawancara dengan TechCrunch. “Kami melihat operator sebagai, berpotensi, titik masuk yang lain.”

Biarkan Openi menggunakan situs web Instacart atas nama seseorang tampaknya memisahkan Instacart dari pelanggan mereka. Namun, Danker mengatakan Instacart ingin bertemu pelanggan di mana pun mereka berada.

“Kami benar-benar optimis tentang keyakinan kami, mirip dengan Openai, bahwa sistem agen akan memiliki dampak besar pada bagaimana konsumen berinteraksi dengan properti digital,” kata Direktur Ebay Nitzan Mekel-Bobrov, dalam sebuah wawancara dengan TechCrunch.

Bahkan jika agen AI meningkat dalam popularitas, Mekel-Bobrov mengatakan bahwa penggunaan selalu datang ke situs web eBay, mencatat bahwa “tujuan online tidak pergi ke mana pun.”

Masalah kepercayaan

Saya memiliki beberapa masalah kepercayaan diri kepada operator setelah ia berhalusinasi beberapa kali, dan hampir biaya saya beberapa ratus dolar.

Misalnya, saya meminta agen untuk menemukan tempat parkir di dekat apartemen baru saya. Dia akhirnya menyarankan dua garasi yang mengatakan mereka hanya akan membutuhkan beberapa menit berjalan kaki.

Alfe pada jarak parkirKredit gambar:Maxwell Zeff dan Openai

Selain berada di luar kisaran harga saya, garasi benar -benar jauh dari apartemen saya. Satu 20 menit berjalan kaki, dan yang lainnya 30 menit berjalan kaki. Ternyata operator telah meletakkan arah yang salah.

Inilah alasan mengapa Operai tidak memberi agen Anda nomor kartu kredit, kata sandi, atau akses ke email. Jika Operai tidak membiarkan saya campur tangan di sini, operator akan membuang ratusan dolar di tempat parkir yang tidak saya butuhkan.

Halusinasi seperti ini adalah hambatan utama bagi agen otonom yang sangat berguna, yang dapat menghilangkan tugas -tugas yang mengganggu dari hidangan Anda. Tidak ada yang akan mempercayai agen jika mereka rentan terhadap kesalahan dasar, terutama kesalahan dengan konsekuensi dunia nyata.

Dengan operator, Openai tampaknya telah menciptakan beberapa alat yang mengesankan untuk memungkinkan sistem AI berlayar di web. Tetapi alat -alat ini tidak akan sama dengan AI pangkalan adalah melakukan apa yang diminta pengguna untuk Anda lakukan. Sampai saat itu, manusia akan terjebak dengan membantu agen, bukan sebaliknya. Dan itu mengalahkan intinya.

TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini Untuk mendapatkannya di baki masuk Anda setiap hari Rabu.

Sumber