Model AI terbaru Google memiliki banyak pekerjaan yang harus dilakukan. Sebagai perusahaan lain mana pun Dalam perlombaan AI, Google dengan panik mengintegrasikan AI ke dalam hampir setiap produk yang dimilikinya, mencoba menciptakan produk yang ingin digunakan oleh pengembang lain, dan berlomba untuk menyiapkan semua infrastruktur untuk mewujudkan hal-hal tersebut tanpa menjadikannya terlalu mahal sehingga tidak bisa dilakukan. membunuh perusahaan. bisnis. Sementara itu, Amazon, Microsoft, Anthropic dan OpenAI adalah menumpahkan miliaran uangnya sendiri pada serangkaian masalah yang hampir sama.
Hal ini mungkin menjelaskan mengapa Demis Hassabis, CEO Google DeepMind dan kepala semua upaya AI perusahaan, sangat antusias dengan betapa komprehensifnya model Gemini 2.0 yang baru. Google meluncurkan Gemini 2.0 pada hari Rabu, sekitar 10 bulan setelah perusahaan pertama kali dirilis 1.5. Ini masih dalam apa yang disebut Google sebagai “pratinjau eksperimental” dan hanya satu versi model yang dirilis: Flash 2.0 yang lebih kecil dan kelas bawah. Namun Hassabis mengatakan ini masih hari yang menyenangkan.
“Memang,” kata Hassabis, “ini sama bagusnya dengan model Pro saat ini. Oleh karena itu, Anda dapat menganggapnya sebagai tingkat yang lebih baik, dengan efektivitas biaya, efisiensi kinerja, dan kecepatan yang sama. “Kami sangat senang dengan itu.” Dan dia tidak hanya lebih baik dalam melakukan hal-hal lama yang bisa dilakukan Gemini, dia juga bisa melakukan hal-hal baru. Gemini 2.0 kini dapat menghasilkan audio dan gambar secara asli, dan menghadirkan kemampuan multimodal baru yang menurut Hassabis menjadi landasan bagi hal besar berikutnya dalam AI: agen.
Agen AI, sebagaimana semua orang menyebutnya, mengacu pada robot AI yang benar-benar dapat mengaktifkan dan menyelesaikan berbagai hal atas nama Anda. Google telah mendemokannya, Project Astra, sejak musim semi ini — adalah sistem visual yang dapat mengidentifikasi objek, membantu Anda menjelajahi dunia, dan memberi tahu di mana Anda meninggalkan kacamata. Gemini 2.0 mewakili kemajuan besar bagi Astra, kata Hassabis.
Google adalah juga meluncurkan Proyek Marinerekstensi Chrome eksperimental baru yang benar-benar dapat menggunakan browser web Anda untuk Anda. ada juga Juliagen khusus untuk membantu pengembang menemukan dan memperbaiki kode buruk, dan agen baru berbasis Gemini 2.0 yang dapat melihat layar Anda dan membantu Anda lebih baik bermain video game. Hassabis menyebut agen permainan sebagai “telur Paskah”, namun juga menganggapnya sebagai sesuatu yang dapat dilakukan oleh model terintegrasi multimoda untuk Anda.
“Kami benar-benar melihat tahun 2025 sebagai awal sebenarnya dari era berbasis agen,” kata Hassabis, “dan Gemini 2.0 adalah fondasinya.” Dia dengan hati-hati menunjukkan bahwa kinerja bukanlah satu-satunya peningkatan di sini; Ketika perbincangan terus berlanjut mengenai perlambatan peningkatan model di seluruh industri, ia mengatakan Google masih memperoleh keuntungan dengan melatih model-model baru, namun tetap bersemangat mengenai peningkatan efisiensi dan kecepatan.
Rencana Google untuk Gemini 2.0 adalah menggunakannya di mana saja
Ini tidak akan mengejutkan Anda, tetapi rencana Google untuk Gemini 2.0 adalah menggunakannya di mana saja. Hal ini akan meningkatkan gambaran AI di Google Penelusuran, yang menurut Google kini menjangkau satu miliar orang dan menurut perusahaan kini akan lebih bernuansa dan kompleks berkat Gemini 2.0. Tentu saja, ini akan ada di bot dan aplikasi Gemini, dan pada akhirnya akan mendukung fitur AI di Workspace dan tempat lain di Google. Google telah berupaya untuk membangun sebanyak mungkin fitur ke dalam model itu sendiri, daripada menjalankan sekumpulan produk individual yang terisolasi, sehingga Google dapat berbuat lebih banyak dengan Gemini di lebih banyak tempat. Multimodalitas, berbagai jenis hasil, fitur – tujuannya adalah untuk menggabungkan semuanya ke dalam model dasar Gemini. “Kami mencoba membangun model yang paling umum,” kata Hassabis.
Ketika era agen AI dimulai, Hassabis mengatakan ada masalah baru dan lama yang harus dipecahkan. Yang lama itu abadi, soal kinerja, efisiensi, dan biaya inferensi. Yang baru tidak diketahui dalam banyak hal. Salah satu contohnya: risiko keamanan apa yang akan ditimbulkan oleh agen-agen ini ketika mereka beroperasi atas kemauan mereka sendiri? Google mengambil beberapa tindakan pencegahan dengan Mariner dan Astra, namun Hassabis mengatakan masih banyak penelitian yang harus dilakukan. “Kita memerlukan solusi keamanan baru,” katanya, “seperti pengujian di area pengujian yang lebih ketat. “Saya pikir hal ini akan sangat penting bagi agen penguji, dibandingkan melakukannya di alam liar… hal ini akan lebih berguna, namun risikonya juga akan lebih besar.”
Gemini 2.0 mungkin sedang dalam tahap percobaan untuk saat ini, namun Anda kini dapat menggunakannya dengan memilih model baru di aplikasi web Gemini. (Belum diketahui kapan Anda dapat mencoba model tanpa Flash.) Dan awal tahun depan, kata Hassabis, teknologi ini akan hadir untuk platform Gemini lainnya, semua produk Google lainnya, dan seluruh Internet.