Breaking News

Google memperkenalkan Gemini 2.0 Flash Thinking untuk menyaingi OpenAI o1

Google memperkenalkan Gemini 2.0 Flash Thinking untuk menyaingi OpenAI o1


Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Informasi lebih lanjut


Dalam upaya terbarunya untuk mendefinisikan kembali lanskap AI, Google telah mengumumkan Gemini Pemikiran Petir 2.0model penalaran multimodal yang mampu mengatasi permasalahan kompleks dengan cepat dan transparan.

di sebuah posting di jejaring sosialCEO Google Sundar Pichai menulis bahwa ini adalah: “Model kami yang paling bijaksana :)”

dan di dokumentasi pengembangGoogle menjelaskan, “mode berpikir mampu memiliki kemampuan penalaran yang lebih kuat dalam meresponsnya dibandingkan mode dasar.” Model Lampu Kilat Gemini 2.0”, yang sebelumnya merupakan yang terbaru dan terhebat dari Google, dirilis hanya delapan hari yang lalu.

Model baru ini hanya mendukung 32.000 token masukan (kira-kira 50-60 halaman teks) dan dapat menghasilkan 8000 token per respons keluaran. Di panel samping tentang Google AI Studio, perusahaan mengklaim yang terbaik untuk “pemahaman multi-modal, penalaran” dan “pengkodean”.

Rincian lengkap mengenai proses pelatihan model, arsitektur, perizinan, dan biayanya belum dirilis. Saat ini, ini menunjukkan nol biaya per token di Google AI Studio.

Alasan yang dapat diakses dan lebih transparan

Berbeda dengan model penalaran pesaing o1 dan o1 mini dari OpenAIGemini 2.0 memungkinkan pengguna untuk mengakses alasan mereka langkah demi langkah melalui menu drop-down, menawarkan pandangan yang lebih jelas dan transparan tentang bagaimana model mencapai kesimpulannya.

Dengan memungkinkan pengguna melihat bagaimana keputusan dibuat, Gemini 2.0 mengatasi kekhawatiran lama tentang AI yang beroperasi sebagai “kotak hitam” dan menyamakan model ini (persyaratan lisensi masih belum jelas) dengan model open source lainnya yang disajikan oleh kompetisi.

Pengujian sederhana pertama saya terhadap model tersebut menunjukkan bahwa model tersebut dengan benar dan cepat (dalam satu hingga tiga detik) menjawab beberapa pertanyaan yang terkenal sulit untuk model AI lainnya, seperti menghitung jumlah R pada kata “Strawberry”. (Lihat tangkapan layar di atas).

Dalam pengujian lain, ketika membandingkan dua angka desimal (9,9 dan 9,11), model secara sistematis membagi soal menjadi langkah-langkah yang lebih kecil, mulai dari menganalisis bilangan bulat hingga membandingkan desimal.

Hasil ini didukung oleh analisis pihak ketiga yang independen L.M. Pasiryang menobatkan Gemini 2.0 Flash Thinking sebagai model dengan kinerja terbaik di semua kategori LLM.

Dukungan asli untuk memuat dan menganalisis gambar.

Dalam peningkatan lebih lanjut dibandingkan keluarga saingannya OpenAI o1, Gemini 2.0 Flash Thinking dirancang untuk memproses gambar langsung dari kotaknya.

o1 diluncurkan sebagai model teks saja, namun sejak itu diperluas untuk mencakup analisis unggahan file dan gambar. Kedua model juga hanya dapat mengembalikan teks saja saat ini.

Gemini 2.0 Flash Thinking juga saat ini tidak mendukung landasan dengan Google Penelusuran atau integrasi dengan aplikasi Google lainnya dan alat pihak ketiga eksternal, menurut dokumentasi pengembang.

Kemampuan multimodal Gemini 2.0 Flash Thinking memperluas potensi kasus penggunaannya, memungkinkan Anda mengatasi skenario yang menggabungkan berbagai jenis data.

Misalnya, dalam satu pengujian, model memecahkan teka-teki yang memerlukan analisis elemen tekstual dan visual, menunjukkan keserbagunaannya dalam mengintegrasikan dan mempertimbangkan antar format.

Pengembang dapat memanfaatkan fitur ini melalui Google AI Studio dan Vertex AI, tempat model tersedia untuk eksperimen.

Ketika lanskap AI menjadi semakin kompetitif, Gemini 2.0 Flash Thinking dapat mengantarkan era baru untuk model pemecahan masalah. Kemampuannya untuk menangani beragam jenis data, memberikan penalaran yang jelas, dan beroperasi pada skala besar menempatkannya sebagai pesaing serius di pasar AI penalaran, menyaingi keluarga o1 OpenAI dan seterusnya.


Sumber