Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan pembaruan terkini dan konten eksklusif tentang liputan AI terkemuka di industri. Informasi lebih lanjut
Saat Amazon mengambil langkah besar ke dalam ruang AI dengan teknologinya Keluarga model pondasi Nova baruGoogle menggandakan kemampuan AI multimodalnya sendiri. Divisi cloud raksasa teknologi ini telah mengumumkan model generasi pencitraan dan video terbarunya, Jadi begitu Dan Gambar 3, Mereka sekarang tersedia di Verteks AI.
Langkah ini memungkinkan tim untuk mengintegrasikan kemampuan pencitraan dan pembuatan video mutakhir ke dalam alur kerja AI mereka, sehingga membuka beragam kasus penggunaan, terutama dalam pemasaran dan periklanan. Hal ini juga menjadikan Google Cloud sebagai hyperscaler pertama yang menawarkan model video kepada pelanggannya.
Meskipun model Veo saat ini dalam pratinjau pribadi, Gambar 3 akan tersedia secara umum untuk semua pengguna Vertex AI mulai minggu depan. Khususnya, Gambar 3 juga menyertakan fitur pengeditan, yang memungkinkan pengguna menyempurnakan gambar yang dihasilkan untuk memenuhi kebutuhan materi iklan tertentu.
Apa yang saya Lihat dan Gambar 3 tawarkan?
Pertama kali terungkap di Konferensi Pengembang Google I/OVeo adalah jawaban Google DeepMind terhadap pesaing seperti Runway’s Gen-3 dan OpenAI’s Sora, yang menawarkan pengalaman pembuatan video yang canggih. Model ini mengubah pesan teks atau gambar menjadi video sinematik definisi tinggi dalam berbagai gaya visual, menghasilkan klip berdurasi lebih dari 60 detik. Yang membedakannya adalah konsistensi tingkat bingkai, yang memastikan subjek bergerak mulus dalam bidikan.
Image 3, juga dari DeepMind, mengambil tugas menghasilkan teks menjadi gambar, menghasilkan gambar fotorealistik dalam berbagai gaya. Google mengklaim ini melampaui pendahulunya dalam hal detail, akurasi pencahayaan, dan pengurangan artefak.
Selain generasi, pengguna dalam daftar yang diizinkan Google juga dapat mengakses opsi penyesuaian lanjutan dengan Gambar 3. Opsi ini mencakup pembesaran gambar, pengecatan interior, pengecatan eksterior, dan penggantian latar belakang, semuanya dipandu oleh perintah teks. Selain itu, pengguna dapat memberikan gambar referensi, sehingga Gambar 3 dapat membuat konten yang selaras dengan estetika, logo, atau fitur produk merek tertentu.
Implikasi yang lebih luas bagi industri
Vertex AI telah lama menjadi platform andalan Google Cloud untuk menyederhanakan pengembangan dan penerapan aplikasi AI. Dengan mengintegrasikan Veo dan Imagen 3, platform ini menawarkan organisasi seperangkat alat yang lebih komprehensif untuk berinovasi dalam pemasaran, penjualan, dan banyak lagi.
Image 3, misalnya, menyederhanakan pembuatan aset berkualitas tinggi seperti gambar produk dan konten media sosial, sementara Veo memperluas kemampuan ini dengan menawarkan kepada tim opsi untuk mengubah elemen visual ini menjadi video yang sempurna. Hal ini mempercepat produksi, mengurangi biaya, dan mempercepat pembuatan prototipe, memungkinkan tim mengulangi strategi kreatif mereka dengan cepat.
“Klien seperti Agoda menggunakan kekuatan model AI seperti Veo, Gemini, dan Imagen untuk mengoptimalkan produksi iklan video mereka, sehingga mencapai pengurangan waktu produksi yang signifikan,” kata Warren Barkley, direktur senior manajemen produk di Google, dalam sebuah pernyataan. postingan blog. Dia juga menyoroti bahwa kedua model tersebut menyertakan fitur keamanan seperti tanda air digital dan hambatan moderasi konten untuk memitigasi risiko yang terkait dengan AI generatif.
Pengguna awal lainnya termasuk Mondelez International, pemilik merek seperti Oreo, Cadbury dan Milka, serta layanan pemasaran dan komunikasi global WPP. Seiring dengan perluasan jangkauan model inti Google, bisnis di seluruh industri memiliki peluang besar untuk mengubah cara mereka membuat dan menyajikan konten visual.
Persaingan terus memanas
Meskipun semua penyedia cloud besar, termasuk Google Cloud, Amazon Web Services, dan Microsoft Azure, telah menyediakan model pembuatan gambar pada platform orkestrasi AI masing-masing, pembuatan video masih jarang terjadi hingga saat ini. Keputusan Google untuk merilis Veo dalam pratinjau pribadi hari ini mengubah hal itu.
Menariknya, tak lama setelah pengumuman Veo, AWS membuat heboh di re:Invent dengan pengumuman gulungan barumodel dasar yang menghasilkan video berdurasi enam detik berkualitas studio dari pesan teks dan gambar.
Model ini, bersama dengan model lain dalam keluarga Nova, akan tersedia melalui Batu Amazonlayanan terkelola sepenuhnya milik perusahaan yang dirancang untuk menyederhanakan pembuatan dan penerapan aplikasi AI generatif.
Microsoft, pada bagiannya, tampaknya tertinggal dalam kategori ini pada tahap ini. Adalah Pengecoran AI tidak termasuk model untuk pembuatan video. Namun, kami memperkirakan hal itu akan berubah segera setelah Sora OpenAI memasuki pasar.
Sumber