Model pembuatan video terbaru Google, saya melihat 3, dapat membuat audio untuk menyertai klip yang dihasilkannya.
Selasa Selama Konferensi Pengembang Google I/O 2025Google menyajikan saya melihat 3, yang ditegaskan perusahaan dapat menghasilkan efek suara, suara latar dan bahkan dialog untuk menyertai video yang dibuatnya. Saya melihat 3 juga meningkatkan pendahulu Anda, Saya melihat 2Dalam hal kualitas gambar yang dapat Anda hasilkan, kata Google.
Saya melihat 3 tersedia mulai Selasa di aplikasi Google Gemini Chatbot untuk pelanggan pelanggan AI $ 249,99 per bulan Google, di mana Anda dapat bertanya dengan teks atau gambar.
“Untuk pertama kalinya, kami muncul dari era diam -diam generasi video,” kata Demis Hassabis, CEO Google DeepMind, divisi R&D Google, selama sesi pers yang informatif. “[You can give Veo 3] Pesan yang menggambarkan karakter dan lingkungan, dan menyarankan dialog dengan deskripsi tentang bagaimana Anda ingin terdengar. “
Ketersediaan luas alat untuk membangun generator video telah menyebabkan ledakan pemasok seperti itu sehingga ruang jenuh. Startup yang termasuk Petunjuk, LightrtchsGenmo, Pika, HiggsfieldKling, dan Lumaserta raksasa teknologi seperti Opadai Dan Alibaba, mereka melepaskan model ke klip cepat. Dalam banyak kasus, sedikit membedakan model dari yang lain.
Output audio adalah pembeda besar untuk melihat 3, jika Google dapat memenuhi janjinya. Alat pembuatan suara dengan AI TIDAK novelMereka bukan model untuk dibuat video suara efek. Tapi saya melihat 3 Anda dapat secara unik memahami piksel mentah dari video mereka dan suara yang dihasilkan oleh sinkronisasi dengan klip secara otomatis, menurut Google.
Berikut adalah model sampel klip:
Saya melihat 3 mungkin mungkin berkat Pekerjaan DeepMind sebelumnya Dalam “Video-ke-Audio” AI. Juni lalu, DeepMind mengungkapkan bahwa saya sedang mengembangkan teknologi AI untuk menghasilkan band suara untuk video pelatihan sebuah model dalam kombinasi suara dan transkrip dialog, serta klip video.
DeepMind tidak akan mengatakan dengan tepat di mana ia memperoleh konten untuk melatih melihat 3, tetapi YouTube adalah kemungkinan yang bagus. Google memiliki YouTube dan DeepMind sebelumnya Dia mengatakan kepada TechCrunch bahwa model Google seperti yang saya lihat melatih “May” di beberapa materi YouTube.
Untuk mengurangi risiko Deepfake, DeepMind mengatakan bahwa ia menggunakan teknologi merek air yang dipatenkan, Synthid, untuk menanamkan penanda yang tidak terlihat dalam bingkai yang dihasilkannya saya lihat 3.
Sementara perusahaan seperti Google Pitch saya melihat 3 sebagai alat kreatif yang kuat, banyak artis tidak mempercayai mereka, mengancam untuk terbang ke seluruh industri. A 2024 belajar Komisaris oleh Animation Guild, sebuah serikat pekerja yang mewakili animator dan kartunis Hollywood, memperkirakan bahwa lebih dari 100.000 karya film, televisi, dan animasi yang berbasis di Amerika Serikat akan terganggu oleh AI pada tahun 2026.
Google juga meluncurkan kemampuan baru hari ini untuk melihat 2, termasuk fitur yang memungkinkan pengguna untuk memberikan model gambar, adegan, objek, dan gaya untuk konsistensi yang lebih baik. Yang terakhir saya lihat 2 dapat memahami gerakan kamera seperti rotasi, boneka dan zoom, dan memungkinkan pengguna untuk menambah atau menghapus objek video atau memperluas bingkai klip, misalnya, mengubahnya dari potret menjadi lanskap.
Google mengatakan bahwa semua kemampuan baru yang saya lihat 2 ini akan tiba di platform API Vertex AI mereka dalam beberapa minggu mendatang.