Bahkan pada pandangan pertama, ada sesuatu di dalam tubuh di jalan. Lembar putih di bawahnya terlalu bersih, dan gerakan petugas benar -benar tanpa tujuan. “Kita perlu membersihkan jalan,” kata salah satu dari mereka dengan gerakan tangan yang kuat, meskipun bibirnya tidak bergerak. AI, tidak apa -apa. Tapi inilah kickernya: Pemberitahuan saya tidak termasuk dialog apa pun.
Saya melihat 3, model generasi video Google AI baru menambahkan garis itu saja. Dalam 24 jam terakhir, saya membuat selusin klip yang mewakili laporan berita, bencana dan kucing kartun dengan audio yang meyakinkan, beberapa di antaranya model ditemukan sendiri. Ini lebih dari sedikit menyeramkan dan jauh lebih canggih daripada yang saya bayangkan. Dan meskipun saya tidak berpikir bahwa kita akan meningkatkan satu hari dari akhir informasi yang salah, saya melihat bagi saya, bagi saya sebuah mesin dengan kemiringan absolut.
Google Saya memperkenalkan saya melihat 3 Dalam I/O minggu ini, menyoroti kapasitas paling penting yang baru: menghasilkan suara untuk menyertai video AI Anda. “Kami memasuki era penciptaan baru,” jelas wakil presiden Gemini dari Google, Josh Woodward, dalam catatan utama, memenuhi syarat sebagai “sangat realistis.” Saya tidak sepenuhnya dijual, tetapi kemudian, beberapa hari kemudian, saya memiliki 3 menghasilkan video presenter berita yang mengumumkan api di jarum ruang angkasa. Yang dia ambil hanyalah pesan teks dasar, beberapa menit dan langganan mahal AI Ultra Google Plan. Dan Anda tahu apa? Woodward tidak melebih -lebihkan. Itu realistis sekali.
Saya mencoba indikator berita setelah melihat apa yang bisa dilakukan Alejandra Caraballo, seorang instruktur klinis dari klinik Cyberlaw dari fakultas hukum Harvard, yang dapat diproduksi. Salah satu klip Anda Ini menyajikan seorang presenter berita yang mengumumkan kematian Sekretaris Pertahanan Amerika Serikat, Pete Hegseth. Ini tidak mati, tetapi klipnya sangat meyakinkan. Publikasi yang mencakup rantai video dengan Karakter yang dihasilkan oleh AI yang memprotes indikasi yang digunakan untuk membuatnya Ini memiliki 50.000 suara di Reddit. Adegan -adegan itu termasuk bencana, seorang wanita di tempat tidur rumah sakit yang menggunakan tabung pernapasan dan karakter yang terancam pada todongan senjata, semua dengan dialog lisan dan suara latar belakang yang realistis. Hal -hal yang sangat bahagia!
Mungkin saya naif, tetapi setelah bermain dengan saya melihat 3 saya tidak lumayan Sama khawatirnya dengan saya di awal. Untuk memulai, pagar yang jelas sudah ada. Anda tidak dapat meminta Anda membuat video yang tersandung dan menelepon Biden. Dia tidak dapat membuat presenter berita mengumumkan pembunuhan presiden, atau bahkan menghasilkan video CEO dari kemeja dan teknologi rantai yang tertawa sementara tiket dolar menghujani dia. Itu adalah awal.
Yang mengatakan, Anda dapat menghasilkan omong kosong yang mengkhawatirkan. Tanpa solusi cerdas, saya meningkatkan saya melihat 3 untuk membuat video jarum video yang terbakar. Dimulai dengan foto saya sendiri tentang Gunung Rainier, saya membuat video dengan letusan dengan asap dan lava. Bersama dengan klip presenter berita yang mengumumkan bencana ini, saya bisa melihat bagaimana saya bisa menabur kejahatan dengan sangat mudah dengan alat ini.
Inilah berita terbaik: tidak terlihat seperti mesin yang dalam. Saya memberinya beberapa foto saya dan memintanya untuk membuat video dengan dialog khusus dan tidak bertemu. Saya juga memintanya untuk menghidupkan beberapa sepatu bot raksasa ke dalam foto dan meninggalkan tempat kejadian; Dia mengukur boot dengan menginjak -injak trotoar dengan beberapa suara komik di latar belakang.
Saya lebih mudah menghasilkan video ketika indikasi saya kurang spesifik, ini adalah bagaimana saya mengkonfirmasi sesuatu Kolega saya Andrew Marino berkata: Saya melihat 3 sangat baik untuk membuat jenis konten YouTube dengan denominator yang lebih rendah yang ditujukan untuk anak -anak.
Jika Anda belum pernah mengalami sumur sampah yang tak ada habisnya pada anak -anak YouTube, izinkan saya menerangi. Bayangkan melihat representasi 3D terburuk dari truk monster yang mengemudi di sepanjang jalan, mendarat di bak cat warna. Di sebelahnya, truk monster lain mengarah ke jalan lain ke bak cat lain, kali ini, warna yang berbeda. Sekarang lihat itu lagi. Dan lagi. Dan lagi. Ada jam -jam hal ini di YouTube yang dirancang untuk menghipnotis anak -anak muda. Video -video ini biasanya tidak berbahaya, hanya kalori kosong yang dirancang untuk mengumpulkan pemandangan yang membuat cocomelon terlihat seperti Warga Kane. Dalam waktu sekitar 10 menit dengan saya melihat 3, saya melemparkan klip mengikuti formula dasar yang sama: lengkap dengan musik latar yang ceria. Tapi klip yang lebih mengkhawatirkan bagi saya adalah dua kucing kartun di dermaga.
Saya pikir akan menyenangkan bagi kucing untuk mengeluh bahwa ikan tidak menggigit. Hanya dalam beberapa menit, saya memiliki klip lengkap dengan dua kucing dan dialog yang dihasilkan oleh AI yang tidak pernah saya tulis. Jika sangat mudah untuk membuat klip 10 detik, merentangkannya dalam video YouTube tujuh menit akan sepele. Dalam bentuk mereka saat ini, klip melihat 2 lagi ketika mereka mencoba memperluasnya ke adegan yang lebih lama, yang menghilangkan audio. Tetapi cara Google mempromosikan alat -alat ini tanpa istirahat, saya tidak dapat membayangkan bahwa itu akan memiliki waktu yang lama sebelum saya dapat mengedit video lengkap dengan saya melihat 3.
Jujur, saya bertanya -tanya apakah jenis penggunaan ini untuk video yang dihasilkan oleh AI adalah karakteristik dan bukan kesalahan. Google menunjukkan kepada kami video elegan yang dihasilkan oleh pembuat film asli, termasuk Eliza McNittItu bekerja dengan Darren Aronofsky dalam film baru dengan beberapa elemen yang dihasilkan oleh AI. Dan tentu saja, video AI bisa menjadi alat yang menarik di tangan kanan. Tapi saya pikir apa yang paling mungkin dilihat adalah proliferasi dari jenis gambar lembut yang AI sangat baik untuk dihasilkan – Kali ini, dalam stereo.