Startup Tiongkok DeepSeek telah membuat kemajuan signifikan dalam lanskap AI generatif dengan peluncuran terobosan model bahasa skala besar (LLM) terbarunya, yang sebanding dengan model terkemuka dari kelas berat seperti OpenAI.
Model V3 DeepSeek, yang dilatih hanya selama dua bulan dengan menggunakan sumber daya komputasi yang jauh lebih sedikit, memberikan kinerja yang setara dengan model eksklusif terkemuka di dunia, GPT-4o, dengan biaya yang jauh lebih rendah dibandingkan para pesaingnya, menurut perusahaan yang berbasis di AS.
DeepSeek-V3 menjadikannya “hari ini terlihat mudah dengan versi terbuka LLM tingkat perbatasan yang dilatih dengan anggaran lelucon (2048 GPU selama 2 bulan, $6 juta),” anggota pendiri OpenAI Andrej Karpathy memposting di Platform jejaring sosial
“Ini adalah rekayasa yang bersih dengan keterbatasan sumber daya… semuanya tampak begitu elegan,” kata Tim Dettmers, ilmuwan riset di Allen AI, dalam X.
Alat open source DeepSeek yang baru menunjukkan perubahan dalam ambisi AI Tiongkok, yang menunjukkan bahwa mengejar ChatGPT bukan lagi tujuannya. Sebaliknya, perusahaan teknologi Tiongkok kini fokus menawarkan layanan AI yang lebih terjangkau dan serbaguna.
Menurut laporan tahun 2024 oleh Pusat Informasi Jaringan Internet Tiongkok, pada Juni 2024, 230 juta pengguna di Tiongkok telah mendaftar untuk menggunakan produk yang didukung oleh AI generatif.
Pada bulan November, startup AI yang berbasis di Beijing, Shengshu Technology, meluncurkan alat konversi gambar-ke-video yang disebut Vidu-1.5, yang mampu menghasilkan video hanya dari tiga gambar masukan dalam 30 detik sekaligus membangun hubungan logis antara objek-objek tersebut dalam sebuah adegan.
Performanya yang mengesankan dengan cepat mendapatkan kekaguman luas baik di komunitas AI maupun industri film.
sony Racun: Tarian TerakhirDiputar di Tiongkok pada bulan Oktober, film tersebut disertai dengan video promosi bergaya tinta oleh Vidu. Dalam klip tersebut, tinta mekar di layar saat Venom berubah menjadi kuda perang, ikan, dan burung bangau, sebelum berubah menjadi lentera Kongming.
Menggunakan metode film tradisional untuk memproduksi trailer berdurasi 30 detik biasanya memakan waktu sekitar 30 hari, namun dengan Vidu, hanya membutuhkan waktu 10 hari kerja dan menghemat hampir 90 persen biaya pasca produksi, kata Zhang Xudong, direktur produk Teknologi Shengshu.
Desain AI juga dapat menginspirasi seniman, menawarkan ide-ide kreatif baru yang melebihi ekspektasi, tambah Zhang.
Pada bulan Maret, Wang Feng dan timnya di East China Normal University meluncurkan novel fantasi buatan AI yang berisi jutaan kata. Rasul amanat surgawidibangun dengan model bahasa besar buatan sendiri. “Novel ini selesai hanya dalam waktu satu setengah bulan, sebuah prestasi yang membutuhkan waktu satu tahun penuh bagi seorang penulis yang berdedikasi untuk menyelesaikannya,” kata Wang.
Tim kemudian merilis novel kedua yang dihasilkan AI, Kebangkitan di era mesinyang menghadirkan narasi lebih mencekam, dengan rata-rata 1,5 konflik per bab dibandingkan 1,2 pada karya pertamanya.
Chatbot Xingye, yang dikembangkan oleh startup MiniMax yang berbasis di Shanghai, menggunakan kecerdasan buatan untuk memungkinkan pengguna berinteraksi dengan pasangan romantis virtual. Namun, basis pengguna mudanya telah menumbuhkan “suasana komunitas” yang unik, karena aplikasi ini menggabungkan chatbot AI dengan sistem kartu koleksi, sehingga menciptakan platform dinamis untuk konten buatan pengguna.
Chatbot ini menarik beragam penggemar budaya internet, mulai dari penggemar anime dan komik hingga cosplayer dan gamer, yang menggunakan karakter AI virtual untuk secara kolaboratif menciptakan narasi unik yang sangat relevan dengan komunitas masing-masing.
Versi internasional Xingye, Talkie, bersama dengan aplikasi AI Tiongkok lainnya, Poly.ai, berada di peringkat 10 besar aplikasi AI yang paling banyak diunduh di Amerika Serikat selama paruh pertama tahun 2024.
Tongyi LLM milik Alibaba, yang berspesialisasi dalam teknologi avatar digital, baru-baru ini mendapatkan ketenaran di Internet dengan fitur “Panggung Semua Orang”. Fitur inovatif ini mengubah foto menjadi video nyanyian atau tarian yang dinamis, menciptakan tren baru dalam dunia hiburan.
Pada bulan Juni, saat acara gala di China Central Television, teknologi yang dihasilkan oleh AI dari Tongyi memungkinkan Prajurit Terakota menampilkan bentuk seni tradisional Tiongkok dari melodi Huayin kuno.
Namun, penyalahgunaan teknologi kepala bicara telah menyebabkan peningkatan konten palsu, seperti menulis ulang karya klasik. Mimpi Kamar Merah seperti cerita seni bela diri.
Bulan lalu, badan pengawas penyiaran Tiongkok mengeluarkan peraturan baru untuk memperkuat pengawasan, menyoroti komitmen negara tersebut untuk memantau dengan cermat pertumbuhan AI yang pesat.
Xinhua