Breaking News

AI adalah ‘babi energi’, tetapi Deepseek bisa mengubahnya

AI adalah ‘babi energi’, tetapi Deepseek bisa mengubahnya

Veteran Mereka mengejutkan semua orang Bulan lalu dengan pernyataan bahwa model AI -nya menggunakan sekitar sepersepuluh dari jumlah kekuatan komputer sebagai model target memanggil 3.1, yang kembali ke seluruh visi tentang berapa banyak energi dan sumber daya yang diperlukan untuk mengembangkan kecerdasan buatan.

Dibawa ke surat itu, pernyataan itu bisa memiliki implikasi yang luar biasa untuk dampak lingkungan AI. Raksasa teknologi dilarikan untuk membangun pusat data AI besar -besaran, dengan rencana sehingga beberapa menggunakan begitu banyak listrik Seperti kota kecil. Menghasilkan begitu banyak listrik menciptakan polusi, yang meningkatkan kekhawatiran tentang bagaimana infrastruktur fisik yang mendukung alat generatif AI baru dapat memperburuk perubahan iklim dan memperburuk kualitas udara.

Mengurangi jumlah energi yang dibutuhkan untuk melatih dan melaksanakan model generatif dapat menghilangkan banyak stres itu. Tetapi masih terlalu dini untuk mengevaluasi apakah Deepseek akan menjadi perubahan permainan ketika datang ke jejak lingkungan AI. Banyak yang tergantung pada bagaimana pemain penting lainnya menanggapi kemajuan startup Cina, terutama dengan mempertimbangkan Berencana untuk membangun pusat data baru.

“Ada opsi dalam masalah ini.”

“Itu hanya menunjukkan bahwa AI tidak harus menjadi babi energi,” katanya Madalsa SinghAnggota penelitian postdoctoral di University of California, Santa Barbara, yang mempelajari sistem energi. “Ada opsi dalam masalah ini.”

Keributan di sekitar Deepseek dimulai dengan peluncuran model V3 -nya pada bulan Desember, yang hanya menelan biaya $ 5,6 juta untuk karir pelatihan terakhirnya dan 2,78 juta jam GPU untuk berlatih di chip H800 yang lebih besar dari NVIDIA, menurut a Laporan Teknis perusahaan. Sebagai perbandingan, model tujuan memanggil 3.1 405b, meskipun menggunakan chip H100 yang lebih efisien dan lebih efisien, ia mengambil 30,8 juta jam GPU kereta. (Kami tidak tahu biaya pastinya, tetapi perkiraan untuk Flame 3.1 405b telah ada $ 60 juta dan antara $ 100 juta dan $ 1 miliar Untuk model yang sebanding.)

Kemudian, Depseek meluncurkan model R1 minggu lalu, yang berisiko kapitalis Marc Andreessen menelepon “Hadiah yang mendalam untuk dunia. “Asisten perusahaan dengan cepat Top -shot toko aplikasi Apple dan Google. Dan pada hari Senin, ia mengirim harga tindakan pesaing ke gangguan pada asumsi bahwa Depseek dapat membuat alternatif untuk api, Gemini dan chatgpt untuk sebagian kecil dari anggaran. Nvidia, yang chipnya memungkinkan semua teknologi ini, melihat bahwa harga tindakan mereka runtuh dalam berita bahwa Deepseek V3 hanya membutuhkan 2.000 chip untuk berlatihdibandingkan dengan 16.000 chip atau yang paling diperlukan untuk pesaing mereka.

Deepseek mengatakan bahwa itu dapat mengurangi jumlah listrik yang dikonsumsi melalui penggunaan metode pelatihan yang lebih efisien. Dalam istilah teknis, gunakan a Strategi kehilangan tambahan. Singh mengatakan bahwa mereka direduksi menjadi lebih selektif dengan bagian -bagian model yang dilatih; Anda tidak perlu melatih seluruh model secara bersamaan. Jika Anda berpikir tentang model AI sebagai perusahaan layanan pelanggan besar dengan banyak ahli, kata Singh, lebih selektif untuk memilih yang dimanfaatkan oleh para ahli.

Model ini juga menghemat energi dalam hal inferensi, yaitu ketika model memiliki tugas melakukan sesuatu, melalui apa yang disebut Status cache dari nilai kunci dan kompresi. Jika Anda menulis cerita yang memerlukan penelitian, Anda mungkin berpikir bahwa metode ini mirip dengan dapat merujuk ke kartu indeks dengan ringkasan tingkat tinggi saat menulis alih -alih harus membaca laporan lengkap yang telah diringkas, kata Singh.

Apa yang Singh sangat optimis adalah bahwa model Deepseek sebagian besar adalah open source, kecuali data pelatihan. Dengan pendekatan ini, para peneliti dapat belajar dari satu sama lain lebih cepat, dan membuka pintu bagi pemain yang lebih kecil untuk memasuki industri. Ini juga menetapkan preseden untuk lebih banyak transparansi dan tanggung jawab bagi investor dan konsumen untuk lebih kritis terhadap sumber daya apa yang akan mengembangkan model.

Ada pedang double -dedged untuk dipertimbangkan

“Jika kami telah menunjukkan bahwa kemampuan AI canggih ini tidak memerlukan sumber daya besar seperti itu, ia akan membuka lebih banyak ruang untuk bernafas untuk perencanaan infrastruktur yang lebih berkelanjutan,” kata Singh. “Ini juga dapat mendorong laboratorium ini yang didirikan saat ini, seperti AI Open, Anthrope, Google Gemini, menuju pengembangan algoritma dan teknik yang lebih efisien dan melampaui semacam pendekatan kekuatan kotor untuk hanya menambahkan lebih banyak data dan kekuatan komputer ke model -model ini. “

Tanpa ragu, masih ada keraguan tentang Deepseek. “Kami telah jatuh sedikit di Deepseek, tetapi sulit untuk menemukan fakta konkret tentang konsumsi energi program,” kata Carlos Torres Díaz, kepala penelitian energi di Rystad Energy, dalam email.

Jika apa yang dinyatakan perusahaan tentang penggunaan energinya benar, itu dapat mengurangi total konsumsi energi dari pusat data, tulis Torres Díaz. Dan meskipun perusahaan teknologi besar telah menandatangani sejumlah besar perjanjian untuk memperoleh energi terbarukan, permintaan listrik pusat data masih berisiko mengalihkan sumber daya matahari dan angin yang terbatas dari jaringan listrik. Mengurangi konsumsi listrik dari AI “pada gilirannya akan membuat lebih banyak energi terbarukan tersedia untuk sektor lain, membantu memindahkan bahan bakar lebih cepat lebih cepat,” menurut Torres Díaz. “Secara umum, permintaan energi yang lebih rendah dari sektor apa pun bermanfaat untuk transisi energi global, karena generasi energi yang kurang diumpankan oleh fosil jangka panjang akan diperlukan.”

Ada pedang bermata ganda untuk dipertimbangkan dengan model energi yang lebih efisien. CEO Microsoft Satya Nadella menulis dalam x tentang Paradoks JevonsDi mana semakin efisien menjadi teknologi, semakin besar kemungkinan itu akan digunakan. Kerusakan lingkungan tumbuh sebagai akibat dari keuntungan efisiensi.

“Pertanyaannya adalah, Wah, jika kita bisa menghilangkan penggunaan energi dari AI untuk faktor 100, apakah itu berarti akan ada 1.000 pemasok data yang akan masuk dan berkata: ‘Wow, ini hebat? Apakah kita akan membangun, membangun, membangun 1.000 kali bahkan dalam apa yang kita rencanakan? “Philip Kerin, Profesor Penelitian Teknik Listrik dan Komputer di University of Illinois Urbano-Champaign.” Prakiraan konsumsi energi “sangat rendah”.

Tidak peduli bagaimana listrik yang digunakan pusat data, penting untuk mengamati dari mana listrik itu berasal untuk memahami berapa banyak polusi yang diciptakan. Cina masih dipahami Lebih dari 60 persen listrik batubaradan yang lain 3 persen Itu berasal dari gas. Amerika Serikat juga dipahami 60 persen listrik bahan bakar fosilnyaTapi sebagian besar berasal dari gas, yang Buat lebih sedikit polusi karbon dioksida Saat batu bara dibakar.

Untuk memperburuk keadaan, perusahaan energi Tunda penarikan pembangkit listrik bahan bakar fosil di AS. Beberapa bahkan merencanakan Bangun tanaman gas baru. Membakar lebih banyak bahan bakar fosil pasti menyebabkan lebih dari polusi yang disebabkan oleh perubahan iklim, serta polutan udara lokal Itu meningkatkan risiko kesehatan untuk komunitas terdekat. Pusat data juga Kait banyak air Untuk mencegah perangkat keras dari kepanasan, yang dapat menyebabkan lebih banyak stres di daerah yang ditentukan kekeringan.

Itulah semua masalah yang dapat diminimalkan oleh pengembang IA membatasi penggunaan energi secara umum. Pusat data tradisional telah dapat melakukannya di masa lalu. Meskipun beban kerja yang hampir tiga kali lipat antara 2015 dan 2019, permintaan energi berhasil tetap relatif stabil selama periode waktu itu, Menurut Goldman Sachs Research. Pusat data menjadi jauh lebih lapar akan energi sekitar tahun 2020 dengan kemajuan AI. Mereka mengkonsumsi lebih dari 4 persen listrik di Amerika Serikat pada tahun 2023, dan itu hampir tiga kali lipat sekitar 12 persen pada tahun 2028, menurut a Laporan Desember Laboratorium Nasional Lawrence Berkeley. Sekarang ada lebih banyak ketidakpastian tentang jenis proyeksi ini, tetapi memanggil setiap tembakan berdasarkan Depseek pada saat ini tetap menjadi peluang dalam kegelapan.

Sumber