Breaking News

CEO antropik, Dario Amodei, memperingatkan tentang ‘ras’ untuk memahami AI karena menjadi lebih kuat

CEO antropik, Dario Amodei, memperingatkan tentang ‘ras’ untuk memahami AI karena menjadi lebih kuat

Tepat setelah akhir dari KTT Tindakan AI Di Paris, co -founder dan CEO Anthrope Dario Amodei ditelepon Acara ini adalah “peluang yang hilang.” Dia menambahkan bahwa “pendekatan dan urgensi yang lebih besar diperlukan pada beberapa masalah mengingat ritme yang terjadi pada teknologi” Deklarasi diterbitkan pada hari Selasa.

Perusahaan AI mengadakan acara yang berfokus pada pengembang di Paris dalam hubungannya dengan startup French DebuDan TechCrunch memiliki kesempatan untuk mewawancarai Amodei di atas panggung. Dalam acara tersebut, ia menjelaskan garis pemikirannya dan mempertahankan jalan ketiga yang bukan optimisme murni atau kritik murni tentang masalah inovasi dan tata kelola AI, masing -masing.

“Saya dulu seorang ahli saraf, di mana pada dasarnya saya mencari otak yang nyata untuk hidup. Dan sekarang kami ingin mencari nafkah dengan otak buatan. Jadi, dalam beberapa bulan mendatang, kami akan memiliki beberapa kemajuan menarik di bidang interpretabilitas, di mana kami benar -benar mulai memahami bagaimana model bekerja, ”kata Amodei kepada TechCrunch.

“Tapi itu pasti karier. Ini adalah perlombaan antara membuat model lebih kuat, yang sangat cepat bagi kami dan sangat cepat untuk orang lain, Anda benar -benar tidak dapat mengurangi kecepatan, bukan? … Pemahaman kita harus mengimbangi kemampuan kita untuk membangun sesuatu. Saya pikir itulah satu -satunya jalan, ”tambahnya.

Dari yang pertama KTT AI di Bletchley Di Inggris, nada diskusi tentang tata kelola AI telah berubah secara signifikan. Ini sebagian karena lanskap geopolitik saat ini.

“Saya tidak di sini pagi ini untuk berbicara tentang keamanan AI, yang merupakan judul konferensi beberapa tahun yang lalu”, Wakil Presiden Amerika Serikat JD Vance mengatakan di KTT Aksi AI pada hari Selasa. “Aku di sini untuk membicarakan kesempatan AI.”

Menariknya, Amodei berusaha menghindari antagonisasi ini antara keamanan dan peluang. Faktanya, dia percaya bahwa pendekatan keamanan yang lebih besar adalah Kesempatan.

“Di KTT asli, KTT Bletchley di Inggris, ada banyak diskusi tentang bukti dan langkah -langkah untuk berbagai risiko. Dan saya tidak berpikir hal -hal ini memperlambat teknologi, ”kata Amodei dalam acara antropik. “Bagaimanapun, melakukan jenis pengukuran ini telah membantu kami lebih memahami model kami, yang pada akhirnya membantu kami menghasilkan model yang lebih baik.”

Dan setiap kali Amodei memberi penekanan pada keamanan, ia juga suka mengingat semua orang bahwa antrop masih sangat fokus pada konstruksi model perbatasan.

“Saya tidak ingin melakukan apa pun untuk mengurangi janji. Kami menyediakan model setiap hari di mana orang dapat membangun dan yang digunakan untuk melakukan hal -hal luar biasa. Dan kita pasti harus berhenti melakukan itu, ”katanya.

“Ketika orang -orang berbicara banyak tentang risikonya, itu sedikit mengganggu saya dan saya berkata:” Oh, kawan, tidak ada yang benar -benar melakukan pekerjaan dengan baik dengan mengekspos seberapa baik teknologi ini, “tambahnya kemudian dalam percakapan.

Biaya pelatihan Deepseek “tidak tepat”

Saat percakapan berubah menjadi Pencipta Cina LLM DeepseekModel -model terbaru, Amodei meminimalkan pencapaian teknis dan mengatakan dia merasa bahwa reaksi publik itu “anorganik.”

“Jujur, reaksiku sangat kecil. Kami telah melihat V3, yang merupakan model dasar untuk Depseek R1, pada bulan Desember. Dan itu adalah model yang mengesankan, ”katanya. “Model yang diluncurkan pada bulan Desember adalah tentang jenis kurva reduksi biaya yang sangat normal yang telah kita lihat dalam model dan model lainnya.”

Yang luar biasa adalah bahwa model tersebut tidak meninggalkan “laboratorium perbatasan tiga atau empat” yang berbasis di model AS.

“Dan itu masalah perhatian geopolitik bagi saya. Saya tidak pernah ingin pemerintah otoriter mendominasi teknologi ini, ”katanya.

Adapun biaya pelatihan Deepseek yang seharusnya, mereka mengesampingkan gagasan bahwa pelatihan Deepsek V3 100 kali lebih murah dibandingkan dengan biaya pelatihan di Amerika Serikat ” [it] Itu sama sekali tidak perlu dan tidak didasarkan pada fakta, ”katanya.

Model Claude berikutnya dengan penalaran

Sementara Amodei tidak mengumumkan model baru dalam acara hari Rabu, ia mengolok -olok beberapa rilis perusahaan berikutnya, dan ya, termasuk beberapa kemampuan penalaran.

“Kami umumnya fokus pada mencoba membuat pendapat kami sendiri tentang model penalaran yang berbeda lebih baik. Kami peduli untuk memastikan kami memiliki kapasitas yang cukup, bahwa model menjadi lebih pintar dan khawatir tentang hal -hal keamanan, ”kata seorang amodei.

Salah satu masalah yang dicoba dipecahkan antrop adalah teka -teki pemilihan model. Jika Anda memiliki akun ChatGPT Plus, misalnya, mungkin sulit untuk mengetahui model mana yang harus Anda pilih di jendela pemilihan model yang muncul untuk pesan Anda berikutnya.

Kredit gambar:CHATGPT SCREEN CAPTURE

Hal yang sama berlaku untuk pengembang yang menggunakan API dari Model Bahasa Besar (LLM) untuk aplikasi mereka sendiri. Mereka ingin menyeimbangkan sesuatu antara ketepatan, kecepatan tanggapan dan biaya.

“Kami agak bingung dengan gagasan bahwa ada model normal dan bahwa ada model penalaran dan bahwa mereka adalah sesuatu yang berbeda satu sama lain,” kata Amodei. “Jika saya berbicara dengan Anda, Anda tidak memiliki dua otak dan salah satunya merespons segera dan saya menyukainya, yang lain menunggu lebih lama.”

Menurutnya, tergantung pada pintu masuk, harus ada transisi yang lebih lembut antara model yang dilatih sebelumnya seperti Claude 3.5 soneta atau GPT-4O dan model yang dilatih dengan pembelajaran penguatan dan yang dapat menghasilkan rantai pemikiran (COT) seperti Openi’s O1 atau R1 Deepseek.

“Kami percaya bahwa ini harus ada sebagai bagian dari entitas berkelanjutan tunggal. Dan kita mungkin belum berada di sana, tetapi antrope benar -benar ingin memindahkan barang -barang ke arah itu, ”kata Amodei. “Kita harus memiliki transisi yang lebih lembut ke itu ke model yang terlatih sebelumnya, bukannya ‘di sini adalah masalahnya dan di sini adalah B'”, “tambahnya.

Karena perusahaan besar seperti Anthrope terus meluncurkan model yang lebih baik, Amodei percaya bahwa itu akan membuka beberapa peluang besar untuk mengganggu perusahaan besar di dunia di semua industri.

“Kami bekerja dengan beberapa perusahaan farmasi untuk menggunakan Claude untuk menulis studi klinis, dan mereka telah dapat mengurangi waktu bahwa laporan studi klinis 12 minggu telah menulis hingga tiga hari,” kata Amodei.

“Di luar biomedis, ada hukum, keuangan, asuransi, produktivitas, perangkat lunak, hal -hal di sekitar energi. Saya percaya bahwa pada dasarnya akan ada, kelahiran kembali inovasi yang mengganggu di ruang aplikasi AI. Dan kami ingin membantunya, kami ingin mendukung segalanya, ”pungkasnya.

Baca liputan lengkap kami KTT Aksi Kecerdasan Buatan di Paris.

TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini Untuk mendapatkannya di baki masuk Anda setiap hari Rabu.

Sumber