Breaking News

Pasar baru untuk data AI

Pasar baru untuk data AI

Buka kunci ringkasan editor secara gratis

Penulis adalah Perbankan Investasi Global di Goldman Sachs.

Data adalah dasar dari revolusi kecerdasan buatan, tetapi AI juga merevolusi pasar data. Pengembang berlari untuk berinvestasi miliaran dolar untuk membangun infrastruktur untuk meningkatkan sistem AI yang luas. Ekspansi yang cepat ini telah menyebabkan peningkatan permintaan data, menciptakan potensi bagi perusahaan untuk menghasilkan nilai ekonomi yang signifikan.

Sistem AI umumnya digambarkan memiliki tiga komponen utama: daya, komputasi dan data. Ini merujuk pada listrik yang diperlukan untuk memberi makan pusat data, chip yang diperlukan untuk melakukan perhitungan dengan kecepatan luar biasa dan data yang diperlukan untuk melatih model AI. Dari komponen -komponen penting ini, adalah data yang dibahas lebih sedikit, mungkin karena pusat data dan semikonduktor Mereka adalah hal fisik yang dapat Anda lihat dan sentuh. (Memang benar bahwa sulit untuk mempertahankan paket data selama catatan kunci di atas panggung).

Tetapi pasokan data merupakan aspek penting dari ekosistem ekspansi cepat. Menurut beberapa perkiraan, dunia kehabisan “organik” dataDengan model pengembang yang mencapai batas data yang tersedia untuk umum, pada dasarnya salinan semua internet, ke outlet yang selalu lebih besar.

Setelah model AI dibangun dan sebelumnya dilatih dalam set data besar, mereka masih membutuhkan “waktu percobaan” tambahan di mana model yang menjawab pertanyaan spesifik atau memecahkan masalah ditanyakan. Ini membutuhkan tipe data yang benar, yang terkadang hilang.

Ada kekurangan data pelatihan yang cukup yang menunjukkan manusia “menunjukkan pekerjaan mereka” dalam langkah -langkah untuk mengatasi masalah yang kompleks. Di sinilah perusahaan dengan set data terfokus, terorganisir dengan baik atau sangat logis dapat menjadi relevan. Bayangkan bagaimana perusahaan buku teks dapat menggunakan manual teknis dan kursus untuk melatih sistem AI untuk melakukan proses ilmiah yang kompleks.

Perjanjian lisensi data terbaru menunjukkan bagaimana perusahaan yang berbeda menjual akses ke data mereka ke perusahaan AI. Tunggu tren ini berakselerasi ketika perusahaan menjadi lebih kreatif dalam melakukannya. Sampai sekarang, perjanjian ini telah dinegosiasikan secara individual dengan persyaratan khusus, tetapi dapat membayangkan pasar, atau beberapa pasar, untuk pelatihan data.

Data sintetis, atau data yang dibuat setidaknya oleh sistem AI, adalah bagian penting dari pengembangan model bahasa besar dan telah menjadi rute untuk memperluas serangkaian opsi untuk pengembang yang mencari set data baru.

Misalnya, ketika teknologi robot menjadi lebih canggih, sistem IA dapat menciptakan lebih banyak peta lingkungan fisik kita. Data sintetis untuk mengemudi otonom mungkin melibatkan pembentukan “kembar digital” Los Angeles dan memiliki jutaan kendaraan yang “disimulasikan” berlayar di kota di ruang virtual seperti data pelatihan.

Dan ada kemungkinan bahwa tipe data yang sebelumnya sulit dianalisis atau digunakan menjadi baru diakses dan berharga dengan kekuatan komputasi sistem AI yang luar biasa. Pikirkan tentang data yang telah kami kumpulkan pada sistem kompleks seperti iklim, mekanika kuantum atau mutasi virus. Karena robot dapat memahami kategori data lengkap yang tidak terlihat oleh manusia, koleksi ruang dan data spasial juga dapat tiba -tiba memiliki nilai baru.

Tesla menggunakan data yang dikumpulkan oleh armada kendaraan mengemudi otonom untuk melatih model AI yang memberi makan teknologi mengemudi otonom yang mendasarinya. Dan Nvidia baru -baru ini mengumumkan perluasan lingkungan simulasi robotnya, di mana Anda melatih robot Anda dalam representasi digital virtual dari dunia fisik.

Salah satu repositori data yang paling berharga adalah data yang dihasilkan oleh manusia yang tetap diblokir: penelitian yang dipatenkan di belakang firewall perusahaan dan pemerintah. Saat ini, pemegang data ini enggan membuatnya dapat diakses tanpa mengetahui implikasinya. Tetapi struktur dan insentif yang benar dapat mengundang lebih banyak penawaran.

Dalam istilah praktis, perusahaan yang berbeda akan merancang strategi yang berbeda. Beberapa akan menangani data sebagai aset komersial pusat, bukan sebagai produk sampingan, dan akan bekerja untuk memonetisasi mereka melalui lisensi atau langganan. Orang lain perlu memperbarui infrastruktur data Anda untuk memanfaatkan kapasitas AI di masa depan.

Bagaimana yurisdiksi yang berbeda memutuskan untuk mengatur AI dan bahkan lebih banyak mengatur penggunaan data akan memiliki implikasi yang mendalam tentang bagaimana pasar -pasar ini berkembang dan di mana. Privasi dan Keselamatan Data, Pertanyaan tentang Asal Data, Properti, Otentikasi, semuanya merupakan bidang undang -undang potensial yang baru.

Periode inovasi dan agitasi yang luar biasa ini menawarkan peluang bagi perusahaan yang mendapatkan strategi data yang benar.

Sumber

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *