Pengacara untuk The New York Times dan Daily News, yaitu menggugat OpenAI karena diduga menghapus pekerjaan mereka untuk melatih model AI mereka tanpa izin, mereka mengatakan para insinyur OpenAI secara tidak sengaja menghapus data yang mungkin relevan dengan kasus tersebut.
Awal musim gugur ini, OpenAI setuju untuk menyediakan dua mesin virtual sehingga pengacara di The Times dan Daily News dapat melakukan pencarian konten berhak cipta di set pelatihan AI mereka. (Mesin virtual adalah komputer berbasis perangkat lunak yang ada dalam sistem operasi komputer lain dan sering digunakan untuk pengujian, pencadangan data, dan menjalankan aplikasi.) suratPengacara penerbit mengatakan bahwa mereka dan para ahli yang mereka pekerjakan telah menghabiskan lebih dari 150 jam sejak 1 November untuk mencari data pelatihan OpenAI.
Namun pada tanggal 14 November, para insinyur OpenAI menghapus semua data pencarian penerbit yang disimpan di salah satu mesin virtual, menurut surat yang disebutkan di atas, yang diajukan ke Pengadilan Distrik AS untuk Distrik Selatan dari New York pada Rabu malam.
OpenAI berupaya memulihkan data dan meraih kesuksesan besar. Namun, karena struktur folder dan nama file “tidak dapat diambil kembali” hilang, data yang dipulihkan “tidak dapat digunakan untuk menentukan di mana artikel yang disalin oleh penggugat berita digunakan untuk membuat [OpenAI’s] model,” menurut surat itu.
“Penggugat berita telah dipaksa untuk membuat ulang karya mereka dari awal dengan menggunakan jam kerja dan waktu pemrosesan komputer yang signifikan,” tulis pengacara The Times dan Daily News. “Penggugat berita mengetahui kemarin bahwa data yang dipulihkan tidak dapat digunakan dan bahwa pekerjaan selama seminggu penuh oleh para ahli dan pengacara mereka harus diperbaiki, itulah sebabnya surat tambahan ini diajukan hari ini.”
Pengacara penggugat menjelaskan bahwa mereka tidak punya alasan untuk percaya bahwa penghapusan itu disengaja. Namun mereka mengatakan bahwa insiden tersebut menggarisbawahi bahwa OpenAI “berada dalam posisi terbaik untuk mencari kumpulan datanya sendiri” untuk mengetahui potensi pelanggaran konten menggunakan alatnya sendiri.
Juru bicara OpenAI menolak memberikan pernyataan.
Namun pada Jumat malam, 22 November, pengacara OpenAI mengajukan a menjawab surat yang dikirim oleh pengacara The Times dan Daily News pada hari Rabu. Dalam tanggapan mereka, pengacara OpenAI dengan tegas menyangkal bahwa OpenAI menghapus bukti apa pun dan sebaliknya menyatakan bahwa penggugat harus disalahkan atas kesalahan konfigurasi sistem yang menyebabkan masalah teknis.
“Penggugat meminta perubahan konfigurasi pada salah satu dari beberapa mesin yang disediakan OpenAI untuk mencari kumpulan data pelatihan,” tulis pengacara OpenAI. “Namun pelaksanaan perubahan yang diminta penggugat mengakibatkan terhapusnya struktur folder dan beberapa nama file pada hard disk, disk yang seharusnya digunakan sebagai cache sementara… Bagaimanapun, ada tidak ada alasan untuk berpikir bahwa beberapa file benar-benar hilang.”
Dalam kasus ini dan kasus lainnya, OpenAI berpendapat bahwa model pelatihan yang menggunakan data yang tersedia untuk umum (termasuk artikel dari The Times dan Daily News) adalah penggunaan wajar. Dengan kata lain, saat membuat model seperti GPT-4obahwa “belajar” dari miliaran contoh dari e-book, esai, dan lainnya untuk menghasilkan teks yang terdengar manusiawi, OpenAI percaya bahwa tidak perlu melisensikan atau membayar contoh, bahkan jika Anda menghasilkan uang dari model tersebut. .
Meskipun demikian, OpenAI telah menandatangani kesepakatan lisensi dengan semakin banyak penerbit baru, termasuk Associated Press, pemilik Business Insider Axel Springer, Financial Times, perusahaan induk People Dotdash Meredith, dan News Corp. OpenAI telah menolak untuk mematuhi persyaratan mereka. penawaran umum, tetapi mitra konten, Dotdash, yang melakukannya dilaporkan menerima pembayaran minimal $16 juta per tahun.
OpenAI tidak mengonfirmasi atau menyangkal bahwa mereka melatih sistem AI-nya pada karya berhak cipta tertentu tanpa izin.
Pembaruan: Menambahkan tanggapan OpenAI terhadap tuduhan tersebut.