Breaking News

Para peneliti mengatakan AI gagal menggambarkan kompleksitas Holocaust

Para peneliti mengatakan AI gagal menggambarkan kompleksitas Holocaust


Model kecerdasan buatan (AI) yang tersedia di domain publik tidak memberikan “kompleksitas dan nuansa masa lalu” dan hanya menawarkan cerita yang terlalu disederhanakan tentang Holocaust, menurut laboratorium penelitian Holocaust internasional.

Pada bulan November 2024, Universitas Sussex meluncurkan Landecker Digital Memory Lab, sebuah inisiatif untuk “memastikan masa depan yang berkelanjutan untuk memori dan pendidikan Holocaust di era digital.”

Menurut ringkasan kebijakan berbasis penelitian yang diserahkan oleh laboratorium tersebut kepada International Holocaust Remembrance Alliance (IHRA), Apakah AI mempunyai tempat di masa depan memori Holocaust?Penggunaan AI dalam peringatan dan pendidikan Holocaust menimbulkan masalah karena model konvensional, termasuk Sistem AI Generatif (GenAI) seperti ChatGPT dan Gemini – tidak memiliki “data yang baik” mengenai Holocaust dan membutuhkan “representasi yang memadai” dari para ahli mengenai topik ini.

Peneliti utama laboratorium tersebut, Victoria Grace Richardson-Walden, merekomendasikan (dalam seruan mendesak kepada semua pemangku kepentingan yang terlibat dalam memori dan pendidikan Holocaust, serta pembuat kebijakan) untuk membantu memecahkan masalah ini dengan mendigitalkan data dan pengalaman manusia mereka, daripada hanya membawa orang ke ke situs dan museumnya.

“Sangat sedikit dari mereka yang memiliki strategi digitalisasi yang jelas,” katanya tentang sektor pendidikan dan memori Holocaust, yang mencakup arsip, museum, situs peringatan, dan perpustakaan di seluruh dunia. “Mereka hanya mendigitalkan konten materi atau kesaksian mereka untuk pameran tertentu.”

“Ini adalah masalah yang mendesak bagi warisan budaya secara umum,” kata Richardson-Walden, mengacu pada perang di Ukraina dan Timur Tengah.

“Semua aset, semua ini berada dalam risiko material,” katanya. “Telah terjadi instrumentalisasi sejarah di semua sisi spektrum politik untuk berbagai tujuan politik. Ketika hal itu menjadi terlalu keras di media sosial, nuansanya hilang. “Di situlah urgensinya.”

Pendekatan yang tidak dapat diandalkan

Richardson-Walden menyoroti bahwa sistem GenAI bukanlah “mesin pengetahuan”. hanya menetapkan nilai numerik probabilistik pada kata-kata dan rangkaian kata, bukan pada nilai berdasarkan makna historis dan budayanya. Hal ini menyebabkan fakta dan cerita yang kurang diketahui terkubur, karena sistem cenderung hanya mereproduksi hasil “kanonik” yang paling terkenal dan berfokus pada cerita paling terkenal.

“Ini memberi Anda judul dan tanggapan singkat,” katanya, menjelaskan tanggapan umum terhadap kueri yang dibuat ke ChatGPT. “Gagasan untuk merangkum cerita yang sangat kompleks ini bermasalah. “Anda tidak bisa menyimpulkan apa yang terjadi selama enam tahun di banyak negara dan berdampak pada berbagai orang dan pelaku.”

Penelitian ini tidak berupaya memberikan jawaban atas pertanyaan kompleks ini. Sebaliknya, harapan Richardson-Walden mencari alternatif dalam diskusi dengan rekan-rekan ilmu komputer dan tekniknya. “Penanda budaya sulit untuk dikodekan dan kemudian dimasukkan ke dalam data pelatihan,” katanya.

Richardson-Walden juga menyoroti perlunya “data yang baik” dalam model bisnis GenAI, terutama yang berkaitan dengan topik sensitif dalam sejarah seperti yang melibatkan genosida, penganiayaan, konflik, atau kekejaman.

“Data yang baik berasal dari organisasi Holocaust, namun pertama-tama data tersebut harus didigitalkan secara strategis, dan metadata yang menyertainya harus benar dan terstandarisasi,” katanya.

Masalah lain yang disoroti oleh laporan kebijakan laboratorium ini adalah sensor mandiri terprogram di sebagian besar model pencitraan komersial GenAI. Hampir setiap kali suatu sistem diminta untuk menghasilkan gambar Holocaust, sistem tersebut menolak dan pengguna menghadapi pedoman sensor.

Tulisan tersebut mengutip contoh Dall-E, generator gambar OpenAI. “Yang bisa ditawarkan hanyalah menghasilkan gambar mahkota, tangan orang tua dan pagar kawat berduri, atau gambar seperti hantu di perpustakaan,” ujarnya.

Richardson-Walden menambahkan: “Anda akhirnya membuat Holocaust tidak terlihat atau mengabstraksikannya hingga mencapai titik absurditas. Jadi gagasan untuk menerapkan sensor dalam program Anda adalah hal yang baik sebagai pendekatan moral yang justru menciptakan efek sebaliknya.”

Dia percaya itu, meskipun demikian pagar lebih baik daripada menghasilkan data yang salah atau terdistorsi, mereka juga mencegah orang mempelajari sejarah dan pelajarannya, menambahkan bahwa para pengembang model ini harus menemukan “jalan tengah” dalam hambatan keamanan mereka yang mencegah informasi yang salah tentang Holocaust, tetapi juga jangan mengesampingkan mereka dengan melarang informasi mengenai Holocaust bagi generasi mendatang yang bergantung pada media digital.

“Jalan [middle ground] Apa yang dicapai adalah melalui dialog,” kata Richardson-Walden. “Perlu ada ruang untuk menghasilkan lebih banyak diskusi dengan OpenAI, Meta, Google, duduk bersama lembaga-lembaga seperti PBB, dan bersama kami di laboratorium.” Dia menambahkan bahwa Landecker menawarkan konsultasi gratis untuk membahas pendekatan bagi perusahaan teknologi yang berpartisipasi dalam peringatan Holocaust untuk pertama kalinya.

“Segera setelah mereka menyelidikinya, [they] “Saya menyadari ini sangat kompleks dan politis, dan ada bidang etika dan digital baru yang tidak pernah Anda pikirkan,” katanya.

Pendarat situs web menyebutkan bahwa contoh paling menonjol dari digitalisasi memori Holocaust adalah model AI yang dikenal sebagai Dimensions in Testimony, yang dikembangkan oleh Shoah Foundation USC. Ini adalah contoh model GenAI khusus domain, yang digambarkan sebagai model bahasa kecil, yang “sangat diawasi” dan bergantung pada “intervensi manusia secara substansial”. Pengguna dan akademisi dapat berinteraksi dengannya dengan mengajukan pertanyaan yang ditanggapi oleh model dengan kesaksian dari para penyintas dan jawaban dari para ahli yang telah dimasukkan ke dalamnya.

Namun, laboratorium dan pusat memori lain mungkin tidak memiliki sumber daya dan pendanaan yang sama dengan laboratorium Landecker. Oleh karena itu, fokusnya harus pada digitalisasi aset secara massal, yang kemudian dapat digunakan untuk memberikan informasi kepada model bisnis besar secara bertanggung jawab.



Source link