Singkatnya
- Yayasan Wikimedia telah mengumumkan serangkaian kemitraan dengan perusahaan AI untuk menggunakan kontennya dalam pelatihan LLM.
- Perusahaan AI tersebut telah mendaftar untuk produk Enterprise milik Wikimedia untuk penggunaan ulang konten Wikipedia dalam skala besar.
- Pada Oktober tahun lalu, yayasan menyatakan kunjungan ke situs menurun karena orang-orang menggunakan ringkasan AI alih-alih mengunjungi situs tersebut.
Yayasan Wikimedia telah mengumumkan serangkaian kemitraan baru dengan perusahaan kecerdasan buatan yang akan memungkinkan mereka menggunakan konten Wikipedia untuk melatih dan mendukung model AI mereka, sebagai bagian dari upaya lembaga nirlaba tersebut untuk menjaga keberlanjutan jangka panjang di tengah perubahan perilaku daring.
Perjanjian tersebut ditandatangani melalui Wikimedia Enterprise, produk komersial yayasan yang dirancang untuk pengguna ulang dan distributor konten dari proyek Wikimedia dalam skala besar. Pendaftar baru meliputi Ecosia, Microsoft, Mistral AI, Perplexity, Pleias, dan ProRata. Mereka bergabung dengan mitra yang sudah ada seperti Amazon, Google, dan Meta.
"Di era AI, Wikipedia dan pengetahuan yang dibuat serta dikurasi oleh manusia tidak pernah seberharga ini," kata yayasan dalam sebuah pernyataan.
"Pengetahuannya mendukung chatbot generatif AI, mesin pencari, asisten suara, dan banyak lagi. Wikipedia adalah salah satu kumpulan data berkualitas tertinggi yang digunakan dalam pelatihan Large Language Models."
Pengumuman ini dibuat sebagai bagian dari pembaruan yang terkait dengan ulang tahun ke-25 Wikipedia.
Ensiklopedia daring ini termasuk dalam sepuluh situs web yang paling banyak dikunjungi secara global dan merupakan satu-satunya dalam kelompok tersebut yang dioperasikan oleh organisasi nirlaba. Lebih dari 65 juta artikelnya, yang diterbitkan dalam lebih dari 300 bahasa, dilihat hampir 15 miliar kali setiap bulan, menurut yayasan.
Namun, yayasan memperingatkan bahwa pola lalu lintas pengunjung sedang berubah. Pada bulan Oktober, mereka menyatakan kunjungan manusia ke Wikipedia turun 8% dari tahun ke tahun, dan penurunan ini dikaitkan dengan pengguna yang lebih mengandalkan ringkasan yang dihasilkan AI daripada mengunjungi situs secara langsung. Hampir 60% pencarian Google sekarang berakhir tanpa klik, dengan jawaban di halaman seringkali didukung oleh konten Wikipedia.
AI vs penerbit
Kesepakatan ini terjadi di tengah perdebatan yang lebih luas tentang bagaimana perusahaan AI memperoleh data pelatihan. Large language models biasanya dilatih dengan sejumlah besar materi daring, praktik yang telah menarik kritik dari penulis, penerbit, dan pemegang hak lainnya yang berpendapat bahwa penggunaan karya berhak cipta tanpa izin merupakan pelanggaran.
Di antara mereka, Reddit terlibat dalam beberapa gugatan dengan perusahaan AI atas penggunaan kontennya untuk melatih model, meskipun Reddit telah mencapai kesepakatan lisensi dengan Google dan lainnya.
Pada hari Kamis, penerbit buku besar Hachette Book Group dan Cengage Group mengajukan mosi untuk bergabung dalam gugatan class action yang sudah ada terhadap Google, menuduh perusahaan tersebut melakukan "pelanggaran hak cipta bersejarah" untuk membangun platform Gemini AI. Gugatan tersebut menuduh Google menyalin buku tanpa lisensi yang tepat selama proses pelatihan AI-nya. Kasus ini awalnya diajukan pada 2023 oleh sekelompok penulis.
OpenAI menghadapi kasus serupa dari penggugat termasuk penulis "Game of Thrones" George R.R. Martin.
Perusahaan hiburan juga menyoroti isu ini. Pada pertengahan Desember, Disney mengirimkan surat perintah penghentian dan penghentian kepada Google dengan tuduhan pelanggaran hak cipta, meskipun Disney telah mencapai kesepakatan lisensi terpisah dengan OpenAI yang mencakup ratusan karakter untuk video yang dihasilkan AI. Disney telah mengeluarkan pemberitahuan serupa kepada perusahaan AI lain dan terlibat dalam litigasi bersama studio besar melawan perusahaan pembuat gambar Midjourney.
Pada bulan yang sama, koalisi penulis, aktor, dan teknolog meluncurkan kelompok industri baru yang bertujuan mendorong standar yang dapat ditegakkan terkait cara AI dilatih dan digunakan di sektor hiburan. Lebih dari 500 tokoh terkemuka mendukung inisiatif ini, termasuk Natalie Portman, Cate Blanchett, Ben Affleck, Guillermo del Toro, dan Taika Waititi.
Komisi Eropa juga telah membuka penyelidikan antitrust formal untuk menentukan apakah Google melanggar aturan persaingan UE dengan menggunakan konten penerbit dan YouTube untuk mendukung layanan AI mereka tanpa kompensasi atau persetujuan yang adil.
Apakah pemilik hak cipta pada akhirnya akan menemukan jalan keluar masih belum pasti. Hakim federal di AS baru-baru ini memberikan kemenangan parsial kepada Meta dan Anthropic, memutuskan bahwa penggunaan buku berhak cipta untuk melatih model AI dianggap sebagai fair use, sambil mengkritik perusahaan karena memelihara perpustakaan permanen karya bajakan.


