Mengurai Benang Kusut tentang Perlindungan Hak Cipta di Ranah AI

Dataset yang digunakan untuk melatih AI menggunakan banyak karya buatan artists manusia yang belum tentu memberikan izin

Stability AI, Midjourney, dan DeviantArt belum lama ini dituntut ke pengadilan. Alasannya, karena keputusan ketiganya untuk membuat Artificial Intelligence (AI) dianggap sebagai pelanggaran hak para artists dan pekerja industri kreatif lainnya.

Dalam tuntutan ini, beberapa tuduhan yang dilayangkan pada Stability AI, Midjourney, dan DeviantArt adalah pelanggaran hak cipta, pelanggaran Digital Millennium Copyright Act (DMCA), dan pelanggaran atas sejumlah regulasi kompetisi di California, Amerika Serikat.

Tahun lalu, muncul tren baru di bidang AI, yaitu Generative AI (GAI), seperti Midjourney dan DALL-E 2 dari OpenAI. Cara kerja GAI sederhana: pengguna cukup memasukkan input berupa teks dan GAI akan menghasilkan gambar yang sesuai dengan prompt tersebut. Kemajuan teknologi ini merupakan kabar gembira bagi para tech enthusiasts.

Bagi kebanyakan orang awam, keberadaan GAI juga memungkinkan mereka untuk merealisasikan imajinasi yang mereka punya. Sayangnya, keberadaan GAI merupakan ancaman bagi para digital artists dan pekerja industri kreatif lainnya. Karena, GAI punya potensi untuk menghilangkan pekerjaan para artists. Padahal, GAI hanya bisa menghasilkan "karya" setelah ia dilatih menggunakan karya buatan para artists manusia.

Dalam artikel ini, saya akan mencoba untuk membahas tentang konflik antara artists dengan AI enthusiasts, khususnya terkait perlindungan hak cipta atas karya artists yang digunakan untuk melatih AI, serta perlindungan untuk karya yang dihasilkan oleh AI.

Apa yang Membuat Para Artists Khawatir?

Untuk mengetahui dampak keberadaan GAI pada kelangsungan hidup para artists, Kotaku mewawancara sejumlah artists yang pernah bekerja di perusahaan game serta film dan TV. Salah satunya, concept artist yang pernah bekerja di beberapa publisher game AAA yang menggunakan nama samaran Jeanette. Dia berkata, "Kemampuan para artists sudah diremehkan bahkan sebelum teknologi ini muncul. Saya khawatir, keberadaan AI hanya akan memperburuk keadaan."

Jeanette bukan satu-satunya artist yang merasa terancam dengan keberadaan AI, hal yang sama juga dialami oleh digital artist dengan nama samaran Bruce. Sebelum ini, Bruce telah bekerja dalam tim di balik beberapa game indie sukses. Terkait AI, dia mengatakan, pada akhirnya, perusahaan ingin menggantikan artists dan bukannya memudahkan artists untuk menyelesaikan pekerjaannya.

Contoh karya RJ Palmer. | Sumber: RJ Palmer

"Setelah saya menghabiskan waktu bertahun-tahun untuk mengasah kemampuan seni saya, akhirnya saya hanya akan dijadikan sebagai 'pilot' dari AI, mengarahkannya sehingga ia bisa menghasilkan karya yang bisa kita gunakan sebagai aset dalam game," ujar Bruce. Dan menurutnya, skenario tersebut adalah kemungkinan terburuk yang bisa terjadi padanya.

Sementara itu, RJ Palmer, Concept Artist yang pernah bekerja di Ubisoft dan ikut serta dalam pembuatan Detective Pikachu mengatakan, keberadaan AI mungkin bukan ancaman bagi concept artist atau illustrator yang sudah memiliki nama besar. Namun, lain halnya dengan para artists yang masih ada di level pemula. Dia merasa, keberadaan AI bisa menggantikan posisi 5-10 orang artists pemula.

Palmer mengaku, karya yang dihasilkan oleh AI memang tidak selalu sempurna. Biasanya, AI kesulitan untuk menggambar jari dan tangan. Meskipun begitu, Palmer mengungkap, industri kreatif lebih mementingkan kecepatan dalam membuat karya daripada kesempurnaan karya itu sendiri. "Ada banyak pihak yang tidak keberatan untuk menggunakan karya buatan AI, selama karya tersebut terlihat 'cukup bagus'," katanya.

Penulis indie -- yang merilis bukunya sendiri -- menjadi contoh yang diberikan oleh Palmer. Dia bercerita, ada banyak penulis indie yang senang dengan keberadaan AI. Karena, mereka tidak lagi perlu membayar artist untuk membuat ilustrasi di sampul dan buku mereka.

Para penulis indie biasanya akan membayar artist untuk membuat ilustrasi sampul buku. | Sumber: Creativindie

"Padahal, proyek dari kreator kecil seperti inilah yang bisa membantu para artists untuk membangun reputasi mereka," ungkap Palmer. Semakin banyak pihak yang bersedia untuk menggantikan jasa artists dengan AI, maka hal ini akan mempersulit para artists -- khususnya mereka yang masih di tingkat pemula -- untuk mendapatkan pekerjaan dan membangun portofolio mereka.

Senada dengan Palmer, Karla Ortiz -- yang pernah bekerja di Ubisoft, Marvel, dan HBO -- juga memiliki kekhawatiran tersendiri terkait penggunaan AI di bidang kreatif. Dia mengaku, karya buatan AI memang tidak bisa langsung digunakan. Biasanya, produk buatan AI masih perlu disempurnakan oleh artist profesional. Selain itu, masih belum ada hukum yang pasti tentang penggunaan karya AI di produk komersil.

"Hanya saja, AI memang memberikan hasil yang 'cukup bagus' untuk sebagian perusahaan, khususnya mereka yang tidak terlalu peduli pada hukum dan menawarkan upah rendah bagi para pekerja kreatif," ujar Ortiz. "Karena produk yang dihasilkan oleh AI 'cukup bagus', saya rasa, jumlah proyek kreatif di tingkat pemula akan berkurang. Hal ini tidak hanya akan mempengaruhi para illustrators, tapi juga fotografer, graphic designers, model dan semua pihak yang terlibat dalam pembuatan konten visual."

Melihat AI sebagai ancaman pada kelangsungan karir mereka, para artists pun berusaha untuk mencoba melawan perusahaan teknologi di balik GAI. Salah satu "alat" yang artists bisa gunakan dalam perlawanan ini adalah hukum hak cipta.

Bisakah Karya Buatan AI Mendapatkan Perlindungan Hak Cipta?

Sebelum membahas tentang perlindungan hak cipta atas konten yang digunakan untuk melatih AI, mari kita membahas tentang perlindungan hak cipta atas karya yang dihasilkan oleh AI.

Menurut World Intellectual Property Organization (WIPO), copyright atau hak cipta merupakan hak yang diberikan pada kreator dari karya seni atau karya tertulis. Karya yang bisa dilindungi oleh hak cipta beragam, mulai dari buku, musik, film, lukisan, sampai program komputer. Untuk mendapatkan hak cipta, sebuah karya harus memenuhi tiga elemen: originality, creativity, dan fixation.

Definisi copyright. | Sumber: Investopedia

Di Amerika Serikat, hak cipta juga hanya bisa diberikan pada karya buatan manusia. Dengan kata lain, produk yang dibuat oleh mesin, tanpa campur tangan manusia sama sekali, tidak bisa mendapatkan copyright. Namun, jika karya buatan AI masih membutuhkan sentuhan manusia, maka ia masih bisa mendapatkan perlindungan hak cipta.

Faktanya, pada September 2022, US Copyright Office (USCO) pernah memberikan hak cipta pada komik yang dibuat dengan bantuan Midjourney. Kali itu merupakan pertama kalinya karya buatan AI mendapatkan hak cipta dari USCO. Namun, USCO dikabarkan tengah mempertimbangkan untuk menarik perlindungan hak cipta yang telah mereka berikan.

Untuk itu, USCO menghubungi Kristina Kashtanova, kreator di balik komik 18 halaman tersebut. Kashtanova bercerita, dia diminta USCO untuk memberikan informasi tentang proses pembuatan komik tersebut. Tujuannya, untuk mengetahui seberapa besar andil Kashtanova dalam pembuatan komik itu. Pada akhirnya, USCO memutuskan untuk mencabut hak cipta yang mereka berikan.

Komik buatan Kashtanova dengan Midjourney. | Sumber: MSN

Menurut Andres Guadamuz, seorang akademisi yang fokus untuk mempelajari tentang hukum AI dan IP di University of Sussex, Inggris, di masa depan, keputusan untuk memberikan hak cipta pada karya buatan AI memang akan ditentukan berdasarkan pada berapa banyak peran manusia dalam pembuatannya.

"Jika Anda hanya mengetik 'kucing buatan van Gogh', saya rasa, karya buatan AI yang Anda dapatkan tidak akan mendapatkan perlindungan hak cipta di Amerika Serikat," ujar Guadamuz pada The Verge. "Tapi, jika Anda bereksperimen dengan prompt yang Anda berikan dan Anda menghasilkan lebih dari satu karya dan Anda harus mengedit karya tersebut, Anda mulai menggunakan seeds dan Anda juga menyesuaikan proses pembuatan karya tersebut, saya rasa, kemungkinan karya Anda mendapatkan perlindungan hak cipta akan menjadi lebih besar."

Dengan kata lain, kebanyakan "karya" buatan AI -- yang hanya didasarkan pada prompt sederhana -- tidak akan bisa mendapatkan hak cipta. Namun, karya yang dipoles oleh manusia punya kemungkinan lebih besar untuk dilindungi hak cipta.

Giorgio Franceschelli, seorang computer scientist yang paham tentang seluk-beluk perlindungan hak cipta terkait karya buatan AI, mengatakan, di Uni Eropa, faktor penentu untuk memberikan copyright pada karya buatan AI adalah campur tangan manusia, sama seperti di Amerika Serikat. Namun, lain halnya dengan Inggris. Terkait copyright untuk karya AI, Inggris memiliki hukum yang berbeda.

Contoh hasil karya Midjourney dan prompt yang digunakan. | Sumber: Medium

Inggris merupakan salah satu dari sedikit negara yang menawarkan perlindungan hak cipta pada karya yang sepenuhnya dibuat oleh AI. Hanya saja, hak cipta itu jatuh ke pihak "yang memungkinkan AI untuk membuat karya tersebut." Sayangnya, hukum di Inggris ini multitafsir. Hak cipta bisa jatuh ke tangan perusahaan yang membuat AI atau ke pengguna yang memasukkan prompt ke AI tersebut.

Seolah masalah ini tidak cukup rumit, mendapatkan hak cipta untuk karya AI tidak menjamin ia akan terlindungi dari plagiarisme atau pencurian. Karena, pada akhirnya, pengadilan merupakan pihak yang menegakkan hukum copyright.

Melatih AI dengan Konten yang Dilindungi Hak Cipta, Apakah Etis?

Generative AI tidak bisa serta-merta menghasilkan gambar sesuai dengan prompt dari pengguna. Untuk membuat AI yang tidak hanya bisa mengenali objek, tapi juga meniru tampilan objek tersebut, AI harus dilatih. Kebanyakan GAI dilatih menggunakan konten yang ada di internet, baik berupa teks, gambar, sampai kode programming.

Sebagai contoh, Stable Diffusion dilatih menggunakan dataset berisi miliaran gambar yang diambil dari berbagai sumber di internet, mulai dari blog pribadi, art platform seperti DeviantArt, sampai platform penyedia foto seperti Shutterstock dan Getty Images.

Masalahnya, kebanyakan artists atau fotografer yang mengunggah karyanya di internet tidak memberikan izin pada perusahaan AI untuk menggunakan karya mereka dalam dataset latihan AI. Saat ini, justifikasi perusahaan AI dalam menggunakan konten di situs seperti DeviantArt dan Shutterstock adalah karena mereka menggunakan semua itu di bawah payung fair use.

Di Amerika Serikat, fair use atau penggunaan wajar adalah doktrin yang memungkinkan konten dengan copyright untuk digunakan dengan alasan kebebasan berekspresi.

Satu hal yang harus diingat, penggunaan fair use memiliki pertimbangan tersendiri. Daniel Gervais, dosen Vanderbilt Law School yang mengkhususkan diri untuk mempelajari hukum IP mengatakan, ada dua faktor yang harus dipertimbangkan untuk menentukan apakah konten bisa digunakan di bawah payung fair use. "Pertama, tujuan penggunaan," kata Gervais pada The Verge. "Kedua, dampak penggunaan itu ke pasar."

Kategori penggunaan fair use. | Sumber: Whittier College

Dengan kata lain, konten yang memiliki copyright bisa digunakan di bawah fair use selama produk yang dihasilkan bukanlah pesaing langsung dari konten yang dibuat oleh kreator orisinal. Pertimbangan lainnya adalah apakah keberadaan konten baru akan mengacam kehidupan atau karir sang kreator orisinal.

Dengan logika itu, menurut Gervais, menggunakan konten yang dilindungi hak cipta untuk melatih AI bukanlah masalah, karena ia masuk dalam penggunaan wajar atau fair use. Namun, jika AI yang sudah dilatih menggunakan konten dengan copyright menghasilkan karya yang didasarkan pada dataset tersebut, hal inilah yang berpotensi untuk melanggar hak cipta.

Sebagai contoh, jika GAI dilatih menggunakan jutaan gambar dari banyak artists yang berbeda, demi membuat gambar berdasarkan prompt, hal ini tidak akan dianggap sebagai pelanggaran hak cipta. Karena, karya yang dihasilkan oleh AI akan berbeda dengan karya buatan artist manusia yang digunakan untuk melatih AI itu. Selain itu, keberadaan AI juga tidak dianggap sebagai ancaman langsung pada karir para artists.

Namun, jika AI dilatih menggunakan karya seorang artist agar ia bisa meniru artstyle dari artist tersebut, hal ini bisa dianggap sebagai pelanggaran hak cipta. Dan jika sang artist membawa kasus ini ke pengadilan, dia punya kemungkinan besar untuk menang.

Gervais memberikan contoh, jika sebuah AI dilatih menggunakan novel-novel karya Stephen King, dengan tujuan untuk menghasilkan novel serupa, maka doktrin fair use tidak lagi berlaku. Karena, novel buatan sang AI akan menjadi pesaing langsung dari novel buatan King.

Selain dampak pada pasar, hal lain yang harus dipertimbangkan dalam penggunaan konten dengan copyright di bawah fair use adalah pihak yang menggunakan konten itu.

Biasanya, institusi akademis atau lembaga nirlaba boleh menggunakan konten dengan copyright di bawah payung fair use. Para perusahaan AI mengetahui celah ini. Karena itulah, perusahaan AI biasanya tidak mengumpulkan dataset sendiri. Sebagai gantinya, mereka meminta lembaga akademis untuk menyiapkan dataset yang akan digunakan dalam melatih AI.

Contohnya, kreator Stable Diffusion, Stability AI menyerahkan tanggung jawab untuk melatih AI buatan mereka ke CompVis, Ludwig Maximillian University di Munich, Jerman. Dengan begitu, Stability AI bisa meminimalisir kemungkinan dituntut atas pelanggaran hak cipta. Walau, pada akhirnya, mereka tetap dituntut ke pengadilan.

Contoh karya Stability AI.

Technologist Andy Biao menganggap, membiarkan lembaga non-profit atau institusi akademis mengumpulkan konten untuk dataset pelatihan AI merupakan tindakan "pencucian data". Dengan begitu, konten yang seharusnya dilindungi oleh copyright tetap bisa digunakan di bawah fair use.

Dia juga mengungkap, metode "pencucian data AI" ini sudah digunakan sejak teknologi facial recognition AI dikembangkan. Dia menjadikan MegaFace sebagai contoh. MegaFace merupakan dataset berupa foto yang dikumpulkan dari situs Flickr oleh University of Washington.

Biao menjelaskan, para peneliti dari universitas mengumpulkan foto wajah dari situs Flickr di bawah fair use, sebelum membiarkan dataset tersebut digunakan oleh perusahaan komersil. Dan data tersebut kini ada di tangan perusahaan facial recognition AI, Clearview AI dan pemerintah Tiongkok.

Mengingat metode "pencucian data" ini sudah pernah digunakan dan berhasil, kemungkinan, perusahaan AI akan kembali menggunakan metode tersebut dalam membuat Generative AI.

Namun, Gervais mengingatkan, ada kemungkinan, fair use tidak lagi bisa digunakan sebagai alasan untuk mengumpulkan dataset berisi konten dengan copyright. Pasalnya, saat ini, Supreme Court di Amerika Serikat tengah menangani kasus yang melibatkan Andy Warhol dan Prince. Keputusan dari kasus ini kemungkinan akan menjadi preseden untuk kasus terkait pelanggaran hak cipta terkait AI di masa depan. Pasalnya, Supreme Court biasanya tidak menangani kasus terkait fair use.

Adakah Jalan Tengah antara Perusahaan dan Artists?

Masalah antara pekerja industri kreatif dengan perusahaan AI tidak berhenti pada penggunaan konten dengan copyright sebagai dataset untuk melatih AI. Saat ini, walaupun melatih AI menggunakan konten dengan copyright jatuh di bawah fair use, hal ini tidak memadamkan rasa marah para artists yang merasa, karya mereka digunakan tanpa izin mereka.

Apalagi, jika AI yang dilatih dengan karya mereka dikomersilkan dan para artists tidak mendapatkan kompensasi apapun. Selain artists, masalah yang sama juga dirasakan oleh musisi dan bahkan programmer.

Pertanyaannya: adakah jalan tengah yang bisa membuat teknologi AI tetap berkembang, tanpa harus mengorbankan para artists manusia yang karyanya digunakan untuk melatih AI itu sendiri?

DeviantArt memiliki AI sendiri.

Solusi paling simpel adalah dengan mengharuskan perusahaan AI untuk membayar lisensi pada para artists jika mereka menggunakan karya sang artist dalam dataset mereka. Namun, pihak pro-AI menganggap, solusi ini akan mematikan industri AI sama sekali.

Bryan Casey dan Mark Lemley, penulis dari Fair Learning, yang merupakan dasar argumentasi bahwa penggunaan konten dengan copyright untuk melatih AI jatuh di bawah fair use, mengatakan bahwa dataset untuk melatih AI mengandung begitu banyak konten -- berupa foto, audio, teks, sampai video -- sehingga tidak mungkin perusahaan AI membeli lisensi dari semua konten tersebut.

Mereka juga menganggap, jika kreator dari konten dalam dataset dibiarkan untuk mengklaim perlindungan hak cipta, hal ini akan berujung pada ketiadaan data yang bisa digunakan untuk melatih AI. Padahal, membiarkan konten di internet digunakan untuk melatih AI tidak hanya memungkinkan terciptanya AI yang lebih baik, tapi juga mendorong inovasi.

Kabar baiknya, perusahaan AI dan perusahaan lain yang terlibat telah mulai mempertimbangkan solusi alternatif terkait dataset yang digunakan untuk melatih AI. Contohnya, Shutterstock berencana untuk menyiapkan dana kompensasi bagi kreator yang karyanya digunakan untuk melatih AI. Sementara itu, DeviantArt telah membuat tag metadata khusus, yang berfungsi untuk memperingatkan para peneliti AI agar tidak menggunakan karya yang diunggah ke internet dalam dataset pelatihan AI.

Sayangnya, solusi alternatif ini juga masih belum sempurna. Jika para artists menjual lisensi atas karyanya demi melatih AI, maka tidak tertutup kemungkinan, karirnya justru akan mati karena AI. Pasalnya, AI bisa mempelajari keunikan sang artist dalam membuat karya. Dengan kata lain, saat menjual lisensi karyanya untuk digunakan AI, sang artist juga harus merelakan sumber pemasukannya di masa depan.

Untuk penggunaan tag metadata khusus, hal ini memang bisa membantu para artists untuk mencegah karya mereka digunakan di dataset pelatihan AI di masa depan. Tapi, bagi kreator yang karyanya sudah diunggah ke internet dan telah masuk dalam dataset pelatihan AI, tag metadata ini tidak akan membantu. Dan para artists merasa, konten mereka sudah digunakan tanpa persetujuan.

DeviantArt menyediakan tag metadata khusus bagi pengguna yang tidak ingin karyanya digunakan pada dataset latihan AI. | Sumber: TechCrunch

Saat ini, salah satu opsi yang dipertimbangkan oleh perusahaan AI adalah menciptakan database khusus, yang hanya berisi konten tanpa hak cipta atau konten yang sudah diperbolehkan untuk digunakan melatih AI. The Stack menjadi contoh pihak yang telah merealisasikan solusi tersebut.

Dalam mengumpulkan dataset untuk melatih AI, The Stack memilih kode programming dengan lisensi open source paling terbuka. Selain itu, The Stack juga akan menghapus kode dalam database mereka jika pihak developer tidak ingin kode mereka masuk dalam dataset pelatihan AI. Developer dari The Stack percaya, model database yang mereka gunakan juga bisa diterapkan untuk seni atau bidang lain yang juga terpengaruh oleh keberadaan AI.

Akhir kata...

Kemajuan teknologi adalah sesuatu yang tidak terhindarkan. Begitu juga dengan teknologi AI. Tidak salah jika para tech enthusiasts sangat senang melihat perkembangan teknologi AI saat ini. Namun, alangkah baiknya jika kemajuan teknologi ini juga menghormati para artist dan karya mereka.

Sumber header: PC Mag

Baca artikel tentang AI lain: AI Art, tantangan terbaru para desainer dan seniman digital.