Tahun ini, Artificial Intelligence (AI) yang dapat menghasilkan gambar berdasarkan input pengguna semakin populer.
Walaupun menuai kontroversi, text-to-image AI tetap banyak digunakan. Buktinya, tagar #AIart marak di media sosial. Saat ini, ada cukup banyak Generative AI (GAI) yang tersedia. Sebagian bisa digunakan dengan gratis, sebagian yang lain berbayar. Berikut daftar generative AI yang cukup populer.
1. Dall-E 2
Dall-E merupakan GAI buatan OpenAI. AI ini dapat menghasilkan gambar realistis, berdasarkan prompt yang dimasukkan oleh pengguna. OpenAI mengumumkan keberadaan Dall-E pada Januari 2021. Dan pada Juli 2022, mereka mengadakan open beta untuk Dall-E 2. Jika Anda tertarik untuk tahu tentang Dall-E 2 lebih lanjut, Anda bisa membacanya di sini.
2. Stable Diffusion
Berdasarkan situs resminya, Stable Diffusion didefinisikan sebagai latent diffusion model yang dapat menghasilkan gambar realistis ketika pengguna memberikan input berupa teks. Stable Diffusion diciptakan oleh grup CompVis dari LMU Munich, Stability AI, dan RunWay. Per Oktober 2022, Stability AI mendapatkan investasi sebesar US$101 juta.
Sama seperti AI lain, Stable Diffusion juga harus “dilatih”. Data yang digunakan untuk melatih Stable Diffusion berupa gambar dan caption, yang diambil dari LAION-5B, dataset yang terbuka untuk umum. Stable Diffusion tidak memiliki hak cipta atas gambar yang ia buat. Karena itu, pengguna Stable Diffusion bisa menggunakan gambar yang dihasilkan, selama gambar tersebut tidak ilegal atau berpotensi untuk membahayakan orang lain.
3. Craiyon
Craiyon adalah generative AI yang bisa menghasilkan gambar berdasarkan teks yang dimasukkan oleh pengguna. Ide untuk membuat AI ini pertama kali diajukan oleh Boris Dayma di JAX/Flax Community Week. Pada awalnya, Craiyon dinamai DALL-E Mini. AI itu hanya dilatih selama tiga hari menggunakan TPUv3-8 yang disediakan oleh Google Cloud sepanjang program JAX/Flax Community Week.
The pink flowers#craiyon #AIart #aiartcommunity pic.twitter.com/Ld7uxykLFr
— craiyon (@craiyonAI) December 12, 2022
Walau hanya dilatih dalam waktu singkat, Craiyon cukup sukses. Di akhir Mei dan Juni 2022, Craiyon menjadi viral. Dan hal ini membuat pengguna DALL-E dan DALL-E 2 bingung. Alhasil, OpenAI meminta agar nama AI ini diubah. Akhirnya, DALL-E Mini pun kini dikenal dengan nama Craiyon.
4. Jasper
Sejatinya, Jasper berfungsi untuk membuat konten tertulis, baik berupa iklan, konten untuk situs, blog, atau media sosial. Namun, Jasper juga dapat berfungsi sebagai art generator. Untuk bisa menggunakan Jasper, pengguna hanya harus memberikan prompt tertulis. Pengguna bebas untuk menulis prompt sepanjang atau sesederhana mungkin. Setelah itu, pengguna akan diminta untuk menentukan beberapa pilihan, seperti art medium, art style, mood, dan keywords. Jasper akan menghasilkan gambar dalam hitungan detik.
5. Imagen
Jika dibandingkan dengan generative AI, Imagen AI punya fungsi yang agak berbeda. AI ini fokus untuk mengubah foto pengguna. Cara kerja Imagen dijelaskan dalam situs resminya. Pertama, Imagen akan menganalisa kebiasaan pengguna dalam mengedit foto. Dari sini, AI itu akan menciptakan “Personal AI Profile” pengguna, yang akan menyesuaikan berbagai setting pada foto — mulai dari white balance, exposure, color correction, dan lain sebagainya — sesuai dengan kebiasaan/selera pengguna.
Personal AI Profile dari Imagen dapat digunakan di Lightroom Classic. Setelah menggunakan AI Profile, pengguna tetap bisa kembali mengubah hasil foto sesuai keinginan.
Untuk menggunakan Imagen, pengguna harus membayar US$0,05 per foto. Jika pengguna ingin menggunakan fitur Cropping, biaya yang harus dibayar bertambah US$0,01. Begitu juga jika pengguna ingin memanfaatkan fitur Straightening. Pengguna bebas untuk menentukan berapa banyak jumlah edit yang ingin dia beli. Namun, pembelian minimal adalah US$7 per bulan.
6. Midjourney
Midjourney merupakan GAI yang menerima input berupa teks dari pengguna dan menghasilkan gambar yang sesuai dengan prompt tersebut. Satu keunikan dari Midjourney adalah GAI ini hanya bisa diakses melalui Discord. Versi beta dari Midjourney sudah bisa dicoba oleh masyarakat luas per akhir Juli 2022. Pengguna versi beta dari Midjourney bisa mendapatkan 25 gambar gratis. Untuk bisa mendapatkan 200 gambar per bulan, Anda harus rela untuk mengeluarkan US$10. Untuk akses tanpa batas, biaya yang dikenakan adalah US$30 per bulan.
7. NightCafe AI
NightCafe AI merupakan image generator yang bisa diakses secara online sejak November 2019. Sama seperti GAI lain, NightCafe AI dapat menghasilkan gambar, berdasarkan prompt dari pengguna.
Ketika Anda menggunakan NightCafe, Anda juga bisa memilih creation method. Ada lima opsi yang bisa Anda pilih: Stable Diffusion, DALL-E 2, CLIP-Guided Diffusion, VQGAN+CLIP, dan Style Transfer. Setelah itu, Anda bisa memilih art style yang Anda inginkan. Ada sekitar 20-an opsi yang bisa Anda pilih, seperti: Artistic Portrait, Bon Voyage, Photo, Dark Fantasy, Anime, Modern Comic, dan lain sebagainya.
Saat Anda pertama kali menggunakan NightCafe AI, Anda akan mendapatkan 5 credit. Setiap gambar yang Anda buat dihargai 1 credit. Jika credit Anda sudah habis, Anda bisa membelinya. Paket credit yang ditawarkan oleh NightCafe beragam, mulai dari US$8 untuk 100 credit sampai US$38 untuk 1.000 credit.
8. GauGAN2
GauGAN merupakan AI demo buatan NVIDIA Research. Nama AI ini diambil dari pelukis asal Prancis, Paul Gauguin. Versi terbaru dari GauGAN2 akan menghasilkan gambar berdasarkan input tulisan yang pengguna masukkan. Pengguna juga bisa mengubah prompt yang diberikan untuk menyesuaikan gambar yang dihasilkan. Tak hanya itu, pengguna juga bisa menggunakan fitur smart paintbrush untuk memodifikasi gambar lanskap yang dihasilkan oleh GauGAN2.
Demo dari GauGAN2 menggunakan teknologi Generative Adversarial Networks (GANs), deep learning model yang memanfaatkan sepasang neural networks, yaitu generator dan discrimator. Generator berfungsi untuk membuat gambar. Sementara discrimator akan memberikan feedback pada generator sehingga gambar yang dihasilkan menjadi lebih realistis.
9. Wombo
Aplikasi Wombo dirilis pada Februari 2021. Wombo memungkinkan Anda untuk membuat video lip-sync pendek berdasarkan foto yang Anda unggah dan lagu yang Anda pilih. Untuk menggunakan aplikasi Wombo, Anda hanya perlu untuk mengambil gambar dengan kamera smartphone atau mengunggah foto yang telah ada di ponsel, memilih lagu, dan menkan tombol untuk memulai lip-sync. Setelah itu, Wombo akan membuat animasi dari foto/gambar yang diunggah, sesuai dengan lagu yang telah Anda pilih.
@maximilian_
I’m sorry capcom what have I done pic.twitter.com/5ogqveykl4— Hero101 (@Hero101_Kun) March 10, 2021
Wombo dengan cepat menjadi populer. CEO Wombo, Ben-Zion Benkhin memperkirakan, hanya dalam beberapa minggu, aplikasi Wombo sudah diunduh sebanyak sekitar dua juta kali. Kepada The Verge, Benkhin juga meyakinkan bahwa data pengguna aman. Dia menjelaskan, semua data yang diunggah ke aplikasi Wombo akan dihapus dan mereka tidak membagikan data itu dengan pihak ketiga.
10. Wonder
Wonder merupakan AI art generator yang dibuat oleh Codeway Dijital. Berbeda dengan kebanyakan GAI, Wonder hanya bisa diakses melalui aplikasi. Wonder tersedia untuk iOS dan Android. Saat pertama kali mengunduhnya, Anda mendapatkan akses gratis selama tiga hari. Setelah itu, Anda harus membayar biaya menggunakan Wonder setiap minggu. Selain berlangganan, Anda juga bisa membeli Wonder seharga US$30. Setelah membeli aplikasi ini, Anda akan bisa menggunakannya untuk membuat gambar sebanyak-banyaknya.
Di aplikasi Wonder, Anda tidak hanya harus mengetikkan prompt akan gambar yang Anda inginkan, tapi juga memilih art style. Menurut PC Mag, Anda juga bisa memilih “no style” jika Anda tidak keberatan dengan pemilihan art style random. Masalahnya, jika Anda menggunakan aplikasi Wonder, Anda harus rela data pribadi disebarkan ke pihak ketiga. Data yang diunggah ke Wonder tidak dienkripsi dan Anda tidak bisa menghapusnya, menurut Kata Data.
11. Pixray
Tom White, salah satu Lead Developer dari Pixray menjelaskan bahwa sekarang, AI sudah bisa mengenali wajah dan objek. Kemampuan inilah yang dimanfaatkan oleh Pixray untuk mengenali prompt yang diberikan oleh pengguna dan menghasilkan gambar yang sesuai dengan permintaan tersebut. Untuk melatih Pixray mengenali nama dan bentuk objek, tim developer menggunakan CLIP models yang dirilis oleh OpenAI pada 2021. Kepada Forbes, White mengatakan, Pixray dibuat dengan tujuan untuk memungkinkan lebih banyak orang untuk mengekspresikan diri mereka melalui seni visual.
Love playing with @pixray I asked for mech robots in the style of Turner and I very much like the result. pic.twitter.com/aQZbDrkxWl
— – (@mightybarnski) December 1, 2021
12. Neural.love
Menurut situs resminya, Neural.love merupakan startup yang menggunakan AI untuk merevolusi content processing. Memang, walau Neural.love bisa digunakan untuk membuat gambar, ia juga bisa digunakan untuk meningkatkan kualitas video, gambar, dan audio.
Fitur AI Art Generator dari Neural.love memungkinkan Anda untuk memasukkan prompt untuk menghasilkan gambar yang Anda inginkan. Anda juga bisa memilih art style yang akan digunakan, seperti Painting, Fantasy, Anime, Midjourney Style, dan lain sebagainya.
Untuk mendapatkan gambar dengan resolusi lebih tinggi, Anda hanya perlu mencentang “HD mode”. Gambar yang dihasilkan oleh Neural.love bisa digunakan untuk keperluan komersil, walau Anda menggunakan gambar hasil dari prompt pengguna lain.
Sumber header: Personal promt via DALL-E.