Midjourney, AI yang Bisa Buat Karya Seni Melalui Discord

Midjourney memiliki komunitas yang besar di Discord

Versi beta dari Midjourney, sebuah generative artificial intelligence (GAI), kini bisa diakses oleh semua orang.

Kali ini adalah kali kedua GAI itu tersedia dalam versi beta. Pada 18 Juli 2022, GAI tersebut juga sudah bisa diakses oleh masyarakat luas, walau hanya dalam waktu yang terbatas, yaitu selama 24 jam. Pada akhir Juli 2022, versi beta dari Midjourney dibuka untuk umum.

Sama seperti Dall-E, Midjourney merupakan GAI yang akan menghasilkan gambar berdasarkan pada input teks dari pengguna.

Saat ini, para pengguna beta dari GAI itu bisa mendapatkan 25 gambar gratis. Setelah itu, mereka bisa membayar US$10 per bulan untuk mendapatkan 200 gambar per bulan. Pengguna juga bisa memilih untuk membayar US$30 per bulan untuk mendapatkan akses tanpa batas.

Satu keunikan dari Midjourney adalah ia hanya bisa digunakan melalui aplikasi Discord. Anda bisa bergabung dengan server dari GAI itu di sini.

Cara Menggunakan Midjourney

Di server Discord dari Midjourney, Anda akan menemukan channel "getting started". Di sini, Anda bisa membaca penjelasan tentang bagaimana cara untuk memasukkan prompt demi mendapatkan gambar yang Anda inginkan.

Cara menggunakan Midjourney sangat mudah. Anda hanya perlu mengunjungi salah satu channel newbies dan mengetikkan "/imagine" diikuti oleh deskripsi dari gambar yang Anda inginkan.

Anda bisa mengetikkan beragam prompts, mulai dari deskripsi umum seperti "a shard of infinity" sampai deskripsi yang sangat detail, seperti "A room with bookshelves, a black cat on an old chair, blue roses in a vase, falling petals, starlight, watercolors". Dari input yang Anda berikan, Anda akan mendapatkan empat gambar yang berbeda.

Contoh hasil dari Midjourney.

Di bawah setiap gambar, Anda akan menemukan sembilan tombol. Tombol dengan ikon "U" berfungsi untuk melakukan upscale pada salah satu dari empat gambar yang dihasilkan oleh Midjourney. Sementara tombol dengan ikon "V" berfungsi untuk mencari variasi dari gambar yang Anda pilih.

Terakhir, tombol dengan ikon lingkaran panah berfungsi untuk meminta Midjourney mencari sekumpulan gambar lain dengan prompt yang sama.

Seperti yang disebutkan oleh PC World, tidak semua gambar yang dihasilkan oleh Midjourney akan terlihat menawan. Kualitas gambar yang dihasilkan tidak hanya tergantung pada prompt yang Anda gunakan, tapi juga keberuntungan.

Mengingat Midjourney menggunakan Discord, biasanya, gambar dari prompt yang Anda berikan akan langsung terkubur oleh pesan dari pengguna lain. Kabar baiknya, Anda bisa menemukan gambar hasil dari prompt Anda dengan mudah di inbox Discord.

Pendiri dan Awal Mulai Midjourney

Midjourney didirikan oleh David Holz, yang kini menjabat sebagai CEO. Dia merupakan seorang pengusaha. Pada 2011, dia mendirikan Leap Motion di San Francisco, Amerika Serikat. Sebelum itu, dia juga pernah bekerja untuk NASA dan Max Planck.

Holz mengoperasikan Leap Motion selama 12 tahun. Dia kemudian memutuskan untuk meninggalkan perusahaan itu karena dia ingin mencoba untuk melakukan sesuatu yang sama sekali baru. Alhasil, dia pun memulai Midjourney.

Dia bercerita, saat ini, perusahaan yang dia pimpin hanya berisi 10 orang. Tapi,  dia menganggap, hal itu bukan masalah karena mereka memang tidak punya investor dan tidak berencana untuk menjadi perusahaan publik.

Leap Motion controller. | Sumber: Wikipedia

"Saya hanya ingin membuat perusahaan untuk mengerjakan proyek-proyek keren yang bisa membantu saya, serta mungkin semua orang di dunia, yang bisa bertahan selama 10 tahun ke depan," kata Holz dalam wawancara dengan The Verge. "Kami sedang mengerjakan beberapa proyek yang berbeda. Tapi, kami tetap memiliki tema khusus, seperti refleksi, imajinasi, dan koordinasi."

Holz sadar, sekarang, Midjourney dikenal berkat generative artificial intelligence yang mereka buat. Tapi, dia mengungkap, mereka tidak berencana untuk membuat AI yang memahami seni atau bisa membuat deepfakes. Dia hanya ingin memperluas kemampuan imajinasi manusia.

"Apa yang akan terjadi ketika komputer memiliki imajinasi visual yang lebih baik dari 99% manusia?" ujar Holz. "Hal itu bukan berarti kita akan berhenti berimajinasi. Sekarang, mobil memiliki kecepatan yang lebih tinggi dari manusia. Tapi, keberadaan mobil bukan berarti kita berhenti berjalan kaki."

Midjorney bukan satu-satunya perusahaan yang tertarik dan berhasil membuat GAI. Beberapa perusahaan teknologi lain juga membuat GAI mereka sendiri. Contohnya, Google memiliki Imagen dan OpenAI memiliki Dall-E.

Holz mengungkap, hal itu bukan hal yang aneh. Karena, di bidang AI, ada dua teknologi baru yang memungkinkan perusahaan-perusahaan untuk membuat GAI. Dua teknologi itu adalah kemampuan bagi AI untuk memahami bahasa dan kemampuan AI untuk menciptakan gambar.

Contoh gambar yang dihasilkan oleh Midjourney.

"Saat Anda menggabungkan dua teknologi tersebut, AI akan bisa memahami bahasa yang manusia gunakan dan membuat gambar yang sesuai," ujar Holz.

"Kami percaya, teknologi ini akan menjadi tren di masa depan. AI juga akan bisa membuat gambar yang lebih bagus dari manusia. Tren ini akan berkembang dengan cepat. Dalam waktu satu atau dua tahun ke depan, Anda akan bisa membuat konten secara real-time: 30 fps dengan resolusi tinggi."

Tentu saja, Holz mengingatkan, teknologi itu tidak akan murah, tapi ia bisa dilakukan. "Dan dalam waktu 10 tahun, Anda akan bisa membeli Xbox yang memiliki prosesor AI," ungkapnya.

Keputusan untuk Membuat Komunitas Discord

Holz bercerita, Midjourney mulai mencoba teknologi GAI pada September 2021. Dari percobaan itu, mereka menemukan, kebanyakan orang tidak tahu gambar seperti apa yang mereka inginkan.

Ketika seseorang ditanya mengenai gambar apa yang dia mau, dia akan memberikan jawaban sederhana, seperti "anjing" atau "anjing berwarna pink". Dan setelah dia mendapatkan gambar sesuai dengan permintaannya, dia akan kehilangan minat untuk mencoba teknologi GAI milik Midjourney.

"Tapi, jika Anda mengumpulkan banyak orang dalam satu grup, seseorang akan mencari gambar 'anjing', lalu orang lain akan terinspirasi untuk mencari gambar 'anjing luar angkasa', dan orang lain mencari 'anjing luar angkasa dari Aztec'," jelas Holz. "Dan mendadak, semua orang sadar akan besarnya potensial gambar yang bisa mereka dapatkan."

Holz menyebutkan, Midjourney percaya, orang-orang suka berimajinasi bersama-sama. Karena itulah, mereka memutuskan untuk membuka akses ke GAI yang mereka buat melalui Discord. "Kami punya komunitas Discord yang sangat besar," katanya. "Komunitas kami adalah salah satu yang paling besar di Discord."

Biaya untuk Melatih GAI

Sebagai sebuah AI, Midjourney harus bisa dilatih untuk bisa mengenali prompt dari pengguna dan memberikan gambar yang sesuai dengan prompt tersebut. Untuk melatih GAI mereka, perusahaan Midjourney menggunakan gambar dan teks yang ada di internet. Holz mengungkap, metode ini adalah metode yang biasa digunakan oleh kebanyakan developer AI.

"Update terbaru yang kami implementasikan membuat gambar yang dihasilkan Midjourney menjadi jauh, jauh lebih baik," kata Holz. "Anda mungkin berpikir, kami bisa melakukan hal tersebut memasukkan banyak lukisan dalam dataset yang kami gunakan untuk melatih GAI kami. Tapi kami tidak melakukan itu. Apa yang kami lakukan adalah memanfaatkan data pengguna, khususnya tentang apa yang mereka buat menggunakan GAI kami."

Walau Midjourney sudah berhasil menghasilkan gambar-gambar unik, seperti "last selfie on earth", Holz menegaskan, GAI Midjourney masih ada di tahap awal pengembangan. Dan, dia mengingatkan, saat ini, hanya ada sekitar 20-an GAI yang bisa membuat gambar berdasarkan input teks. Artinya, teknologi ini memang masih bersifat eksperimental.

Salah satu hasil dari prompt "Last selfie on Earth". | Sumber: Midjourney via PetaPixel

Salah satu tantangan bagi developer untuk membuat GAI seperti Midjourney atau Dall-E adalah biaya latihan AI yang tidah murah. Holz memperkirakan, untuk melatih sebuah GAI menggunakan dataset gambar, biaya yang diperlukan mencapai sekitar US$50 ribu.

"Dan Anda tidak mungkin melakukan latihan satu kali saja. Anda mungkin harus melakukan latihan sebanyak 3 kali atau 10 kali atau bahkan 20 kali," ujar Holz. Dia mengakui, biaya yang dibutuhkan untuk melatih GAI memang tidak murah. Kebanyakan universitas juga tidak akan sanggup mengeluarkan biaya tersebut. Namun, biaya melatih GAI tersebut masih lebih murah dari membeli supercomputer, yang harganya bisa menembus US$1 miliar.

Holz juga yakin, di masa depan, biaya untuk melatih GAI akan turun. Hanya saja, dia mengingatkan, biaya untuk mengoperasikan GAI juga cukup mahal. "Setiap gambar dari Midjournery dihasilkan menggunakan server senilai US$20 ribu. Dan kami harus membayar sewa server itu dalam hitungan menit," aku Holz.

Sumber header: Midjourney via How To Geek