AI Runway Gen-2 Mampu Ciptakan Video dari Teks

Dibuat oleh tim pengembang Stable Diffusion orisinal

Artificial intelligence telah menunjukkan perkembangan yang sangat pesat dalam hal kemampuan menggambar. Kalau perlu bukti, lihat saja koleksi gambar photorealistic yang dapat dihasilkan Midjourney v5. Pertanyaannya, pencapaian seperti apa yang bakal AI catatkan selanjutnya? Jawabannya adalah membuat video.

Runway, startup yang membantu pengembangan generative AI Stable Diffusion, baru-baru ini mengumumkan kehadiran Gen-2 dari sistem AI pembuat videonya. Runway Gen-2 diklaim mampu menerjemahkan input teks menjadi sebuah video singkat, sebuah perkembangan pesat dari versi pertamanya yang masih membutuhkan input berupa video.

Menggunakan Runway Gen-2, pengguna dapat mengetikkan input teks seperti "an aerial shot of a mountain landscape", dan AI akan menciptakan video singkat berdurasi 3 detik yang menampilkan adegan tersebut secara akurat. Alternatifnya, pengguna juga bisa mencantumkan input berupa gambar, lalu menambahkan deskripsi teks untuk menyulapnya menjadi sebuah video.

Video yang dihasilkan memang tidak kelihatan begitu bagus, akan tetapi akurasinya tetap perlu diacungi jempol. Setidaknya untuk sekarang, video buatan Runway Gen-2 juga tidak dilengkapi audio. Namun berdasarkan laporan Bloomberg, Runway rupanya tengah sibuk melakukan riset untuk menghadirkan kemampuan menciptakan audio pada sistem AI-nya.

Runway bukanlah perusahaan pertama yang mencoba menciptakan sistem text-to-video berbasis AI. Tahun lalu, Meta sempat memperkenalkan proyek riset serupa yang mereka juluki Make-A-Video. Selain Meta, Google juga punya proyek riset text-to-video berbasis AI bernama Phenaki.

Tidak seperti Meta dan Google, Runway rupanya sudah siap menguji AI pembuat videonya ini secara publik. Aksesnya memang masih cukup terbatas, dan pengguna yang tertarik harus mendaftar via waitlist terlebih dulu di server Discord milik Runway. Pun begitu, Runway sudah punya rencana untuk membuka aksesnya lebih luas lagi dalam beberapa minggu ke depan.

Runway sendiri sudah punya pengalaman panjang dalam ranah software video. Mereka memiliki sederet video editing tool bertenaga AI, dan kliennya pun sudah mencakup sejumlah nama besar seperti produser acara TV The Late Show with Stephen Colbert, maupun tim visual effect dari film pemenang Oscar, Everything Everywhere All at Once.

Sistem text-to-video berbasis AI memang masih jauh dari kata sempurna, dan Runway Gen-2 pada dasarnya membuktikan anggapan tersebut. Namun seperti halnya semua tool berbasis AI, kinerjanya akan terus bertambah baik seiring berjalannya waktu.

Lagi-lagi kalau perlu bukti, lihat saja pencapaian yang dibukukan AI Midjourney. Beberapa bulan lalu, AI tersebut masih kesulitan menggambarkan tangan manusia secara akurat. Sekarang, gambar bikinannya sudah mampu menipu mata kita.

Via: The Verge.