April lalu, Google melebur dua divisi artificial intelligence-nya, DeepMind dan Google Brain, menjadi satu tim besar yang berfokus pada pengembangan AI. Tanpa perlu menunggu lama, tim baru yang bernama Google DeepMind itu sudah membuahkan hasil, yakni sebuah visual language model (VLM) yang berfungsi untuk membuatkan deskripsi untuk YouTube Shorts secara otomatis.
DeepMind menamainya Flamingo, dan tujuan dari implementasinya tidak lain dari membantu meningkatkan penemuan konten bagi para pengguna. Lewat sebuah posting blog, DeepMind menjelaskan latar belakang di balik penggunaan Flamingo.
“Shorts dibuat hanya dalam beberapa menit dan sering kali tidak menyertakan deskripsi dan judul yang membantu, yang membuatnya lebih sulit ditemukan melalui pencarian. Jadi kami memperkenalkan visual language model kami, Flamingo, untuk membantu membuatkan deskripsi,” tulis tim DeepMind.
Flamingo mampu menganalisis frame awal video dan menghasilkan deskripsi tentang apa yang terjadi dalam video tersebut, misalnya saja “seekor anjing yang sedang menyeimbangkan tumpukan biskuit di atas kepalanya.” Deskripsi teks yang dihasilkan kemudian akan disimpan sebagai metadata untuk membantu mengategorikan video dan mencocokkan hasil pencarian dengan permintaan penonton.
Deskripsi yang dihasilkan oleh Flamingo tidak akan ditampilkan ke hadapan pengguna secara langsung. Sebaliknya, deskripsi tersebut akan digunakan sebagai metadata di balik layar untuk membantu sistem YouTube memahami konten-konten tersebut.
Our powerful visual language model Flamingo is changing the way can watch @YouTube Shorts.
It automatically generates descriptions for hundreds of millions of videos in their metadata, making them more searchable.
Here’s how AI is helping creators and viewers. ⬇️ pic.twitter.com/pAt7MxFNs1
— Google DeepMind (@DeepMind) May 24, 2023
Colin Murdoch, Chief Business Officer Google DeepMind, menilai Flamingo sangatlah berharga dalam membantu sistem YouTube mencari metadata yang relevan dengan konten video, sehingga bisa memberikan hasil pencarian yang lebih baik kepada pengguna.
Flamingo sudah mulai menerapkan deskripsi otomatis pada unggahan baru di YouTube Shorts, dan telah melakukannya untuk sejumlah besar video yang ada, termasuk video yang paling banyak ditonton. Pun demikian, belum diketahui apakah Flamingo juga akan diterapkan pada video YouTube standar ke depannya.
Kepada The Verge, Todd Sherman selaku Director of Product Management YouTube Shorts mengatakan bahwa kebutuhan akan metadata pada video yang lebih panjang mungkin lebih rendah. Hal ini dikarenakan para kreator biasanya menghabiskan waktu yang lebih lama dalam tahap pra-produksi, pengambilan gambar, dan penyuntingan video, sehingga menambahkan metadata mungkin hanya menjadi bagian kecil dari keseluruhan proses pembuatan video.
Namun tentu saja tidak menutup kemungkinan bagi Google untuk mengaplikasikan Flamingo atau teknologi serupa pada video YouTube standar di masa mendatang, apalagi mengingat usaha keras Google untuk mengintegrasikan kecerdasan buatan ke dalam berbagai layanan yang mereka tawarkan. Hal ini tentu akan memiliki dampak besar terhadap pencarian konten di platform YouTube.