Alibaba Cloud, divisi teknologi digital dan inteligensi milik Alibaba Group, telah meluncurkan model penghasil gambar berbasiskan AI (AI Generation Model) terbaru mereka, “Tongyi Wanxiang” (Wanxiang memiliki arti puluhan ribu gambar). Pengumuman ini mereka sampaikan pada World Artificial Intelligence Conference 2023.
Selain Tongyi Wanxiang, ada juga pengumuman peluncuran ModelScopeGPT, kerangka kerja serbaguna yang dirancang untuk membantu pengguna dalam menyelesaikan fungsi AI yang kompleks dan spesifik di berbagai bidang pada ModelScope.
ModelScope adalah platform Model-as-a-Service (MaaS) open-source yang sebelumnya telah diperkenalkan pada tahun lalu. Platform ini dilengkapi lebih dari 900 model AI.
“Tongyi Wanxiang merepresentasikan pencapaian signifikan lainnya dari usaha kami dalam mengembangkan model AI generative paling canggih sebagaimana kami terus mengeksplorasi teknologi pengubah paradigma yang memperkuat bisnis dan komunitas agar maksimal mengeluarkan kreativitas dan produktivitas,” kata Jingren Zhou, CTO untuk Alibaba Cloud Intelligence.
“Dengan dirilisnya Tongyi Wanxiang, ilustrasi gambar berkualitas tinggi dari generative AI akan lebih mudah diakses, berkontribusi pada pengembangan seni AI yang inovatif dan ekspresi kreatif bagi bisnis di berbagai sektor, termasuk e-commerce, game, desain, dan periklanan,” lanjutnya.
Tongyi Wanxiang diklaim mampu menghasilkan gambar yang mendetail dalam berbagai gaya, termasuk cat air, cat minyak, dan lukisan Tiongkok hingga animasi, sketsa, ilustrasi datar, dan kartun 3D. AI ini juga bisa mengolah respon perintah teks dalam bahasa Mandarin dan Inggris.
Selain itu, model ini dapat mengubah gambar apa pun menjadi gambar baru dengan gaya yang serupa atau menata ulang gambar melalui proses transfer gaya, namun dengan tetap mempertahankan materi gambar asli sembari menerapkan gaya visual gambar lain.
Karena ditopang oleh teknologi inovatif Alibaba Cloud dalam manajemen wawasan, visual AI, dan natural language processing (NLP), model ini memiliki kemampuan pemahaman semantik yang mumpuni sehingga menghasilkan gambar yang lebih akurat dan relevan secara kontekstual.
Selain itu, dengan mengoptimalkan proses kombinasi resolusi tinggi berdasarkan rasio signal-to-noise, model ini dapat menyeimbangkan antara keakuratan komposisi dan ketajaman detail.
Berikut beberapa contoh text-to-image yang dihasilkan oleh Tongyi Wanxiang:
ModelScope juga menyelenggarakan kompetisi AI Hackathon pertamanya di Tiongkok untuk memfasilitasi penerapan model AI pada skala industri. Para pemenang akan mendapatkan hadiah uang tunai dan peluang pendanaan dari perusahaan modal ventura terkemuka sebagai insentif.
Dari lebih dari 300 tim yang berpartisipasi, 56 tim berhasil mencapai babak final. Terdapat dua kategori yang bisa diikuti oleh setiap tim: Yang pertama adalah berinovasi pada Model Bahasa Berskala Besar (LLM) untuk memecahkan masalah sehari-hari. Dan yang kedua adalah memanfaatkan model yang sudah terlatih untuk menyelesaikan tugas yang diberikan.
“Dengan menyelenggarakan kompetisi dan acara komunitas terkait, kami ingin lebih banyak melibatkan developer dan pengusaha, dan mendorong mereka untuk mewujudkan ide-ide, memacu produktivitas, serta menciptakan alat AI yang lebih serbaguna yang dapat mengubah dan membentuk masa depan industri kita,” tutup Jingren Zhou.