Google sudah jadi pelopor sumber informasi di dunia maya bagi komunitas pengguna komersil, hampir di seluruh dunia. Beberapa mesin pencari baru yang bermunculan tak banyak berdampak terhadap nama besar Google. Setelah sukses jadi penguasa pasar di sektor komersil, Google mengalihkan bidikannya ke ceruk komunitas cerdas yang mengedepankan data ilmiah lewat mesin pencari baru yang menyuguhkan kumpulan datasets.
Dinamai Dataset Search, mesin pencari ini menjadi pionir sekaligus wujud kekhawatiran Google akan luasnya cakupan data yang tersedia di mesin pencari, namun sebagian besar terfragmentasi dan tidak tercover dengan baik. Jurnalis, peneliti, perusahaan dan siapapun yang membutuhkan data seolah tak punya referensi di mana mereka dapat menemukan data yang dicari. Hasil pencarian Google Search memberikan temuan yang terlalu luas, tak terfokus dan cenderung berasal dari sumber yang tidak otentik.
Dataset Search menyediakan akses mudah ke kumpulan dataset yang “berserakan” di web, mencakup ilmu lingkungan, sosial, data pemerintah dan organisasi berita seperti ProPublica. Data dapat berasal dari banyak sumber, namun terfokus pada situs publisher, pustaka digital dan web pribadi penulis yang berreputasi baik. Tetapi tidak semua web dapat dibaca sebagai dataset, hanya mereka yang telah menerapkan skema markup yang diluncurkan oleh Google pada bulan Juli lalu.
Organisasi yang menerbitkan datanya secara online diharuskan menyertakan tags metadata di dalamnya yang menjabarkan data tersebut termasuk penulisnya. Laman ini akan diindeks oleh mesin pencari Google dan dikombinasikan dengan informasi dari Knowledge Graph.
Ke depan, ketika lebih banyak penerbit yang mulai menggunakan markah skema baru tersebut, maka cakupan data yang dapat diletakkan ke dalam hasil pencarian Dataset Search juga akan semakin luas.
Dataset Search dikonfirmasi dapat bekerja dalam berbagai bahasa. Dan sejumlah bahasa lain akan terus ditambahkan seiring pengembangannya di masa mendatang.
Sumber berita Google dan gambar header ilustrasi interface web Dataset Search.