Dark
Light

Mengintip Agregasi Berita Lewat Semantik

1 min read
March 22, 2010

Buat yang sering ngeblog atau nulis berita/artikel di internet, salah satu atribut wajib yang harus disertakan pastinya adalah tag dan kategori tulisan. Kegunaannya apalagi kalau bukan supaya tulisan yang dibuat dapat dicari dan dikelompokkan, baik oleh engine blog itu sendiri, maupun agregator web di luaran sana.

Kebutuhan penggunaan tag dan kategori ini tidak lain adalah karena engine-engine blog sederhana maupun agregator tidak bisa melakukan fungsi otak manusia yang dapat mencerna isi tulisan dan mengambil inti, subyek, atau topik dari tulisan tersebut.

Nah, ada dua entitas lokal, Gresnews dan Bataviase, yang mencoba bermain-main dengan puluhan sumber berita di internet dan membangun sebuah sistem yang dapat membaca, memahami, memberi konteks, menceritakan ulang, dan memberi rujukan ke sumber berita lainnya yang terkait.

Membaca halaman About dan Technology milik Gresnews bagai membaca abtraksi dan pendahuluan sebuah tulisan ilmiah, yang mungkin tidak jauh dari kenyataannya mengingat sang pembuatnya, Ismail Fahmi, adalah seorang doktor di bidang semantik web.

Secara garisbesarnya, Gresnews melakukan pendekatan semantik dengan mengekstrak subyek dan topik dari tiap-tiap berita, kemudian menyajikan tautan ke berita-berita terkait dengan subyek dan topik yang sama. Lebih jauhnya lagi, Gresnews juga menyediakan timeline dari subyek atau topik tersebut, menyajikan grafik trend topik tersebut, dan kutipan-kutipan tentang topik atau subyek tersebut.

Sedangkan Bataviase melakukan kegiatan yang lebih sederhana tapi tidak kalah menarik, yaitu merangkum kata-kata dan frase-frase kunci dari artikel, lalu menyajikan ringkasan artikel yang di-generate oleh sistem secara otomatis, dan memberi tautan ke artikel-artikel yang terkait. Hasil ringkasan otomatis oleh sistem ini cukup impresif dan malah belum tentu bisa dibuat setepat itu oleh manusia.

Berbeda dengan Gresnews yang hanya memberi kutipan tiap artikel, Bataviase menghadirkan lengkap artikel yang diolahnya. Melihat segambreng logo sumber berita yang dirujuk oleh Bataviase, sepertinya memang mereka secara resmi menjalin kerjasama dengan sumber-sumber beritanya.

Mengingat rumitnya pemahaman bahasa, dan apalagi membuat mesin menjadi mengerti, tentu saja masih dapat ditemui kekurangan di keduanya. Contohnya di Bataviase, pada artikel tentang Mega(wati Soekarnoputri) terdapat tautan ke artikel terkait yang juga membahas tentang Bank Mega.

Terus penting ngga sih sebenarnya? Jelas dong. Sebagai negara keempat paling banyak penduduknya di dunia, seharusnya sih makin banyak pihak yang memerlukan pemahaman bahasa kita. Contohnya Twitter, sebagaimana yang kita tau sendiri sering menyodorkan Trending Topics ajaib seperti “Yang Mau Di” atau “Yang Anak Indonesia”, akibat dari ketidakmampuan mereka mengerti konteks kalimat dalam Bahasa Indonesia.

Selain itu seiring dengan semakin banyaknya user-generated contents seperti blog dan tweet, yang tidak selalu disertai dengan tagging yang sesuai, sebuah aggregator yang “pintar” pasti akan sangat berguna.

Versi ngayal lebih jauhnya, kayaknya tinggal menunggu waktu aja kita bisa nanya atau ngobrol dengan komputer dan dapet jawaban seperti layaknya ngobrol dengan orang beneran šŸ˜€

4 Comments

  1. Plugin model auto posting di wordpress berarti menggunakan cara mirip seperti ini ya mungkin lebih sederhana

Leave a Reply

Your email address will not be published.

Previous Story

Berbicara Tentang Fitur Search di Ulang Tahun Twitter

Next Story

User Internet di China Lebih Sosial dari UK

Latest from Blog

Don't Miss

Startup penyedia tiket bioskop TIX ID mengembangkan fitur terbaru Nonton Online, layanan sewa film yang terdapat di Google Play Movie dan Apple TV

TIX ID Rilis “Nonton Online”, Layanan Agregator Sewa Film di Google Play Movie dan Apple TV

Startup penyedia tiket bioskopĀ TIX IDĀ mengembangkan fitur terbaru “Nonton Online”, layanan
Startup Logistik

Mengenal Startup Logistik BiteShip, Berawal Pivot Kemudian Profit

BiteShip sebuah platform yang mengintegrasikan sejumlah layanan logistik mengklaim sudah