Studi Perbandingan Algoritma-Algoritma Stemming Untuk Dokumen Teks Bahasa Indonesia

Penulis Manase Sahat H Simarangkir
Publisher Jurnal Inkofar
Nomor ISSN 2581-2920

Sari

Stemming merupakan proses untuk memetakan berbagai variasi morfologikal dari kata menjadi bentuk dasar yang sama, dengan menghilangkan semua imbuhan baik yang terdiri dari awalan, sisipan, akhiran dan kombinasi dari awalan dan akhiran pada kata berimbuhan. Pada penelitian ini digunakan dua algoritma stemming berbasis kamus dan dua algoritma stemming menggunakan aturan imbuhan. Pengujian dilakukan menggunakan 100 dokumen teks Bahasa Indonesia yang sudah ditentukan sebelumnya. Hasil pengujian yang dilakukan menunjukkan bahwa waktu proses stemming yang paling cepat terdapat pada algoritma Vega, akurasi yang paling tinggi terdapat pada algoritma Nazief dan Adriani, overstemming yang paling sedikit terdapat pada algoritma Nazief dan Adriani karena nilainya lebih rendah, understemming yang paling sedikit terdapat pada algoritma Nazief dan Adriani karena nilainya lebih rendah. Dari pengujian yang dilakukan menunjukkan bahwa algoritma yang paling baik terdapat pada algoritma Nazief dan Adriani.

Teks Lengkap:

PDF

Referensi

Agusta, L 2009. ‘Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia’. Konferensi Nasional Sistem dan Informatika. KNS&I09-036.

Arifin, A, Z & Setiono, A, N 2002. ‘Klasifikasi Dokumen Berita Kejadian Berbahasa Indonesia dengan Algoritma Single Pass Clustering’. Institut Teknologi Sepuluh November (ITS). Surabaya.www.its.ac.id.

Chaer, A 2011. Tata Bahasa Praktis Bahasa Indonesia, Rineka Cipta Jakarta. Indonesia.

Kamus Besar Bahasa Indonesia (KBBI) luring CHM V1.5, ebsoft.web.id. diakses Rabu 25 November 2015.

Nazief, B & Adriani, M 1996. ‘Confix-Stripping: Approach to Stemming Algorithm for Bahasa Indonesia’. Fakulty of Computer Science. University of Indonesia.

Rozi, M, L 2013. ‘Implementasi dan Analisis Perbandingan Algoritma Stemming Nazief dan Adriani dengan Algoritma Stemming Vega dalam Information Retrieval System’. Telkom University, Bandung.

Tala, F, Z 2004. ‘A Study of Stemming Effects on Information Retrieval in Bahasa Indonesia’, Institute for Logic, Language and Computation Universiteit van Amsterdam The Netherlands.

Utomo, M, S 2013. ‘Implementasi stemmer Tala pada Aplikasi Berbasis Web’, Jurnal Teknologi Informasi DINAMIK, Volume 18, No.1.

Vega, V, B 2001. ‘Information Retrieval for the Indonesian Language’. Master‟s thesis, National University Singapore.