Klasifikasi Rating Otomatis Pada Dokumen Teks Ulasan Produk Elektronik Menggunakan Metode N-Gram Dan Naïve Bayes

Download as pdf or txt
Download as pdf or txt
You are on page 1of 7

Jurnal Informatika Universitas Pamulang ISSN: 2541-1004

Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615


Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

Klasifikasi Rating Otomatis pada Dokumen Teks Ulasan Produk Elektronik


Menggunakan Metode N-gram dan Naïve Bayes
Rahmawan Bagus Trianto1, Andri Triyono2, Dhika Malita Puspita Arum3
1,2,3
Ilmu Komputer, Fakultas Sains dan Kesehatan, Universitas An Nuur, Jl. Gajah Mada No.7, Majenang,
Kuripan, Kec. Purwodadi, Kabupaten Grobogan, 58112
e-mail: [email protected], [email protected], [email protected]

Submitted Date: August 20th, 2020 Reviewed Date: September 22nd, 2020
Revised Date: September 28th, 2020 Accepted Date: September 30th, 2020

Abstract

Online product ratings usually provide descriptive reviews and also reviews in the form of ratings.
Likewise, what was done at the Lazada online store. Descriptive review can provide a clear view compared
to a rating review to other potential buyers. However, in reality there is a mismatch between the description
review and the rating given. This creates a lack of information for sellers as well as potential buyers.
Automatic classification of buyer descriptive reviews is proposed in this study so that there is a match
between descriptive reviews and rating reviews. This automatic classification descriptive review uses the
Naive Bayes algorithm with n-gram feature extraction and TF-IDF word weighting. The results of this
study obtained the best accuracy of 94.06%, a recall of 91.73% and precision of 90.71% in Bigram feature
extraction. With this accuracy value it can be used as a reference or model for classifying product
description reviews, so that the feedback process between sellers and buyers can run well.

Keywords: Electronic product review; Classification; Naïve Bayes; n-gram; TF-IDF

Abstrak

Penilaian produk online biasanya dengan memberikan ulasan deskripsi dan juga ulasan berupa rating.
Begitu juga yang dilakukan pada toko online Lazada. Ulasan deskripsi dapat memberikan pandangan yang
jelas dibandingkan dengan ulasan berupa rating kepada calon pembeli lain. Namun pada kenyataannya
sering dijumpai ketidaksesuaian antara ulasan deskripsi dengan rating yang diberikan. Hal ini membuat
kurangnya informasi bagi penjual dan juga calon pembeli. Pengklasifikasian otomatis ulasan deskripsi
pembeli diusulkan pada penelitian ini agar terjadi kesesuaian antara ulasan deskripsi dengan ulasan rating.
Pengklasifikasian otomatis ulasan deskripsi ini menggunakan algoritma Naive Bayes dengan ekstraksi fitur
n-gram dan pembobotan kata TF-IDF. Hasil dari penelitian ini didapatkan akurasi terbaik sebesar 94.06%,
recall sebesar 91.73% dan presisi sebesar 90.71% pada ekstraksi fitur Bigram. Dengan nilai akurasi yang
cukup tinggi tersebut dapat dijadikan salah satu acuan atau model untuk mengklasifikasikan ulasan
deskripsi produk, sehingga proses umpan balik antara penjual dan pembeli dapat berjalan dengan baik.

Kata kunci: Ulasan produk elektronik; Klasifikasi; Naïve Bayes; n-gram; TF-IDF

1. Pendahuluan terbaik (Hardilawati, 2020). Jual beli secara online


Belanja online sudah dikenal banyak orang sudah tentu memberikan pengalaman yang berbeda
karena memiliki banyak keunggulan. Beberapa jika dibandingkan dengan cara konvensional.
alasan orang berbelanja online adalah tidak perlu Perbedaan pengalaman berbelanja tersebut seperti
datang ke toko, harga relatif rendah, tidak perlu tidak dapat melihat dan mencoba produk aslinya.
antri, tidak perlu bermacet-macetan di jalan Maka, untuk dapat menilai produk yang dijual
(Harahap, 2018). Dan sekarang dengan adanya secara online biasanya digunakan fitur ulasan.
wabah covid-19 yang mengharuskan masyarakat Dengan ulasan yang ditulis oleh pembeli maka
harus menerapkan protokol kesehatan secara benar, akan sangat membantu bagi calon pembeli untuk
maka belanja online menjadi salah satu pilihan memutuskan berbelanja. Selain itu, ulasan juga

http://openjournal.unpam.ac.id/index.php/informatika 295
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

sangat penting bagi penjual, karena dapat meningkatkan akurasi prediksi (Sapuhtra et al.,
digunakan untuk meningkatkan kualitas 2019). Pada penelitian selanjutnya tentang prediksi
penjualannya di masa yang akan datang (Farki, rating otomatis menggunakan metode Naïve Bayes
Baihaqi, & Wibawa, 2016). dan n-gram pada ulasan produk kecantikan. Pada
Produk elektronik semakin diperlukan di era penelitian ini menghasilkan nilai akurasi terbaik
teknologi seperti sekarang, mulai dari komputer, dengan menggunakan kombinasi unigram dan
smartphone, TV, peralatan internet, laptop, dan bigram pada metode Naïve Bayes dengan akurasi
lain-lain. Banyak produk elektronik yang beredar mencapai 97% (Pujadayanti, Fauzi, & Sari, 2018).
luas di pasaran, terutama toko online seperti Penelitian selanjutnya mengenai analisis pengaruh
Lazada. Lazada merupakan salah satu e-commerce stemmer pada Bahasa Indonesia terhadap sentiment
terbesar yang ada di Indonesia dengan berbagai terjemahan ulasan film. Pada penelitian ini
produk yang dijualnya. Salah satu jenis produk menyatakan bahwa stemming tidak memiliki
yang dijual adalah barang elektronik. Banyak pengaruh pada akurasi, bahkan cenderung
ulasan dari pembeli untuk menilai kualitas barang, mengurangi efisiensi dari analisis sentiment
kualitas pelayanan penjual sampai pada kualitas (Agastya, 2018).
pengiriman barang. Namun, fakta di kenyataan Berdasarkan uraian di atas, maka peneliti
menunjukkan bahwa tidak semua pembeli mengusulkan sebuah penelitian dengan judul
memberikan ulasannya, baik berupa rating maupun Klasifikasi Rating Otomatis pada Dokumen Teks
secara deskripsi. Rating merupakan bentuk dari Ulasan Produk Elektronik Menggunakan Metode
tingkat kepuasan orang yang melakukan belanja N-gram dan Naïve Bayes. Adapun ekstraksi fitur
berupa ulasan setelah membeli suatu produk. Hal n-gram ini digunakan untuk meningkatkan akurasi
ini mengakibatkan informasi terkait produk tidak klasifikasi pada metode Naïve Bayes, yaitu
dapat diterima secara utuh, sehingga dapat unigram, bigram, dan trigram. Penelitian ini juga
mempengaruhi calon pembeli untuk melakukan tidak menggunakan proses stemming pada tahap
transaksi pembelian (Sapuhtra, Fauzi, & Rahayudi, preprocessing karena tidak memberikan
2019). Selain itu, pada kenyataan di lapangan tidak pengingkatan yang signifikan terhadap performa.
sedikit dijumpai adanya ulasan yang tidak sesuai Tujuan dari penelitian ini adalah membuat model
antara deskripsi dan rating yang diberikan (Farki et klasifikasi rating otomatis untuk memudahkan
al., 2016). Oleh sebab itu dibutuhkan sistem untuk penjual dalam meningkatkan kualitas penjualan
dapat mengklasifikasikan ulasan pembeli ke dalam dan memberikan pertimbangan bagi calon pembeli
rating yang sesuai secara otomatis. di e-commerce untuk memutuskan dalam
Pada penelitian sebelumnya, membahas bertransaksi.
mengenai klasifikasi untuk mendeteksi dua buah
kelas ulasan, yaitu spam atau bukan spam, 2. Metode Penelitian
menggunakan Naïve Bayes dan ekstraksi fitur n- 2.1. Data
gram. Penggunaan ekstraksi fitur n-gram pada Penelitian ini menggunakan dataset terbuka
metode Naïve Bayes terbukti dapat meningkatkan yang dapat diakses oleh siapa saja. Dataset ini
akurasi hingga 80.44% (Setyaji, Zidny, Prabowo, diambil dari alamat
& Hertantyo, 2018). Kemudian penelitian https://www.kaggle.com/grikomsn/lazada-
selanjutnya tentang klasifikasi teks pengaduan indonesian-reviews. Dataset ini berkaitan dengan
online menggunakan metode n-gram dan Neighbor ulasan dari pembeli di e-commerce Lazada untuk
Weighted K-Nearest Neighbor (WM K-NN), di jenis barang elektronik. Data yang diambil untuk
mana penggunaan ekstraksi fitur n-gram yaitu penelitian ini sebanyak 10.000 baris dengan kolom
unigram tidak memiliki pengaruh yang berarti. reviewContent, yaitu berupa data teks komentar
Dengan hasil rata-rata f-measurement sebesar dan rating. Rating terdiri dari angka yang dimulai
75.25%, sama dengan algortima WM K-NN saja dari 1 sampai dengan 5. Kolom rating merupakan
tanpa menggunakan ekstraksi fitur n-gram jenis data label dalam pembelajaran terarah atau
(Prasanti, Fauzi, & Furqon, 2018). Penelitian lain biasa disebut dengan supervised learning. Data
tentang prediksi rating pada review produk diambil secara acak untuk menghindari
kecantikan menggunakan metode Semantic kemungkinan subyektifitas yang terjadi.
Orientation Calculator dan Regresi Linier
menggunakan ekstraksi fitur n-gram. Hasil
penelitian ini menunjukkan ekstraksi firut n-gram,
yaitu bigram dan trigram memiliki pengaruh dalam

http://openjournal.unpam.ac.id/index.php/informatika 296
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

2.2. Metode yang Diusulkan


2.3. Tahap Pre-Processing
Langkah awal yang dilakukan dalam
memproses dokumen teks adalah pre-processing.
Proses yang dilakukan seperti tokenize, yaitu
memecah kalimat menjadi bentuk yang lebih
sederhana, yaitu kata atau dikenal dengan nama
term (García Adeva, Pikatza Atxa, Ubeda Carrillo,
& Ansuategi Zengotitabengoa, 2014). Transform
case atau mengubah huruf ke dalam bentuk huruf
kecil juga dilakukan pada tahap pre-processing ini
(García Adeva et al., 2014). Tahap yang tidak kalah
penting adalah filter stopwords, yaitu membuang
informasi yang tidak relevan, tidak penting dan
tidak dibutuhkan dalam suatu dokumen teks
(Sheela, 2018). Pada penelitian ini tidak
menggunakan tahap stemming karena pada
penelitian (Agastya, 2018) tidak menunjukkan
adanya perbaikan hasil akhir, bahkan menambah
beban pada komputer karena membutuhkan waktu
dan sumber daya yang lebih banyak.

2.4. N-Gram
Dalam suatu dokumen teks, bahasa atau
ungkapan tidak hanya tersusun dari kata-kata
parsial. Namun untuk membentuk makna yang
sebenarnya bahasa atau ungkapan terdiri dari
gabungan dua kata atau lebih. Gabungan dua kata
atau lebih ini dalam text mining dikenal dengan
nama n-gram (Pujadayanti et al., 2018) (Lidya,
Sitompul, & Efendi, 2015). Sebagai contoh
penggunaan n-gram dengan n=2 pada kalimat
“Laptop sampai dengan selamat, pelayanan
penjual memuaskan, pengiriman sangat cepat”
adalah “laptop sampai”, “sampai dengan”,
Gambar 1. Flowchart metode yang diusulkan “dengan selamat”, “pelayanan penjual”, “penjual
memuaskan”, “pengiriman sangat”, “sangat
Tahap pertama pada proses klasifikasi rating cepat”. Jika menggunakan n=3 maka kalimat
ulasan dilakukan pre-processing. Pada tahap pre- dipecah setiap tiga kata.
processing ini terdiri dari tiga proses, yaitu
tokenize, transform case dan filter stopwords. 2.5. Pembobotan Term TF-IDF
Setelah melalui tahap pre-processing dilanjutkan Term Frequency – Inverse Document
dengan ekstraksi fitur. Ekstraksi fitur pada Frequency atau sering dikenal dengan TF-IDF
penelitian ini menggunakan n-gram, yaitu adalah teknik gabungan dari TF dan IDF untuk
unigram, bigram dan trigram. Selanjutnya masuk memberikan bobot dari term (Haq & Budi, 2019).
ke tahap pembobotan term atau pembobotan kata TF-IDF sangat terkenal digunakan untuk
menggunakan TF-IDF. Setelah didapatkan bobot pemrosesan bahasa alami (Trstenjak, Mikac, &
masing-masing kata, dilanjutkan pada proses Donko, 2014). Selain itu TF-IDF juga sangat baik
klasifikasi menggunakan metode Naïve Bayes dan dalam menentukan term penting dalam dokumen
dilakukan validasi menggunakan k-fold validation. teks (AL-Smadi, Jaradat, AL-Ayyoub, & Jararweh,
Validasi menggunakan k-fold validation dengan 2017). Untuk mendapatkan bobot term dapat
nilai k=10. Selanjutnya dilakukan evaluasi dengan dilihat pada persamaan 1.
pengukuran F-Measure untuk mengetahui akurasi,
presisi dan juga recall.

http://openjournal.unpam.ac.id/index.php/informatika 297
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

𝑁
𝑇𝐹 ∗ 𝐼𝐷𝐹(𝑑, 𝑡) = 𝑇𝐹(𝑑, 𝑡) ∗ 𝑙𝑜𝑔 𝑑𝑓(𝑡) (1)
Untuk:
Untuk:
• P = peluang
• TF * IDF (d,t) = bobot term t pada
• Ai = atribut ke i
dokumen d
• C = kelas yang akan diklasifikasikan
• TF(d,t) = frekuensi kemunculan
• 𝜎 = varian seluruh atribut
term t pada dokumen d
• 𝜇 = rata-rata seluruh atribut
• N = total seluruh dokumen
• df(t) = jumlah dokumen yang
Adapun pengujian pada penelitian ini
terdapat term t
menggunakan k-fold validation dengan nilai k=10,
yang berarti data akan dibagi menjadi 10 bagian
2.6. Klasifikasi dengan Naïve Bayes
dan setiap 9 bagian akan dipakai sebagai data
Klasifikasi telah dipakai dalam berbagai
learning atau pelatihan, dan 1 bagian dipakai
bidang, salah satunya pada konteks dokumen.
sebagai data testing atau pengujian (Saputri,
Klasifikasi dokumen teks sudah dipakai seperti
Mahendra, & Adriani, 2019).
pengelompokan jenis dokumen, klasifikasi spam
atau bukan spam pada pesan elektronik,
2.7. Validasi dan Pengukuran Performa
menentukan sentiment positif dan negatif, serta
Validasi yang digunakan pada penelitian ini
masih banyak lagi (Di Nunzio, 2014). Salah satu
adalah k-fold validation dengan k = 10. Ini berarti
metode yang banyak digunakan untuk klasifikasi
dataset dipecah menjadi 10 bagian, 9 bagian
adalah Naïve Bayes. Metode Naïve Bayes
digunakan untuk proses pelatihan dan 1 bagian
merupakan metode klasifikasi berdasarkan teorema
digunakan untuk proses pengujian. Proses ini
probabilitas dan statistik Bayes (Haq & Budi, 2019)
dilakukan sebanyak 10 kali (Wahono, Herman, &
(Santoso et al., 2020). Naïve Bayes dapat
Ahmad, 2014). Tahap ini dapat dilihat pada tabel 1.
memperkirakan peluang yang mungkin terjadi di
masa depan dengan melihat data-data sebelumnya Tabel 1. Pembagian dataset pada 10-fold validation
dengan ciri khas berupa independensi dari masing- Validasi Pembagian dataset
masing kondisi. Rumus Naïve Bayes dapat dilihat ke-n
secara matematisnya pada persamaan 2.
1
𝑃(𝑐 |𝑥 )∗𝑃(𝑐) 2
𝑃(𝐶|𝑋) = 𝑃(𝑥)
(2) 3
4
Untuk: 5
• x = data yang belum diketahui 6
kelasnya 7
• c = data yang telah diketahui 8
kelasnya 9
• p(c|x) = peluang hipotesis c 10
berdasarkan kondisi x (posterior
probability) Tanda warna hitam menandakan dataset
• p(x|c) = peluang hipotesis x yang dipakai untuk data pelatihan. Sedangkan pada
berdasarkan kondisi c (likelihood) bagian yang lain menandakan dataset yang dipakai
• p(c) = peluang hipotesis c (class untuk data pelatihan.
prior probability) Untuk mengetahui performa klasifikasi,
• p(x) = peluang x (predictor prior diperlukan sebuah pengukuran, yaitu akurasi,
probability) presisi dan recall (Deolika, Kusrini, & Luthfi,
2019). Pengukuran ini sering dikenal dengan
Sedangkan untuk klasifikasi dengan data sebutan confusion matrix. Confusion matrix biasa
yang berlanjut digunakan persamaan 3. dipakai pada proses pembelajaran terarah. Pada
confusion matrix, data pada kolom mewakili data
(𝐴𝑖 − 𝜇𝑖𝑗 )2 yang diharapkan, sedangkan data pada baris
1 −
2(𝜎𝑖𝑗 )2 mewakili data yang diprediksi (Dhande & Patnaik,
𝑃(𝐴𝑖 |𝐶𝑗 ) = 𝑒𝑥𝑝 (3)
√2𝜋𝜎𝑖𝑗 2014). Berbeda dengan klasifikasi dengan 2 buah

http://openjournal.unpam.ac.id/index.php/informatika 298
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

kelas, untuk menghitung akurasi, presisi dan recall klasifikasi jika dibandingkan dengan metode Naïve
pada klasifikasi dengan kelas lebih dari 2 Bayes saja, dibuktikan dengan nilai akurasi, presisi
menggunakan rata-rata (Sokolova & Lapalme, dan recall yang sama, yaitu masing-masing
2009). Untuk menghitung akurasi, presisi dan 85.66%, 77.92%, dan 87.28%. Hal ini karena
recall dapat dilihat pada persamaan 4, 5 dan 6. penggunaan unigram pada dasarnya adalah sama
saja dengan tahap pre-processing, yaitu pada tahap
𝑇𝑃𝑖 + 𝑇𝑁𝑖
∑𝑐𝑖=1 tokenize yang mana memecah kalimat menjadi
𝑇𝑃𝑖+ 𝑇𝑁𝑖 + 𝐹𝑃𝑖 + 𝐹𝑁𝑖
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = 𝑐
∗ 100% (4) kata-kata. Kemudian penggunaan trigram
memberikan performa lebih baik jika dibandingkan
∑𝑐𝑖=1 𝑇𝑃𝑖 dengan Naïve Bayes saja dan Naïve Bayes +
𝑃𝑟𝑒𝑠𝑖𝑠𝑖 = 𝑐
∑𝑖=1(𝐹𝑃𝑖+𝑇𝑃𝑖)
∗ 100% (5)
unigram, namun lebih rendah jika dibandingkan
dengan Naïve Bayes + bigram.
∑𝑐𝑖=1 𝑇𝑃𝑖
𝑅𝑒𝑐𝑎𝑙𝑙 = 𝑐
∑𝑖=1(𝑇𝑃𝑖+𝐹𝑁𝑖)
∗ 100% (6)
8000
Di mana: 6000
• c = jumlah kelas 4000
• TPi = jumlah True Positive pada
kelas ke i, jumlah data positif yang 2000
diklasifikasikan benar oleh sistem 0
pada kelas ke i 1 2 3 4 5
• TNi = jumlah True Negative pada
kelas ke i, jumlah data negatif yang Rating 1 Rating 2 Rating 3
diklasifikasikan benar oleh sistem Rating 4 Rating 5
pada kelas ke i
Gambar 2. Grafik sebaran klasifikasi Naïve Bayes dan
• FNi = jumlah False Negative pada Naïve Bayes + Unigram
kelas ke i, jumlah data negatif yang
diklasifikasikan salah oleh sistem Pada gambar 2 data sebaran rating pada hasil
pada kelas ke i klasifikasi menggunakan Naïve Bayes dan Naïve
• FPi = jumlah False Positive pada Bayes + Unigram pada kelas rating 1 memiliki
kelas ke i, jumlah data positif yang nilai yang benar sebanyak 1110 data, pada kelas
diklasifikasikan salah oleh sistem rating 2 data yang benar sebanyak 347. Pada kelas
pada kelas ke i rating 3 memiliki data yang benar sebanyak 603,
pada kelas rating 4 memiliki data yang benar
3. Hasil dan Pembahasan sebanyak 1139 buah, serta pada kelas rating 5
memiliki nilai yang benar sebanyak 5367 buah
Tabel 2. Hasil pengujian klasifikasi
data.
Model Akurasi Presisi Recall
Naïve Bayes 85,66% 77.92% 87.28%
tanpa n-gram 8000
Naïve Bayes 85,66% 77.92% 87.28%
dengan unigram 6000
Naïve Bayes 94,06% 90.71% 91.73% 4000
dengan bigram
Naïve Bayes 89,91% 79.29% 91.48% 2000
dengan trigram
0
1 2 3 4 5
Tabel 2 menunjukkan hasil pengujian
klasifikasi ulasan produk elektronik pada e- Rating 1 Rating 2 Rating 3
commerce Lazada. Hasil terbaik didapat pada Rating 4 Rating 5
pemakaian bigram pada metode Naïve Bayes, yaitu
dengan nilai akurasi sebesar 94.06%, nilai presisi Gambar 3. Grafik sebaran klasifikasi Naïve Bayes +
sebesar 90.71% dan nilai recall sebesar 91.73%. Bigram
Dapat dilihat pula bahwa pemakaian unigram tidak
memiliki pengaruh sama sekali pada hasil

http://openjournal.unpam.ac.id/index.php/informatika 299
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

Pada gambar 3 dapat dilihat peningkatan dapat dilihat pula bahwa sebaran dataset yang
hasil klasifikasi pada semua kelas rating jika diambil memiliki sifat imbalance dataset, yaitu
dibandingkan dengan klasifikasi menggunakan ketidakmerataan jumlah data antar kelas, terutama
Naïve Bayes saja maupun Naïve Bayes + Unigram, pada kelas rating 5.
yaitu kelas rating 1 data yang benar sebanyak 1174,
kelas rating 2 sebanyak 348, kelas rating 3 4. Kesimpulan
sebanyak 610, kelas rating 4 sebanyak 1203 dan Klasifikasi ulasan produk elektronik ke
kelas rating 5 sebanyak 6071. dalam bentuk rating dapat dilakukan menggunakan
metode Naïve Bayes dan n-gram. Diawali dengan
8000 tahap pre-processing kemudian dilanjutkan
pembobotan term menggunakan TF-IDF serta
6000
ekstraksi fitur menggunakan n-gram dan
4000 dilanjutkan klasifikasi menggunakan metode Naïve
2000 Bayes. Ekstraksi fitur menggunakan n-gram
terbukti dapat meningkatkan hasil akhir klasifikasi.
0
1 2 3 4 5
Hasil terbaik yang didapatkan adalah
menggunakan ekstraksi fitur bigram, diikuti
Rating 1 Rating 2 Rating 3 ekstraksi fitur trigram dan setelahnya ekstraksi
Rating 4 Rating 5 fitur unigram (dan juga hanya Naïve Bayes tanpa n-
gram). Adapun hasil akurasi, presisi dan recall
Gambar 4. Grafik sebaran klasifikasi Naïve Bayes + pada klasifikasi dengan Naïve Bayes menggunakan
Trigram ekstraksi fitur bigram adalah sebesar 94.06%,
90.71%, dan 91.73%. Dengan nilai akurasi yang
Gambar 4 menunjukkan hasil klasifikasi cukup tinggi tersebut dapat dijadikan salah satu
menggunakan Naïve Bayes + Trigram, di mana acuan atau model untuk mengklasifikasikan ulasan
semua kelas rating menunjukkan hasil yang lebih deskripsi produk, sehingga proses umpan balik
baik jika dibandingkan dengan Naïve Bayes antara penjual dan pembeli dapat berjalan dengan
maupun Naïve Bayes + Unigram. Jika baik. Untuk hasil akurasi, presisi dan recall pada
dibandingkan dengan Naïve Bayes + Bigram, klasifikasi dengan Naïve Bayes menggunakan
hanya kelas rating 1 dan 5 yang memiliki data true ekstraksi fitur trigram sebesar 89.91%, 79.29% dan
positive lebih rendah, kelas rating 2, 3 dan 4 91.48%. Kemudian hasil akurasi, presisi dan recall
mempunyai data true positive lebih baik. Namun, pada klasifikasi dengan Naïve Bayes menggunakan
pada kelas rating 2, 3 dan 4 tidak memiliki ekstraksi fitur unigram dan juga tanpa n-gram
perbedaan yang besar. Pada kelas rating 5 memiliki memiliki nilai yang sama, yaitu 85.66%, 77.92%
perbedaan yang mencolok, dan ini salah satu sebab dan 87.28%.
yang mengakibatkan akurasi, presisi dan recall
menjadi lebih baik. Referensi
Pada pemakaian n-gram, terutama pada fitur Agastya, I. M. A. (2018). Pengaruh Stemmer Bahasa
bigram, dapat mengklasifikasikan lebih baik Indonesia Terhadap Peforma Analisis Sentimen
karena gabungan dua kata memberikan makna Terjemahan Ulasan Film. Jurnal Tekno Kompak,
yang lebih baik, sehingga hasil klasifikasi juga 12(1), 18. https://doi.org/10.33365/jtk.v12i1.70
menjadi lebih baik jika dibandingkan dengan AL-Smadi, M., Jaradat, Z., AL-Ayyoub, M., &
gabungan dari tiga kata dan juga kata tunggal. Hal Jararweh, Y. (2017). Paraphrase identification and
semantic text similarity analysis in Arabic news
ini dapat dilihat seperti kalimat “Barang Ok,
tweets using lexical, syntactic, and semantic
kualitas bagus dengan harga yg cukup miring, features. Information Processing & Management,
kualitas gambar juga ok, pengiriman lumayan, ga 53(3), 640–652.
nyesel pokonya beli TV ini”, setelah melalui tahap https://doi.org/10.1016/j.ipm.2017.01.002
pre-processing dan ekstraksi fitur maka menjadi Deolika, A., Kusrini, K., & Luthfi, E. T. (2019). Analisis
“barang ok”, “ok kualitas”, “kualitas bagus”, Pembobotan Kata Pada Klasifikasi Text Mining.
“bagus harga”, “harga cukup”, “cukup miring”, Jurnal Teknologi Informasi, 3(2), 179.
“miring kualitas”, “kualitas gambar”, “gambar https://doi.org/10.36294/jurti.v3i2.1077
ok”, “ok pengiriman”, “pengiriman lumayan”, Dhande, L. L., & Patnaik, P. G. K. (2014). Analyzing
“lumayan ga”, “ga nyesel”, “nyesel pokonya”, Sentiment of Movie Review Data using Naive
Bayes Neural Classifier. International Journal of
“pokonya beli”, “beli tv”. Dari gambar 2, 3 dan 4

http://openjournal.unpam.ac.id/index.php/informatika 300
Jurnal Informatika Universitas Pamulang ISSN: 2541-1004
Penerbit: Program Studi Teknik Informatika Universitas Pamulang e-ISSN: 2622-4615
Vol. 5, No. 3, September 2020 (295-301) 10.32493/informatika.v5i3.6110

Emerging Trends & Technology in Computer gram. Jurnal Pengembangan Teknologi Informasi
Science (IJETTCS), 3(4), 313–320. Diambil dari dan Ilmu Komputer (J-PTIIK), 2(11), 4421–4427.
www.ijettcs.org Santoso, H. A., Rachmawanto, E. H., Nugraha, A.,
Di Nunzio, G. M. (2014). A new decision to take for Nugroho, A. A., Setiadi, D. R. I. M., & Basuki, R.
cost-sensitive Naïve Bayes classifiers. S. (2020). Hoax classification and sentiment
Information Processing & Management, 50(5), analysis of Indonesian news using Naive Bayes
653–674. optimization. Telkomnika (Telecommunication
https://doi.org/10.1016/j.ipm.2014.04.008 Computing Electronics and Control), 18(2), 799–
Farki, A., Baihaqi, I., & Wibawa, M. (2016). Pengaruh 806.
online customer review rating terhadap https://doi.org/10.12928/TELKOMNIKA.V18I2.
kepercayaan place di indonesia. Jurnal Teknik 14744
ITS, 5(2), A614–A619. Sapuhtra, B. D., Fauzi, M. A., & Rahayudi, B. (2019).
García Adeva, J. J., Pikatza Atxa, J. M., Ubeda Carrillo, Prediksi Rating Pada Review Produk Kecantikan
M., & Ansuategi Zengotitabengoa, E. (2014). Menggunakan Metode Semantic Orientation
Automatic text classification to support systematic Calculator dan Regresi Linier. Jurnal
reviews in medicine. Expert Systems with Pengembangan Teknologi Informasi dan Ilmu
Applications, 41(4), 1498–1508. Komputer, 3(5), 4477–4483.
https://doi.org/10.1016/j.eswa.2013.08.047 Saputri, M. S., Mahendra, R., & Adriani, M. (2019).
Haq, F. I. N., & Budi, E. (2019). Implementasi Naive Emotion Classification on Indonesian Twitter
Bayes Classifier untuk Prediksi Kepribadian Big Dataset. Proceedings of the 2018 International
Five pada Twitter Menggunakan Term Frequency- Conference on Asian Language Processing, IALP
Inverse Document Frequency ( TF-IDF ) dan 2018, 90–95. IEEE.
Term Frequency-Relevance Frequency ( TF-RF ) https://doi.org/10.1109/IALP.2018.8629262
Program Studi Sarjana Ilmu Komputasi Fakultas Setyaji, M., Zidny, M., Prabowo, W. A., & Hertantyo,
Informatik. e-Proceeding of Engineering, 6(2), G. B. (2018). Naive Bayes dengan Ekstraksi Fitur
9785–9795. N-gram dalam Mendeteksi Spam Ulasan Bahasa
Harahap, D. A. (2018). Perilaku Belanja Online Di Indonesia. Proceedings on Conference on
Indonesia: Studi Kasus. JRMSI - Jurnal Riset Electrical Engineering, Telematics, Industrial
Manajemen Sains Indonesia, 9(2), 193–213. Technology, and Creative Media, 56–60.
https://doi.org/10.21009/jrmsi.009.2.02 Sheela, S. P. (2018). Sentiment Analysis and Prediction
Hardilawati, W. L. (2020). Jurnal Akuntansi & of Online Reviews with Empty Ratings.
Ekonomika. Jurnal Akuntansi & Ekonomika, International Journal of Applied Engineering
10(1), 89–98. Diambil dari Research, 13(14), 11532–11539.
http://ejurnal.umri.ac.id/index.php/jae Sokolova, M., & Lapalme, G. (2009). A systematic
Lidya, S. K., Sitompul, O. S., & Efendi, S. (2015). analysis of performance measures for
Sentiment Analysis Pada Teks Bahasa Indonesia classification tasks. Information Processing and
Menggunakan Support Vector Machine ( Svm ). Management, 45(4), 427–437.
Seminar Nasional Teknologi dan Komunikasi https://doi.org/10.1016/j.ipm.2009.03.002
2015, 2015(Sentika), 1–8. Trstenjak, B., Mikac, S., & Donko, D. (2014). KNN with
Prasanti, A. A., Fauzi, M. A., & Furqon, M. T. (2018). TF-IDF based framework for text categorization.
Klasifikasi Teks Pengaduan Pada Sambat Online Procedia Engineering, 69, 1356–1364. Elsevier
Menggunakan Metode N- Gram dan Neighbor B.V.
Weighted K-Nearest Neighbor ( NW-KNN ). https://doi.org/10.1016/j.proeng.2014.03.129
Jurnal Pengembangan Teknologi Informasi dan Wahono, R. S., Herman, N. S., & Ahmad, S. (2014). A
Ilmu Komputer (J-PTIIK) Universitas Brawijaya, comparison framework of classification models
2(2), 594–601. for software defect prediction. Advanced Science
Pujadayanti, I., Fauzi, M. A., & Sari, Y. A. (2018). Letters, 20(10–12), 1945–1950.
Prediksi Rating Otomatis pada Ulasan Produk https://doi.org/10.1166/asl.2014.5640
Kecantikan dengan Metode Naïve Bayes dan N-

http://openjournal.unpam.ac.id/index.php/informatika 301

You might also like