Klasifikasi Sms Spam Menggunakan Algoritma K-Nearest Neighbor

  • Andrei Wara Putera universitas harapan medan
  • Suriati Suriati
  • Yuyun Dewi Lestari
Keywords: SMS Spam, TF-IDF, K-Nearest Neighbor, Cosine Similarity

Abstract

Penggunaan media short message service (SMS) untuk komunikasi masih sangat banyak. Hal itu terjadi dikarenakan beberapa faktor, seperti tarif yang murah, bonus yang diberikan serta kemudahan dalam penggunaan. Namun, faktor-faktor tersebut menjadikan layanan SMS dimanfaatkan untuk melakukan tindakan kriminal, salah satunya adalah SMS penipuan. Untuk mengatasi hal tersebut, diperlukan sebuah sistem yang dapat mengklasifikasi SMS yang termasuk spam atau bukan spam. Dalam penelitian ini Dataset SMS yang digunakan adalah Dataset SMS berbahasa Indonesia. Untuk pembobotan teks menggunakan metode TF-IDF dan Cosine Similarity untuk metode perhitungan jarak. Hasil dari penelitian ini berupa aplikasi yang mampu mengklasifikasi SMS Spam Bahasa Indonesia Menggunakan Algoritma K-Nearest Neighbor

Downloads

Download data is not yet available.

References

[1] I. K. Siregar and F. Taufik, “PERANCANGAN APLIKASI SMS ALERT BERBASIS WEB,” J I M P - J. Inform. Merdeka Pasuruan, vol. 2, no. 2, 2017, doi: 10.37438/jimp.v2i2.68.
[2] R. Minarni, “Implementasi Algoritma Base64 Untuk Mengamakan Sms Pada Smartphone,” Build. Informatics, Technol. Sci., vol. 1, no. 1, 2019, doi: 10.47065/bits.v1i1.3.
[3] C. S. Wahyuni and M. Munar, “Aplikasi Pemilihan Kepala Desa Di Kecamatan Gandapura Menggunakan Sms Gateway Dan E-Voting,” J. TIKA, vol. 6, no. 01, 2021, doi: 10.51179/tika.v6i01.406.
[4] E. Zuviyanto, T. B. Adji, and N. A. Setiawan, “Perbandingan Algoritme-Algoritme Pembelajaran Mesin pada Klasifikasi SMS Spam,” in Seminar Nasional Inovasi dan Aplikasi Teknologi di Industri, 2018.
[5] B. Indiarto, “Klasifikasi Sms Spam Dengan Metode Naive Bayes Classifier Untuk Menyaring Pesan Melalui Selular,” J. Telemat. MKOM, vol. 8, no. 2, 2016.
[6] Subhan Subhan, “Klasifikasi Konten Web Radikal Di Indonesia menggunakan Web Content Mining Dan Algoritma K-Nearest Neighbor,” J. Informasi, Sains dan Teknol., vol. 4, no. 2, 2021, doi: 10.55606/isaintek.v4i2.3.
[7] S. N. D. Pratiwi and B. S. S. Ulama, “Klasifikasi Email Spam dengan Menggunakan Metode Support Vector Machine dan k-Nearest Neighbor,” J. Sains dan Seni ITS, vol. 5, no. 2, 2016.
[8] F. A. Prayoga, A. Pinandito, and R. S. Perdana, “Rancang Bangun Aplikasi Deteksi Spam Twitter menggunakan Metode Naive Bayes dan KNN pada Perangkat Bergerak Android,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 2, 2018.
[9] Y. Wibisono, “Dataset Klasifikasi Bahasa Indonesia (SMS Spam) & Klasifikasi Teks dengan Scikit-Learn,” 2018. https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-dengan-scikit-learn/ (accessed Sep. 10, 2022).
[10] B. Herwijayanti, D. E. Ratnawati, and L. Muflikhah, “Klasifikasi Berita Online dengan menggunakan Pembobotan TF-IDF dan Cosine Similarity,” Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 2, no. 1, pp. 306–312, 2018, [Online]. Available: https://j-ptiik.ub.ac.id/index.php/j-ptiik/article/view/796
Published
2023-08-30
Section
Articles