Klasifikasi Berita Menggunakan Metode K-Nearest Neighbor
Abstract
Abstrak - Meningkatnya minat masyarakat dalam mengakses berita, khususnya berita online, menuntut redaktur dan situs portal berita untuk memberikan liputan dan berita yang berkualitas. Selain itu, klasifikas berita yang ada masih tergolong umum dapat menjadi kendala yang dialami pembaca. jika pembaca ingin melihat kategori berita yang lebih spesifik, mereka harus menyaring berita tersebut secara manual. Hal ini juga terjadi di bidang sosial Badan Pusat Statistik Provinsi Riau yang kesulitan mencari berita tentang Provinsi Riau. Oleh karena itu, proses klasifikasi berita menggunakan metode k-nearest neighbor menjadi hal yang krusial untuk dilakukan. Jumlah berita yang digunakan dalam penelitian ini berjumlah 510 data dengan tiga kategori yaitu demokrasi, kemiskinan, dan ketenagakerjaan. Proses klasifikasi berita dalam penelitian ini meliputi: pengumpulan data, pelabelan manual, preprocessing teks, pembobotan kata, dan klasifikasi memakai metode k-nearest neighbor. Selain itu, cosinus similarity juga digunakan untuk meningkatkan nilai akurasi. Nilai akurasi tertinggi yang diperoleh pada penelitian ini adalah 87% menggunakan nilai k = 3 dengan distribusi data uji 20% & dan data latih dari 80%. Dari penelitian ini dapat diambil kesimpulan bahwa metode K-Nearest Neighbor dapat bekerja dengan baik dalam proses klasifikasi berita.
Kata kunci: Badan Pusat Statistik, Berita, Cosine Similarity, Klasifikasi, K-Nearest Neighbor
Abstract - The increasing of public interest in accessing news, especially online news, requires editors and news portal sites to provide quality coverage and news. In addition, the grouping of news that still classified as a general can be an obstacle experienced by readers. if the reader wants to see a more specific category of news, they must filter the news manually. This is also happened in the social sector of Badan Pusat Statistik Provinsi Riau, which has trouble when finding news about Riau Province. Therefore, the news classification process using the k-nearest neighbor method is a crucial thing to do. The number of news stories used in this study amounted to 510 data with three categories, democracy, poverty, and employment. The news classification process in this study includes: data collection, manual labeling, text preprocessing, word weighting, and classification using k-nearest neighbor method. Besides that, cosine similarity is also used to increase the accuracy value. The highest accuracy values obtained in this study were 87% using a values of k = 3 with distribution of test data of 20% & and training data of 80%. From this research, it can be concluded that the K-Nearest Neighbor method works well in the news classification process.
Keywords: Badan Pusat Statistik, Cosine Similarity, Classification, K-Nearest Neighbor, News
Keywords
Full Text:
PDFReferences
Y. Pusparisa, “Masyarakat Indonesia Paling Banyak Akses Berita dari Media Daring,” databoks, 2021. .
S. N. Asiyah and K. Fithriasari, “132747-ID-klasifikasi-berita-online-menggunakan-me,” J. Sains dan Seni ITS, vol. 5, no. 2, pp. 317–322, 2016.
A. Y. Muniar, P. Pasnur, and K. R. Lestari, “Penerapan Algoritma K-Nearest Neighbor pada Pengklasifikasian Dokumen Berita Online,” Inspir. J. Teknol. Inf. dan Komun., vol. 10, no. 2, p. 137, 2020.
R. N. Devita et al., “PERBANDINGAN KINERJA METODE NAIVE BAYES DAN K-NEAREST NEIGHBOR UNTUK KLASIFIKASI ARTIKEL BERBAHASA INDONESIA PERFORMANCE COMPARISON OF NAIVE BAYES AND K-NEAREST NEIGHBOR,” vol. 5, no. 4, pp. 427–434, 2018.
D. A. Fauziah, A. Maududie, and I. Nuritha, “Klasifikasi Berita Politik Menggunakan Algoritma K-nearst Neighbor,” Berk. Sainstek, vol. 6, no. 2, p. 106, 2018.
F. Briliansyah, “Sistem klasifikasi kategori berita menggunakan metode k-nearest neighbor,” 2020.
R. Sagita, U. Enri, and A. Primajaya, “Klasifikasi Berita Clickbait Menggunakan K-Nearest Neighbor ( KNN ),” vol. 5, no. 2, pp. 230–238, 2020.
B. K. Palma, D. T. Murdiansyah, and W. Astuti, “Klasifikasi Teks Artikel Berita Hoaks Covid-19 dengan Menggunakan Algotrima K- Nearest Neighbor,” vol. 8, no. 5, pp. 10637–10649, 2021.
Indriyanti, D. Sugianti, and M. A. Al Karomi, “Peningkatan Akurasi Algoritma KNN dengan Seleksi Fitur G ain Ratio untuk Klasifikasi Penyakit Diabetes Mellitus,” IC-Tech, vol. 7, no. 2, pp. 1–6, 2017.
Y. D. Setiyaningrum, A. F. Herdajanti, C. Supriyanto, and Muljono, “Classification of twitter contents using chi-square and K-nearest neighbour algorithm,” Proc. - 2019 Int. Semin. Appl. Technol. Inf. Commun. Ind. 4.0 Retrosp. Prospect. Challenges, iSemantic 2019, pp. 78–81, 2019.
E. Ekienabor, “International Journal of Research Publications Volume-9 , Issue-1 , July 2018,” Int. J. Res. Publ., vol. Volume 8, no. July, 2018.
C. R. Semiawan, Metode Penelitian Kuantitatif. 2017.
DOI: https://doi.org/10.32672/jnkti.v5i2.4192
Refbacks
- There are currently no refbacks.
The Journal has been Indexed by :
BARCODE P-ISSN dan E-ISSN
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI) . Prodi Teknik Komputer, Fakultas Teknik, Universitas Serambi Mekkah
JNKTI is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.