Analisis Kinerja Algoritma K-Nearest Neighbor dengan Variasi Validasi Untuk Prediksi Diabetes Mellitus
Keywords:
K-Nearest Neighbor, Diabetes Mellitus, RapidMinerAbstract
Diabetes Mellitus ialah penyakit tidak menular dengan tingkat prevalensi yang terus meningkat, sehingga diperlukan metode prediksi yang akurat untuk mendukung upaya deteksi dini. Studi ini bertujuan menganalisis kinerja algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan status diabetes menggunakan dataset PIMA Indian Diabetes. Evaluasi model dilaksanakan dengan variasi nilai k, yaitu k = 3, 5, 7, 9, dan 11, serta dua teknik validasi, yaitu split data dengan proporsi 70% data latih serta 30% data uji serta 10-fold cross validation. Seluruh proses pemodelan dilakukan menggunakan RapidMiner Studio dengan penerapan normalisasi Min–Max. Kinerja model dievaluasi berlandaskan metrik akurasi, precision, recall, serta confusion matrix. Temuan studi mengindikasikan bahwasanya teknik 10-fold cross validation menghasilkan performa yang lebih stabil dan representatif dibandingkan teknik split data, dengan nilai akurasi tertinggi sebesar 73,84% pada k = 9 serta simpangan baku yang relatif kecil. Variasi nilai k terbukti memengaruhi kinerja algoritma KNN, di mana nilai k pada rentang menengah memberikan keseimbangan terbaik antara akurasi dan kemampuan deteksi kelas diabetes. Meskipun demikian, nilai recall pada kelas positif masih menunjukkan adanya potensi kesalahan false negative, sehingga model KNN dalam penelitian ini lebih tepat digunakan sebagai sistem pendukung keputusan untuk skrining awal Diabetes Mellitus.
References
Allorerung, P. P., Erna, A., & Bagussahrir, M. (2024). Analisis Performa Normalisasi Data untuk Klasifikasi K-Nearest Neighbor pada Dataset Penyakit. 9(3), 178–191. https://doi.org/10.14421/jiska.2024.9.3.178-191
Kaggle. (2021). Pima Indians Diabetes Database. Kaggle. https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database
Noori, N. A., & Yassin, A. A. (2021). A Comparative Analysis for Diabetic Prediction Based on Machine Learning Techniques. 1(1), 180–190.
Oktaviana, A., Wijaya, D. P., Pramuntadi, A., & Heksaputra, D. (2024). Prediction of Type 2 Diabetes Mellitus Using The K-Nearest Neighbor ( K-NN ) Algorithm Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor ( K-NN ). 4(July), 812–818. https://doi.org/10.57152/malcom.v4i3.1268
Prasetyo, A. B., & Laksana, T. G. (2022). Optimasi Algoritma K-Nearest Neighbors dengan Teknik Cross Validation Dengan Streamlit ( Studi Data : Penyakit Diabetes ). 6(2), 194–204. https://doi.org/10.30871/jaic.v6i2.4182
Pratiwi, I. (2021). Analisis Performa Metode K- Nearest Neighbor ( KNN ) dan Crossvalidation pada Data Penyakit Cardiovascular. 2(1), 21–28. https://doi.org/10.33096/ijodas.v2i1.25
Sholeh, M., Andayanti, D., & Rachmawati, Y. (n.d.). DATA MINING MODEL KLASIFIKASI MENGGUNAKAN K-NEAREST NEIGHBOR WITH NORMALIZATION FOR DIABETES PREDICTION. 77–87. https://doi.org/10.36342/teika.v12i02.2911
Tembusai, Z. R., Mawengkang, H., Zarlis, M., Info, A., & Process, A. H. (2021). K-Nearest Neighbor with K-Fold Cross Validation and Analytic Hierarchy Process on Data Classification. 2(1), 1–8. https://doi.org/10.25008/ijadis.v2i1.1204
Wijayanti, D., Hermawan, A., Avianto, D., Informasi, M. T., Yogyakarta, U. T., Sakit, R., & Daerah, U. (2024). PENERAPAN ALGORITMA K-NEAREST NEIGHBOR UNTUK DETEKSI DINI STATUS GIZI PASIEN DEWASA. 10(2). https://doi.org/10.31961/positif.v10i2.2255
World Health Organization. (2021). Diabetes. World Health Organization. https://www.who.int/news-room/fact-sheets/detail/diabetes%0A
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Amelia Laura Ardianti, Hasbi Firmansyah, Wahyu Asriani, Ria Indah Fitria

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.










