Optimasi Parameter dan Pemilihan Fitur Model K-Nearest Neighbor Menggunakan Algoritma Genetika pada Dataset Diabetes
Keywords:
Algoritma Genetika, K-Nearest Neighbor, Prediksi DiabetesAbstract
Diabetes mellitus merupakan penyakit kronis dengan prevalensi yang terus meningkat sehingga deteksi dini sangat diperlukan untuk mencegah risiko komplikasi. Machine learning menjadi salah satu pendekatan yang efektif dalam menganalisis data medis, dan algoritma K-Nearest Neighbor (KNN) sering digunakan karena sifatnya yang sederhana namun akurat. Meski demikian, performa KNN sangat dipengaruhi oleh pemilihan parameter dan fitur yang relevan. Penelitian ini bertujuan mengoptimalkan model KNN menggunakan Algoritma Genetika (GA) untuk melakukan optimasi nilai k sekaligus seleksi fitur pada dataset Pima Indians Diabetes. Proses penelitian meliputi praproses data, normalisasi, pembagian data latih dan uji, pembangunan model dasar KNN, serta penerapan GA yang melibatkan tahapan seleksi, evaluasi fitness dengan akurasi cross-validation, crossover, dan mutasi. Model KNN awal memperoleh akurasi sebesar 68,83%, namun setelah dilakukan optimasi menggunakan GA, akurasi meningkat menjadi 82,47%. Hasil optimasi menunjukkan bahwa nilai k terbaik adalah 16, dengan lima fitur paling relevan yaitu Pregnancies, Glucose, BloodPressure, BMI, dan DiabetesPedigreeFunction. Temuan ini menunjukkan peningkatan signifikan pada kemampuan model dalam mengidentifikasi kasus diabetes positif, ditunjukkan melalui kenaikan nilai recall dan f1-score. Secara keseluruhan, penelitian ini membuktikan bahwa integrasi GA pada KNN mampu meningkatkan akurasi dan efisiensi model, serta menjadi pendekatan yang menjanjikan dalam sistem klasifikasi medis.
References
Kaliappan, J., Kumar, I. J. S., Sundaravelan, S., Anesh, T., Rithik, R. R., Singh, Y., & Vera-garcia, D. V. (n.d.). Analyzing classification and feature selection strategies for diabetes prediction across diverse diabetes datasets.
Kangra, K., & Singh, J. (2024). A genetic algorithm-based feature selection approach for diabetes prediction. 13(2), 1489–1498. https://doi.org/10.11591/ijai.v13.i2.pp1489-1498
Murad, S. H., Bahjat, N., Mahmood, N. H., & Arman, L. (2025). MethodsX Hybrid genetic algorithms-driven optimization of machine learning models for heart disease prediction. MethodsX, 15(July), 103510. https://doi.org/10.1016/j.mex.2025.103510
Sirmayati, Pulung Hendro Prastyo, M. (2025). Enhancing diabetes prediction performance using feature selection based on grey wolf optimizer with autophagy mechanism. Computer Methods and Programs in Biomedicine Update, 8(July), 100207. https://doi.org/10.1016/j.cmpbup.2025.100207
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Ananda Irya Shakila Syukron, Ririn Amelia Br Siregar, Anwar Shaleh Lbn Gaol, Adidtya Perdana

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.










