Optimasi Parameter dan Pemilihan Fitur Model K-Nearest Neighbor Menggunakan Algoritma Genetika pada Dataset Diabetes

Authors

  • Ananda Irya Shakila Syukron Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Ririn Amelia Br Siregar Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Anwar Shaleh Lbn Gaol Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan
  • Adidtya Perdana Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Negeri Medan

Keywords:

Algoritma Genetika, K-Nearest Neighbor, Prediksi Diabetes

Abstract

Diabetes mellitus merupakan penyakit kronis dengan prevalensi yang terus meningkat sehingga deteksi dini sangat diperlukan untuk mencegah risiko komplikasi. Machine learning menjadi salah satu pendekatan yang efektif dalam menganalisis data medis, dan algoritma K-Nearest Neighbor (KNN) sering digunakan karena sifatnya yang sederhana namun akurat. Meski demikian, performa KNN sangat dipengaruhi oleh pemilihan parameter dan fitur yang relevan. Penelitian ini bertujuan mengoptimalkan model KNN menggunakan Algoritma Genetika (GA) untuk melakukan optimasi nilai k sekaligus seleksi fitur pada dataset Pima Indians Diabetes. Proses penelitian meliputi praproses data, normalisasi, pembagian data latih dan uji, pembangunan model dasar KNN, serta penerapan GA yang melibatkan tahapan seleksi, evaluasi fitness dengan akurasi cross-validation, crossover, dan mutasi. Model KNN awal memperoleh akurasi sebesar 68,83%, namun setelah dilakukan optimasi menggunakan GA, akurasi meningkat menjadi 82,47%. Hasil optimasi menunjukkan bahwa nilai k terbaik adalah 16, dengan lima fitur paling relevan yaitu Pregnancies, Glucose, BloodPressure, BMI, dan DiabetesPedigreeFunction. Temuan ini menunjukkan peningkatan signifikan pada kemampuan model dalam mengidentifikasi kasus diabetes positif, ditunjukkan melalui kenaikan nilai recall dan f1-score. Secara keseluruhan, penelitian ini membuktikan bahwa integrasi GA pada KNN mampu meningkatkan akurasi dan efisiensi model, serta menjadi pendekatan yang menjanjikan dalam sistem klasifikasi medis.

 

References

Kaliappan, J., Kumar, I. J. S., Sundaravelan, S., Anesh, T., Rithik, R. R., Singh, Y., & Vera-garcia, D. V. (n.d.). Analyzing classification and feature selection strategies for diabetes prediction across diverse diabetes datasets.

Kangra, K., & Singh, J. (2024). A genetic algorithm-based feature selection approach for diabetes prediction. 13(2), 1489–1498. https://doi.org/10.11591/ijai.v13.i2.pp1489-1498

Murad, S. H., Bahjat, N., Mahmood, N. H., & Arman, L. (2025). MethodsX Hybrid genetic algorithms-driven optimization of machine learning models for heart disease prediction. MethodsX, 15(July), 103510. https://doi.org/10.1016/j.mex.2025.103510

Sirmayati, Pulung Hendro Prastyo, M. (2025). Enhancing diabetes prediction performance using feature selection based on grey wolf optimizer with autophagy mechanism. Computer Methods and Programs in Biomedicine Update, 8(July), 100207. https://doi.org/10.1016/j.cmpbup.2025.100207

Downloads

Published

2025-12-06