Penerapan Model Klasifikasi Biner Menggunakan Regresi Logistik pada Dataset Kismis

Authors

  • Armand Cahya Nugraha Universitas Pancasakti Tegal
  • Hasbi Firmansyah Universitas Pancasakti Tegal
  • Wahyu Asriyani Universitas Pancasakti Tegal
  • Riski Prasetyo Tulodo Universitas Pancasakti Tegal

Keywords:

Data Mining, Feature Extraction, Klasifikasi Kismis

Abstract

Dalam sektor pertanian presisi, penggunaan teknologi visi komputer menjadi solusi penting untuk menggantikan cara inspeksi manual. Penelitian ini fokus pada masalah pengelompokan varietas kismis Kecimen dan Besni yang sering tercampur karena kesamaan morfologi. Tujuan utama dari penelitian ini adalah untuk mengevaluasi seberapa efektif algoritma Logistic Regression dalam memprediksi jenis kismis

serta menganalisis dampak fitur bentuk terhadap ketepatan klasifikasi. Dataset yang digunakan adalah Raisin Dataset yang berisi 900 contoh data. Proses pra-pemrosesan data mencakup normalisasi fitur dan penetapan peran atribut menggunakan perangkat lunak data mining RapidMiner. Tujuh fitur morfologis yang diambil dari gambar digital berfungsi sebagai variabel independen, yaitu luas area, keliling, panjang sumbu utama dan minor, eksentrisitas, luas cembung, dan jangkauan. Untuk evaluasi model, metode yang digunakan adalah Split Data dengan rasio 70:30, di mana 630 data dipakai untuk melatih model dan 270 data disiapkan untuk menguji kinerja. Hasil dari eksperimen menunjukkan bahwa model Logistic Regression mendapatkan akurasi keseluruhan sebesar 84,07%. Penilaian lebih lanjut dengan menggunakan Confusion Matrix mengungkapkan nilai Precision dan Recall yang seimbang di atas 80% untuk kedua kelas, yang menunjukkan bahwa model tidak menunjukkan bias yang signifikan terhadap salah satu dari varietas tersebut. Meskipun terdapat tingkat kesalahan klasifikasi sebesar 15,93%, angka tersebut masih bisa diterima mengingat kerumitan kesamaan biologis antar varietas. Hasil ini mendukung bahwa Logistic Regression, sebagai metode linear yang efisien secara komputasi, cukup kuat untuk digunakan dalam sistem penyortiran real-time dibandingkan dengan metode yang lebih kompleks dan lambat.

References

Altuntaş, Y., Cömert, Z., & Kocamaz, A. F. (2019). Identification of haploid and diploid maize seeds using convolutional neural networks and a transfer learning approach. Computers and Electronics in Agriculture, 163, 104874. https://doi.org/10.1016/J.COMPAG.2019.104874

Ayikpa, K. J., Gouton, P., Mamadou, D., & Ballo, A. B. (2024). Classification of Cocoa Beans by Analyzing Spectral Measurements Using Machine Learning and Genetic Algorithm. Journal of Imaging, 10(1). https://doi.org/10.3390/jimaging10010019

ÇINAR, İ., KOKLU, M., & TAŞDEMİR, Ş. (2020). Kuru Üzüm Tanelerinin Makine Görüşü ve Yapay Zeka Yöntemleri Kullanılarak Sınıflandırılması. Gazi Journal of Engineering Sciences, 6(3), 200–209. https://doi.org/10.30855/gmbd.2020.03.03

Dreiseitl, S., & Ohno-Machado, L. (2002). Logistic regression and artificial neural network classification models: a methodology review. Journal of Biomedical Informatics, 35(5–6), 352–359. https://doi.org/10.1016/S1532-0464(03)00034-0

Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861–874. https://doi.org/10.1016/J.PATREC.2005.10.010

Kohavi, R. (1995). A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. IJCAI International Joint Conference on Artificial Intelligence, 2, 1137–1143.

Ritthoff, O., Klinkenberg, R., Fischer, S., Mierswa, I., & Felske, S. (2001). Yale: Yet Another Machine Learning Environment. LLWA 01 -- Tagungsband Der GI-Workshop-Woche Lernen -- Lehren -- Wissen -- Adaptivit�t Number Nr. 763 in Series Forschungsberichte Des Fachbereichs Informatik, Universit�t Dortmund, 84–92.

Sadique, K. M., Rahmani, R., & Johannesson, P. (2018). Towards Security on Internet of Things: Applications and Challenges in Technology. Procedia Computer Science, 141, 199–206. https://doi.org/10.1016/J.PROCS.2018.10.168

Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/10.1016/J.IPM.2009.03.002

Wu, X., Kumar, V., Ross Quinlan, J., Ghosh, J., Yang, Q., Motoda, H., McLachlan, G. J., Ng, A., Liu, B., Yu, P. S., Zhou, Z.-H., Steinbach, M., Hand, D. J., & Steinberg, D. (2008). Top 10 algorithms in data mining. Knowledge and Information Systems, 14(1), 1–37. https://doi.org/10.1007/s10115-007-0114-2

Downloads

Published

2025-12-25