Penerapan Model Klasifikasi Biner Menggunakan Regresi Logistik pada Dataset Kismis
Keywords:
Data Mining, Feature Extraction, Klasifikasi KismisAbstract
Dalam sektor pertanian presisi, penggunaan teknologi visi komputer menjadi solusi penting untuk menggantikan cara inspeksi manual. Penelitian ini fokus pada masalah pengelompokan varietas kismis Kecimen dan Besni yang sering tercampur karena kesamaan morfologi. Tujuan utama dari penelitian ini adalah untuk mengevaluasi seberapa efektif algoritma Logistic Regression dalam memprediksi jenis kismis
serta menganalisis dampak fitur bentuk terhadap ketepatan klasifikasi. Dataset yang digunakan adalah Raisin Dataset yang berisi 900 contoh data. Proses pra-pemrosesan data mencakup normalisasi fitur dan penetapan peran atribut menggunakan perangkat lunak data mining RapidMiner. Tujuh fitur morfologis yang diambil dari gambar digital berfungsi sebagai variabel independen, yaitu luas area, keliling, panjang sumbu utama dan minor, eksentrisitas, luas cembung, dan jangkauan. Untuk evaluasi model, metode yang digunakan adalah Split Data dengan rasio 70:30, di mana 630 data dipakai untuk melatih model dan 270 data disiapkan untuk menguji kinerja. Hasil dari eksperimen menunjukkan bahwa model Logistic Regression mendapatkan akurasi keseluruhan sebesar 84,07%. Penilaian lebih lanjut dengan menggunakan Confusion Matrix mengungkapkan nilai Precision dan Recall yang seimbang di atas 80% untuk kedua kelas, yang menunjukkan bahwa model tidak menunjukkan bias yang signifikan terhadap salah satu dari varietas tersebut. Meskipun terdapat tingkat kesalahan klasifikasi sebesar 15,93%, angka tersebut masih bisa diterima mengingat kerumitan kesamaan biologis antar varietas. Hasil ini mendukung bahwa Logistic Regression, sebagai metode linear yang efisien secara komputasi, cukup kuat untuk digunakan dalam sistem penyortiran real-time dibandingkan dengan metode yang lebih kompleks dan lambat.
References
Altuntaş, Y., Cömert, Z., & Kocamaz, A. F. (2019). Identification of haploid and diploid maize seeds using convolutional neural networks and a transfer learning approach. Computers and Electronics in Agriculture, 163, 104874. https://doi.org/10.1016/J.COMPAG.2019.104874
Ayikpa, K. J., Gouton, P., Mamadou, D., & Ballo, A. B. (2024). Classification of Cocoa Beans by Analyzing Spectral Measurements Using Machine Learning and Genetic Algorithm. Journal of Imaging, 10(1). https://doi.org/10.3390/jimaging10010019
ÇINAR, İ., KOKLU, M., & TAŞDEMİR, Ş. (2020). Kuru Üzüm Tanelerinin Makine Görüşü ve Yapay Zeka Yöntemleri Kullanılarak Sınıflandırılması. Gazi Journal of Engineering Sciences, 6(3), 200–209. https://doi.org/10.30855/gmbd.2020.03.03
Dreiseitl, S., & Ohno-Machado, L. (2002). Logistic regression and artificial neural network classification models: a methodology review. Journal of Biomedical Informatics, 35(5–6), 352–359. https://doi.org/10.1016/S1532-0464(03)00034-0
Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861–874. https://doi.org/10.1016/J.PATREC.2005.10.010
Kohavi, R. (1995). A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. IJCAI International Joint Conference on Artificial Intelligence, 2, 1137–1143.
Ritthoff, O., Klinkenberg, R., Fischer, S., Mierswa, I., & Felske, S. (2001). Yale: Yet Another Machine Learning Environment. LLWA 01 -- Tagungsband Der GI-Workshop-Woche Lernen -- Lehren -- Wissen -- Adaptivit�t Number Nr. 763 in Series Forschungsberichte Des Fachbereichs Informatik, Universit�t Dortmund, 84–92.
Sadique, K. M., Rahmani, R., & Johannesson, P. (2018). Towards Security on Internet of Things: Applications and Challenges in Technology. Procedia Computer Science, 141, 199–206. https://doi.org/10.1016/J.PROCS.2018.10.168
Sokolova, M., & Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4), 427–437. https://doi.org/10.1016/J.IPM.2009.03.002
Wu, X., Kumar, V., Ross Quinlan, J., Ghosh, J., Yang, Q., Motoda, H., McLachlan, G. J., Ng, A., Liu, B., Yu, P. S., Zhou, Z.-H., Steinbach, M., Hand, D. J., & Steinberg, D. (2008). Top 10 algorithms in data mining. Knowledge and Information Systems, 14(1), 1–37. https://doi.org/10.1007/s10115-007-0114-2
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Armand Cahya Nugraha, Hasbi Firmansyah, Wahyu Asriyani, Riski Prasetyo Tulodo

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.










