Analisis Performa Logistic Regression, Naïve Bayes, dan Random Forest sebagai Algoritma Pendeteksi Kanker Payudara
DOI:
https://doi.org/10.23887/insert.v4i1.62362Keywords:
Breast Cancer, Logistics Regression, Naïve Bayes, Random ForestAbstract
Kanker payudara merupakan jenis penyakit kronis yang sampai saat ini masih diragukan terkait upaya penyembuhan total penyakit ini, selain itu juga memerlukan waktu pengobatan yang lama dan juga biaya yang cukup tinggi. Faktor penyebab dari kanker payudara sendiri hingga kini masih belum diketahui secara spesifik, namun dapat dicermati bahwa penyebab penyakit ini bersifat multifaktorial yang saling mempengaruhi satu dengan lainnya, seperti: faktor lingkungan, genetika, virus, pola makanan, dan juga radiasi di daerah dada. Tujuan penelitian ini adalah untuk mengetahui metode mana yang memiliki akurasi tertinggi dalam prediksi kanker payudara di Coimbra, dengan metode Logistics Regression, Naïve Bayes, atau Random Forest. Penelitian ini diharapkan mampu membantu masyarakat dan tenaga medis dalam deteksi dini penyakit kanker payudara. Berdasarkan pengujian yang dilakukan menggunakan algoritma Logistics Regressiondidapatkan nilai akurasi sebesar 80%, pada algoritma Naïve Bayes mendapatkan nilai sebesar 75%, dan terakhir dengan algoritma Random Forest didapatkan nilai sebesar 75%. Dari pengujian tersebut dapat disimpulkan bahwa algoritma Logistics Regression terbukti memiliki tingkat akurasi yang paling baik dalam hal prediksi penyakit kanker payudara dibandingkan dengan kedua algoritma lainnyaReferences
Acuna, E., & Rodriguez, C. (n.d.). The Treatment of Missing Values and its Effect on Classifier Accuracy. 1995.
Ajeng Wijayanti, L., Bambang Hidayat, D., Suhardjo, D., & SpRKG, M. (2017). PENGOLAHAN CITRA RADIOGRAF PERIAPIKAL PADA DETEKSI PENYAKIT GRANULOMA MENGGUNAKAN METODE DISCRETE WAVELET TRANSFORM & PRINCIPAL COMPONENT ANALYSIS BERBASIS ANDROID Image Processing of Periapical Radiograph on Granuloma Desease Detection Using Discrete Wav. 4(2), 547–553.
Alita, D., Priyanta, S., & Rokhman, N. (2019). Analysis of Emoticon and Sarcasm Effect on Sentiment Analysis of Indonesian Language on Twitter. 5(2), 100–109.
Bustami. (2013). PENERAPAN ALGORITMA NAIVE BAYES UNTUK MENGKLASIFIKASI DATA NASABAH. TECHSI: Jurnal Penelitian Teknik Informatika.
Dinh, V. T., Luu, N. D., & Trinh, H. H. (2016). Vehicle classification and detection based coarse data for warning traffic jam in VietNam. NICS 2016 - Proceedings of 2016 3rd National Foundation for Science and Technology Development Conference on Information and Computer Science, 223–228. https://doi.org/10.1109/NICS.2016.7725654
Goel, V. (2018). Building a Simple Machine Learning Model on Breast Cancer Data. https://towardsdatascience.com/building-a-simple-machine-learning-model-on-breast-cancer-data-eca4b3b99fa3
Goldenberg, R., & Punthakee, Z. (2013). Definition, Classification and Diagnosis of Diabetes, Prediabetes and Metabolic Syndrome. Canadian Journal of Diabetes, 37(SUPPL.1), 8–11. https://doi.org/10.1016/j.jcjd.2013.01.011
Harimurti, F. A. (2017). METODE NAÏVE BAYES CLASSIFIER UNIVERSITAS TRUNOJOYO MADURA ) MENGGUNAKAN ( STUDI KASUS SCHOLARSHIP RECEPTION CLASSIFICATION USING NAÏVE BAYES CLASSIFIER METHOD ( CASE STUDY UNIVERSITAS TRUNOJOYO MADURA ).
Kementerian Kesehatan Republik Indonesia. (2022). Kanker Payudara Paling Banyak di Indonesia, Kemenkes Targetkan Pemerataan Layanan Kesehatan. https://www.kemkes.go.id/article/view/22020400002/kanker-payudara-paling-banyak-di-indonesia-kemenkes-targetkan-pemerataan-layanan-kesehatan.html
Kulkarni, V. Y., & Sinha, P. K. (2014). Effective Learning and Classification using Random Forest Algorithm. 3(11), 267–273.
Kumar, M., Singhal, S., Shekhar, S., & Sharma, B. (2022). Optimized Stacking Ensemble Learning Model for Breast Cancer Detection and Classification Using Machine Learning.
Mulyo, A., Yanathifal, W., Anggraeni, S., Anwar, N., Ichwani, A., & Anggara, B. (2013). Performansi K-NN , J48 , Naive Bayes dan Regresi Logistik Sebagai Algoritma Pengklasifikasi Diabetes. 2007.
Network, E. (2022). Retracted : Application of Feature Selection Based on Elastic Network and Random Forest in the Evaluation of Sports Effects. 2022.
Permanasari, A. E., Nurlayli, A., & Description, A. D. (2017). Decision Tree to Analyze the Cardiotocogram Data for Fetal Distress Determination. 459–463.
Qin, Y., Zhang, S., Zhu, X., Zhang, J., & Zhang, C. (2007). Semi-parametric optimization for missing data imputation. 79–88. https://doi.org/10.1007/s10489-006-0032-0
Ramli, Yuniarti, D., & Goejantoro, R. (2013). Comparison of Classification Methods Between Logistic Regression and Artificial Neural Network (Case Study: Selection of Language and Social Studies Depertement at SMAN 2 Samarinda academic year 2011/2012). 4, 17–24.
Sadewo, M. G., Windarto, A. P., & Hartama, D. (2016). PENERAPAN DATAMINING PADA POPULASI DAGING AYAM RAS PEDAGING DI INDONESIA BERDASARKAN PROVINSI MENGGUNAKAN K-MEANS. 60–67.
Sandeep, D., & Bethel, G. N. B. (2021). A Survey on Accurate Breast Cancer Detection and Classification using Machine Learning Approach.
Shah, S. A. A., Aziz, W., Arif, M., & Nadeem, M. S. A. (2016). Decision Trees Based Classification of Cardiotocograms Using Bagging Approach. Proceedings - 2015 13th International Conference on Frontiers of Information Technology, FIT 2015, 12–17. https://doi.org/10.1109/FIT.2015.14
The American Cancer Society medical and editorial content team. (2022). American Cancer Society Recommendations for the Early Detection of Breast Cancer. https://www.cancer.org/cancer/breast-cancer/screening-tests-and-early-detection/american-cancer-society-recommendations-for-the-early-detection-of-breast-cancer.html#:~:text=at any age.-,Mammograms,years before physical symptoms develop.
WHO. (2021). Breast cancer. https://www.who.int/news-room/fact-sheets/detail/breast-cancer
Downloads
Published
Issue
Section
License
Copyright (c) 2023 Cecep Wahyu Cahyana, Akhsin Nurlayli
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
INSERT is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.