Klasifikasi Risiko Strok Menggunakan Algoritma Random Forest dengan Teknik Knowledge Discovery in Database
DOI:
https://doi.org/10.31294/5tbkg781Keywords:
Stroke, Random Forest, Knowledge Discovery in Database, PredictionAbstract
Strok merupakan suatu kondisi ketika aliran darah ke otak mengalami gangguan, yang dapat menyebabkan kerusakan otak bahkan kematian. Strok juga merupakan penyebab utama kematian dan kecacatan yang terjadi pada seluruh dunia. Dengan tingkat kecelakaan yang tinggi, deteksi dini strok sangat diperlukan untuk mengurangi risiko strok. Penelitian ini bertujuan untuk mengklasifikasi risiko strok berdasarkan algoritma Random Forest dengan melalui pendekatan Knowledge Discovery in Database (KDD). Dataset yang digunakan merupakan dataset dari platform Kaggle yang terdiri dari 35.000 data pasien dengan 18 atribut relevan yang telah melalui proses pembersihan dan fitur pemilihan untuk mencapai akurasi prediksi yang optimal. Model training dilakukan dengan membagi data sebesar 80% data training dan 20% data testing. Hasil dari evaluasi mengunakan confusion matrixnya menunjukkan bahwa Algoritma Random Forest memiliki akurasi sebesar 87,47% dengan precision pada kelas 1 sebesar 96,40% dan recall sebesar 68,53%, serta precision pada kelas 0 sebesar 84,51% dan recall sebesar 98,51%. Namun, tantangan utama dalam penelitian ini adalah ketidakseimbangan data, yang mempengaruhi kemampuan model dalam mengenali kasus strok secara merata. Penelitian selanjutnya dianjurkan untuk menerapkan teknik penyeimbangan data serta menggabungkan Random Forest dengan algoritma lain guna meningkatkan akurasi dan keandalan prediksi.
References
Alghifari, F., & Juardi, D. (2021). Penerapan Data Mining Pada Penjualan Makanan Dan Minuman Menggunakan Metode Algoritma Naïve Bayes. Jurnal Ilmiah Informatika (JIF), 9(2).
Aulia, Y., Andriyansyah, A., Suharjito, S., & Nensi, S. W. (2024). Analisis Prediksi Stroke dengan Membandingkan Tiga Metode Klasifikasi Decision Tree, Naïve Bayes, dan Random Forest. Jurnal Ilmu Komputer Dan Informatika, 3(2), 89–98. https://doi.org/10.54082/jiki.90
Azhar, Y., Firdausy, A. K., & Amelia, P. J. (2022). Perbandingan Algoritma Klasifikasi Data Mining Untuk Prediksi Penyakit Stroke. Science and Information Technology SINTECH Journal, 5(2), 191–197.
Buani, D. C. P. (2024). Deteksi Dini Penyakit Diabetes dengan Menggunakan Algoritma Random Forest. Evolusi: Jurnal Sains Dan Manajemen, 12(1).
Dewi, L., & Fitraneti, E. (2024). Stroke Iskemik. Scientific Journal, 3(6), 379.
Feigin, V. L., Brainin, M., Norrving, B., Martins, S. O., Pandian, J., Lindsay, P., F Grupper, M., & Rautalin, I. (2025). World Stroke Organization: Global Stroke Fact Sheet 2025. International Journal of Stroke, 20(2), 132–144. https://doi.org/10.1177/17474930241308142 Hisni, D., Saputri, M. E., & Sujarni. (2022). Faktor - faktor yang Berhubungan dengan Kejadian Stroke Iskemik di Instalasi Fisioterapi Rumah Sakit Pluit Jakarta Utara Periode Tahun 2021. Jurnal Penelitian Keperawatan Kontemporer, 2(1), 140–149.
Kemenkes. (2024, October 25). Cegah Stroke dengan Aktivitas Fisik. Kementrian Kesehatan Republik Indonesia. https://kemkes.go.id/id/rilis-kesehatan/cegah-stroke-dengan-aktivitas-fisik
Maskuri, M. N., Harliana, Sukerti, K., & Bhakti, R. M. H. (2022). Penerapan Algoritma K-Nearest Neighbor (KNN) untuk Memprediksi Penyakit Stroke. Jurnal Ilmiah Intech : Information Technology Journal of UMUS, 4(1), 130–140.
Murdiansyah, D. T. (2024). Prediksi Stroke Menggunakan Extreme Gradient Boosting. JIKO (Jurnal Informatika Dan Komputer), 8(2), 419–426.
Naldy, E. T., & Andri. (2021). Penerapan Data Mining Untuk Analisis Daftar Pembelian Konsumen Dengan Menggunakan Algoritma Apriori Pada Transaksi Penjualan Toko Bangunan MDN. Jurnal Nasional Ilmu Komputer, 2(2), 89–101.
Rois, Moh. I. A., Dwilestari, G., & Suarna, N. (2025). PREDIKSI PERSETUJUAN PINJAMAN MENGGUNAKAN DATASET LOAN APPROVAL MENGGUNAKAN ALGORITMA KLASIFIKASI. JATI (Jurnal Mahasiswa Teknik Informatika), 9(1), 1342–1347.
Romadloni, P. L., Kusuma, B. A., & Baihaqi, W. M. (2022). Komparasi Metode Pembelajaran Mesin untuk Implementasi Pengambilan Keputusan dalam Menentukan Promosi Jabatan Karyawan. JATI (Jurnal Mahasiswa Teknik Informatika), 6(2), 622–628.
Salam, R. R., Jamil, M. F., Ibrahim, Y., Rahmaddeni, Soni, & Herianto. (2023). Sentiment Analysis of Cash Direct Assistance Distribution for Fuel Oil Using Support Vector Machine. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 3(1), 27–35.
Suci Amaliah, Nusrang, M., & Aswi, A. (2022). Penerapan Metode Random Forest Untuk Klasifikasi Varian Minuman Kopi di Kedai Kopi Konijiwa Bantaeng. VARIANSI: Journal of Statistics and Its Application on Teaching and Research, 4(3), 121–127. https://doi.org/10.35580/variansiunm31
Supoyo, A., & Prasetyaninrum, P. T. (2022). Analisis Data Mining Untuk Memprediksi Lama Perawatan Pasien Covid-19 Di DIY. Bianglala Infromatika, 10(1), 21–29.
Widiani, G. A. R., & Yasa, I. M. M. (2023). Korelasi Tingkat Pengetahuan Terhadap Kemampuan Deteksi Dini Gejala Stroke dengan Sikap Keluarga Terhadap Penanganan Pre Hospital. Bina Generasi: Jurnal Kesehatan, 2(14), 25–30.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Deni Athallah, Fathoni Fathoni, Muhammad Ichsan Farrel Rachmad

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.








