Penerapan Kerangka CRISP-DM dalam Evaluasi Performa Logistic Regression dan Decision Tree untuk Prediksi Kelulusan Mahasiswa

Authors

  • Tifanny Nabarian Sekolah Tinggi Teknologi Terpadu Nurul Fikri
  • Imelda Wahyuni Sekolah Tinggi Teknologi Terpadu Nurul Fikri
  • Salman El Farisi Sekolah Tinggi Teknologi Terpadu Nurul Fikri

DOI:

https://doi.org/10.31294/ijcs.v5i1.12502

Keywords:

Machine Learning, Logistic Regression, Decision Tree, Prediksi Kelulusan Mahasiswa

Abstract

Ketepatan waktu kelulusan mahasiswa sering digunakan sebagai salah satu indikator dalam menilai efektivitas penyelenggaraan pendidikan di perguruan tinggi. Pemanfaatan data akademik melalui pendekatan machine learning dapat membantu mengidentifikasi mahasiswa yang berpotensi mengalami keterlambatan kelulusan secara lebih terukur. Penelitian ini bertujuan untuk membandingkan kinerja algoritma Logistic Regression dan Decision Tree dalam memprediksi kelulusan mahasiswa berdasarkan faktor akademik. Dataset yang digunakan terdiri dari 351 mahasiswa Program Studi Teknik Informatika di STT Terpadu Nurul Fikri, angkatan 2021, dengan variabel input Indeks Prestasi Kumulatif (IPK) serta Indeks Prestasi Semester (IPS) untuk setiap semester. Penelitian ini menggunakan metodologi CRISP-DM dengan pembagian data pelatihan serta pengujian 80:20. Evaluasi model dilakukan menggunakan confusion matrix dengan metrik accuracy, precision, recall, serta F1-score. Hasil pengujian menunjukkan bahwa Logistic Regression memperoleh accuracy 92,96%, precision 90,91%, recall 97,56%, dan F1-score 94,12%, sedangkan Decision Tree memperoleh accuracy 88,73%, precision 88,37%, recall 92,68%, serta F1-score 90,48%. Hasil tersebut menunjukkan bahwa Logistic Regression menunjukkan performa yang lebih optimal dan lebih sesuai dalam memodelkan hubungan antara variabel akademik dan ketepatan kelulusan mahasiswa. Sebagai kontribusi utama, penelitian ini mengintegrasikan model Logistic Regression terbaik ke dalam purwarupa sistem deteksi dini (early warning system) berbasis web menggunakan Streamlit. Pendekatan ini memberikan keunggulan praktis bagi pemangku kepentingan program studi untuk memitigasi risiko keterlambatan kelulusan secara real-time dan mendukung pengambilan keputusan intervensi akademik yang sepenuhnya digerakkan oleh data (data-drive decision making).

References

Adnyana, I. M. B. (2021). Penerapan Teknik Klasifikasi untuk Prediksi Kelulusan Mahasiswa Berdasarkan Nilai Akademik. JUTIK : Jurnal Teknologi Informasi dan Komputer, 7(3).

Al Faruq, U., Fauzi, M. A. N., Fatayasya, I., Daniati, E., & Ristyawan, A. (2023). Prediksi Data Kelulusan Mahasiswa Dengan Metode Decision Tree menggunakan Rapidminer. Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 7, 2549–7952. https://proceeding.unpkediri.ac.id/index.php/inotek/

Alfaris, S. (2022). Faktor Penghambat Keterlambatan Penyelesaian Studi Mahasiswa Prodi Pendidikan Teknik Mesin FKIP Undana. Haumenni Journal of Education, 2(2), 1–8.

Anugrawati, S. D., Nurhikma, Iyut Wahyu Saputri, & Khalilah Nurfadilah. (2023). Analisis Regresi Logistik Biner dalam Penentuan Faktor-Faktor yang Mempengaruhi Ketepatan Waktu Lulus Mahasiswa UIN Alauddin Makassar. Journal of Mathematics: Theory and Applications, 11–16. https://doi.org/10.31605/jomta.v5i1.2401

Arifin, M., Helmi, F., & Bagus Hikmawansyah, R. (2024). Analisis Metode dan Algoritma dalam Sistem Pendukung Keputusan untuk Memprediksi Kelulusan. Jurnal Advance Research Informatika, 3(1), 73–80. https://www.ejournalwiraraja.com/index.php/JARS

Azis, A. R. (2024). Analisis Komparasi Algoritma Machine Learning dalam Prediksi Performa Akademik Mahasiswa: Literature Review. Jurnal Ilmu Komputer dan Informatika, 4(2), 143–150. https://doi.org/10.54082/jiki.212

Dengen, C. N., Kusrini, K., & Luthfi, E. T. (2020). Implementasi Decision Tree Untuk Prediksi Kelulusan Mahasiswa Tepat Waktu. SISFOTENIKA, 10(1), 1. https://doi.org/10.30700/jst.v10i1.484

Mubarak, R., Hanafi, M., & Sasongko, D. (2024). Komparasi Performa Naive Bayes Gaussian dan K-NN Untuk Prediksi Kelulusan Mahasiswa dengan CRISP-DM. KLIK: Kajian Ilmiah Informatika dan Komputer, 4(6), 2982–2991. https://doi.org/10.30865/klik.v4i6.1924

Adnyana, I. M. B. (2021). Penerapan Teknik Klasifikasi untuk Prediksi Kelulusan Mahasiswa Berdasarkan Nilai Akademik. JUTIK : Jurnal Teknologi Informasi dan Komputer, 7(3).

Al Faruq, U., Fauzi, M. A. N., Fatayasya, I., Daniati, E., & Ristyawan, A. (2023). Prediksi Data Kelulusan Mahasiswa Dengan Metode Decision Tree menggunakan Rapidminer. Prosiding SEMNAS INOTEK (Seminar Nasional Inovasi Teknologi), 7, 2549–7952. https://proceeding.unpkediri.ac.id/index.php/inotek/

Alfaris, S. (2022). Faktor Penghambat Keterlambatan Penyelesaian Studi Mahasiswa Prodi Pendidikan Teknik Mesin FKIP Undana. Haumenni Journal of Education, 2(2), 1–8.

Anugrawati, S. D., Nurhikma, Saputri, I. W., & Nurfadilah, K. (2023). Analisis Regresi Logistik Biner dalam Penentuan Faktor-Faktor yang Mempengaruhi Ketepatan Waktu Lulus Mahasiswa UIN Alauddin Makassar. Journal of Mathematics: Theory and Applications, 5(1), 11–16. https://doi.org/10.31605/jomta.v5i1.2401

Arifin, M., Helmi, F., & Hikmawansyah, R. Bagus. (2024). Analisis Metode dan Algoritma dalam Sistem Pendukung Keputusan untuk Memprediksi Kelulusan. Jurnal Advance Research Informatika, 3(1), 73–80. https://www.ejournalwiraraja.com/index.php/JARS

Azis, A. R. (2024). Analisis Komparasi Algoritma Machine Learning dalam Prediksi Performa Akademik Mahasiswa: Literature Review. Jurnal Ilmu Komputer dan Informatika (JIKI), 4(2), 143–150. https://doi.org/10.54082/jiki.212

Dengen, C. N., Kusrini, & Luthfi, E. T. (2020). Implementasi Decision Tree Untuk Prediksi Kelulusan Mahasiswa Tepat Waktu. Jurnal Sisfotenika, 10(1), 1. https://doi.org/10.30700/jst.v10i1.484

Mubarak, R., Hanafi, M., & Sasongko, D. (2024). Komparasi Performa Naive Bayes Gaussian dan K-NN Untuk Prediksi Kelulusan Mahasiswa dengan CRISP-DM. KLIK: Kajian Ilmiah Informatika dan Komputer, 4(6), 2982–2991. https://doi.org/10.30865/klik.v4i6.1924

Nugroho, D. R., Idris, N., Kurniawan, K., Fitrianah, D., Irwansyah, E., & Kusuma, G. P. (2023). Logistic Regression and Random Forest Comparison in Predicting Students’ Qualification Based on Students’ Half-Semester Performance. International Conference on Information and Communication Technology, ICoICT, 2023-August, 214–219. https://doi.org/10.1109/ICoICT58202.2023.10262783

Nurmalitasari, & Purwanto, E. (2022). Prediksi Performa Mahasiswa Menggunakan Model Regresi Logistik. Jurnal Derivat, 9(2).

Pelima, L. R., Sukmana, Y., & Rosmansyah, Y. (2024). Predicting University Student Graduation Using Academic Performance and Machine Learning: A Systematic Literature Review. IEEE Access, 1(1), 99. https://doi.org/10.1109/ACCESS.2024.3361479

Rahayu, D. W. Y., Umam, K., & Handayani, M. R. (2025). Performance of Machine Learning Algorithms on Imbalanced Sentiment Datasets Without Balancing Techniques. Journal of Applied Informatics and Computing (JAIC), 9(3), 998–1005. http://jurnal.polibatam.ac.id/index.php/JAIC

Rianti, A., Majid, N. W. A., & Fauzi, A. (2023). CRISP-DM: Metodologi Proyek Data Science. Prosiding Seminar Nasional Teknologi Informasi dan Bisnis (SENATIB).

Ridwan, Hermaliani, E. H., & Ernawati, M. (2024). Penerapan Metode SMOTE Untuk Mengatasi Imbalanced Data Pada Klasifikasi Ujaran Kebencian. Computer Science (CO-SCIENCE), 4(1). http://jurnal.bsi.ac.id/index.php/co-science

Setiono, S. A., & Purwanto, E. (2025). Prediksi Kelulusan Mahasiswa Menggunakan Algoritma Decision Tree. Seminar Nasional Teknologi Informasi dan Bisnis (SENATIB).

Sihotang, S. F. (2023). Analisis Regresi Logistik Biner untuk Memprediksi Probabilitas Kelulusan Ujian Akhir Semester Mahasiswa yang Mengambil Mata Kuliah Matematika Farmasi. Journal of Mathematics Education and Science, 8(2). https://jurnal.uisu.ac.id/index.php/mesuisu

Suyanto, R. V. A., Rusdianto, E., & Ernawati. (2024). Penerapan Algoritma Decision Tree C4.5 dan Metode AdaBoost Untuk Prediksi Kelulusan Mahasiswa. Jurnal Informatika Atma Jogja, 5(1), 75–86.

Syahranita, R., Suhartono, & Zaman, S. (2023). Regresi Logistik Multinomial untuk Prediksi Kategori Kelulusan Mahasiswa. Jurnal Informatika Sunan Kalijaga (JISKA), 8(2), 102–111.

Yatimah, M. N. (2021). Implementasi Data Mining untuk Prediksi Kelulusan Tepat Waktu Mahasiswa STIMIK ESQ Menggunakan Decision Tree C4.5. JUMANJI, 5(2), 89–98.

Yuliaty, T., & Pawitan, G. (2025). Developing a Predictive System for On-Time Graduation Using Logistic Regression. MALCOM: Indonesian Journal of Machine Learning and Computer Science, 5(4), 1253–1265. https://doi.org/10.57152/malcom.v5i4.2142

Downloads

Published

2026-04-29

Issue

Section

Articles

How to Cite

Penerapan Kerangka CRISP-DM dalam Evaluasi Performa Logistic Regression dan Decision Tree untuk Prediksi Kelulusan Mahasiswa. (2026). Indonesian Journal Computer Science, 5(1), 46-55. https://doi.org/10.31294/ijcs.v5i1.12502