SISTEMASI: Jurnal Sistem Informasi ISSN:2302-8149 Volume 11, Nomor 3, September 2022: 567-577 e-ISSN:2540-9719 http://sistemasi.ftik.unisi.ac.id 567 Komparasi Penerapan Metode Bagging dan Adaboost pada Algoritma C4.5 untuk Prediksi Penyakit Stroke Comparison of Bagging and Adaboost Methods on C4.5 Algorithm for Stroke Prediction Nur Diana Saputri*, Khalid Khalid, Dwi Rolliawati Prodi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Islam Negeri Sunan Ampel Jl. Veteran 5D No.25 Kecamatan Kebomas, Kabupaten Gresik, Jawa Timur, Indonesia *e-mail: nurdianasaputrii@gmail.com (received: 27 Oktober 2021, revised: 16 November 2021, accepted: 5 Juli 2022) Abstrak Stroke merupakan penyakit tidak menular dan sangat berbahaya karena disebabkan oleh gangguan fungsional otak yang disebabkan oleh tersumbatnya aliran peredaran darah. Penyakit ini tergolong ke dalam cerebrovascular disease karena membutuhkan penanganan selama 24 jam, jika tidak ditangani secara cepat dapat menyebabkan kematian. Tujuan dari penelitian ini adalah untuk mengatasi masalah tersebut adalah membuat model prediksi berbasis machine learning untuk membantu ahli medis dalam menangani penyakit stroke untuk mengurangi risiko kematian. Metode yang diterapkan untuk penelitian ini adalah menerapkan metode klasifikasi algoritma C4.5 serta metode bagging dan Adaboost dari Ensemble Learning. Data stroke diolah menggunakan 2 tahap proses pengolahan data yaitu tahap data cleaning dan tahap transformasi data. Penelitian klasifikasi ini dilakukan perbandingan antara algoritma C4.5, metode bagging + algoritma C4.5 dan metode Adaboost + algortima C4.5 menggunakan metode confusion matrix, k-fold cross validation dan uji validasi berdasarkan nilai TP, TN, FP, FN, recall, precision, F1-Score dan akurasi. Hasil pengujian klasifikasi menggunakan Confusion Matrix dan k-fold cross validation untuk algoritma C4.5 menghasilkan akurasi sebesar 92.87%. Kemudian hasil akurasi dari algoritma C4.5 dengan metode bagging meningkat menjadi 95.02% dan ketika dikombinasikan dengan metode Adaboost nilai akurasinya juga meningkat menjadi 94.63%. Dari hasil akurasi tersebut dapat disimpulkan bahwa penggabungan algoritma pengklasifikasi tunggal yaitu algoritma C4.5 dengan metode bagging dan Adaboost terbukti dapat meningkatkan performa klasifikasi. Kata kunci: Klasifikasi, Dataset Stroke Disease, Decision Tree, Bagging, Adaboost Abstract Stroke is a non-communicable disease and is very dangerous because of functional disorders of the brain caused by blockage of blood circulation. This disease is classified as a cerebrovascular disease because it requires treatment for 24 hours, if not treated quickly it can cause death. The purpose of this research is to overcome this problem is to create a machine learning-based prediction model for medical experts in dealing with diseases to help reduce the risk of death. The method applied for this research is to apply the C4.5 algorithm classification method as well as the bagging and Adaboost methods from Ensemble Learning. Stroke data is processed using 2 stages of data processing, namely the data cleaning stage and the data transformation stage. In this study, a comparison will be made between the C4.5 algorithm, the bagging method + the C4.5 algorithm and the Adaboost method + the C4.5 algorithm using the confusion matrix, k-fold cross validation and validation test based on the values of TP, TN, FP, FN, recall, precision, F1-Score and accuracy. The results of the classification test using the Confusion Matrix and k-fold cross validation for the C4.5 algorithm resulted in an accuracy of 92.87%. Then the accuracy of the C4.5 algorithm with the bagging method increased to 95.02% and when combined with the Adaboost method the accuracy value also increased to 94.63%. From these results, it can be said that a single classifier algorithm, namely the C4.5 algorithm with the bagging and Adaboost methods, has been proven to improve classification performance.