e-ISBN 978-623-93343-3-8 Seminar Nasional Mahasiswa Ilmu Komputer dan Aplikasinya (SENAMIKA) Jakarta-Indonesia, 20 April 2021 655 Klasifikasi Penyakit Liver dengan Menggunakan Metode Decision Tree Endah Patimah 1 , Ballya Vicky Haekal 2 , Desta Sandya Prasvita, S.Komp., M.Kom. 3 1,2,3 Program Studi Informatika, Universitas Pembangunan Nasional Veteran Jakarta 1,2,3 Jl. RS. Fatmawati Raya, Pd. Labu, Kec. Cilandak, Kota Depok, Jawa Barat 12450 email: 1 endahp@upnvj.ac.id, 2 vballya12@gmail.com, 3 desta.sandya@gmail.com Abstrak. Penyakit liver merupakan penyakit yang berbahaya. Sehingga, penanganan pasien pada tahap awal sangatlah penting, sehingga kami melakukan klasifikasi dataset liver dengan menggunakan metode decision tree. Di mana dataset yang digunakan yaitu ILPD (Indian Liver Patient Dataset). Tahap pertama yang dilakukan adalah penghapusan data yang duplikat, lalu pembagian data, normalisasi, dan tahap terakhir yaitu pemodelan dengan menggunakan decision tree. Untuk pembagian data dengan metode holdout validation dengan nilai test size 0.2 dan k-fold cross validation dengan nilai test size 0.6, lalu dinormalisasi menggunakan min-max atau standar scaler. Hasil yang didapatkan dari penelitian ini dengan metode k-fold cross validation dan min-max hasil akurasinya adalah 0.7, lalu menggunakan k-fold cross validation dan standar scaler hasil akurasinya sebesar 0.7333, jika menggunakan holdout validation dan min-max hasil akurasinya sebesar 0.5342, dan jika menggunakan holdout validation dan standar scaler hasilnya 0.6027. Sehingga dapat disimpulkan bahwa akurasi yang terbesar adalah dengan menggunakan k-fold cross validation dan standar scaler. Kata kunci: liver, decision tree, klasifikasi. 1. Pendahuluan Liver atau hati merupakan satu-satunya organ dalam tubuh yang dapat melakukan regenerasi yaitu kemampuan untuk mengganti sel yang rusak. Liver memiliki beberapa fungsi di antaranya adalah metabolisme lemak, di mana hati menghasilkan empedu dan kolesterol yang nantinya akan mencerna lemak yang ada dalam tubuh. Lalu, hati juga berfungsi sebagai metabolisme protein, di mana hati akan menghasilkan asam amino untuk menyusun protein yang nantinya akan melawan infeksi serta membersihkan ammonia [1]. Dikarenakan fungsi yang beragam itu, tidak menjamin liver terus sehat. Terdapat beberapa hal yang dapat membuat fungsi liver terganggu, diantaranya dari infeksi yang disebabkan oleh parasit atau virus, bisa juga karena kebiasaan mengonsumsi alkohol dalam waktu yang lama. Alkohol sangat berbahaya bagi hati, karena alkohol bersifat toksik untuk sel-sel hati, oleh karena itu ketika terjadi penyaringan terhadap alkohol oleh hati akan membuat sel-sel hati mengalami kematian [2]. Menurut Santosa klasifikasi yaitu peramalan yang di mana outputnya merupakan nilai diskrit, yang tujuannya untuk mendapatkan suatu keputusan yang akurat dari kelas suatu data [3]. Contoh metode klasifikasi diantaranya ada decision tree, naïve bayes, neural network dan lain-lain. Dari banyaknya algoritma klasifikasi, algoritma yang akan digunakan pada penelitian ini yaitu decision tree. Seperti penelitian sebelumnya, yaitu penelitian yang dilakukan oleh Popon Handayani, dkk, dengan menggunakan decision tree dengan algoritma C4.5 dan neural network, data yang digunakan memiliki 11 atribut yang terdiri dari 10 atribut dan 1 class. Dari hasil penilitian ini didapatkan nilai akurasi decision tree menggunakan algoritma C4.5 yaitu sebesar 75,56% dengan nilai AUC 0,898 dan nilai akurasi menggunakan algoritma neural network sebesar 74,17% dengan AUC 0,671. Dari hasil tersebut dapat disimpulkan bahwa untuk memprediksi penyakit liver lebih akurat dengan menggunakan decision tree dari pada menggunakan neural network [4]. Oleh karena itu, dalam penelitian kali ini, kita akan membuat klasifikasi pada penyakit liver, data yang akan digunakan adalah berasal dari UCI Machine Learning Repository yaitu dataset ILPD ( Indian Liver Patient Dataset). Di mana pada dataset terdapat dua kelas, yaitu kelas 1 dan kelas 2 yang terletak pada kolom class. 2. Penelitian Terdahulu Penelitian yang menggunakan dataset ILPD (Indian Liver Patient Dataset) sudah banyak dilakukan, diantaranya adalah sebagai berikut.