Xplore (ISSN:2302-5751), Vol 2 No 2 (2018):32-40 Penanganan Data Tidak Seimbang pada Pemodelan Rotation Forest Keberhasilan Studi Mahasiswa Program Magister IPB Junjun Wijaya * , Agus M Soleh * , Akbar Rizki * * Departemen Statistika Institut Pertanian Bogor Abstrak—Sekolah Pascasarjana Institut Pertanian Bo- gor (SPs-IPB) menyatakan bahwa tidak semua mahasiswa program magister IPB berhasil menyelesaikan studinya. Hal ini menjadi evaluasi untuk IPB agar lebih selektif memilih mahasiswa ke depannya. Penelitian ini bertu- juan untuk memodelkan klasifikasi kerberhasilan studi mahasiswa magister IPB tahun 2011 hingga 2015 dengan peubah respon yaitu lulus dan tidak lulus sedangkan profil dan latar belakang mahasiswa sebagai peubah penjelas. Metode klasifikasi yang digunakan yaitu rotation forest. Persentase banyaknya mahasiswa yang lulus sangat besar dibandingkan yang tidak lulus, hal ini dapat menye- babkan nilai evaluasi berbeda. SMOTE (Synthetic Minority Oversampling Technique) merupakan salah satu metode untuk menangani data tidak seimbang tersebut dengan cara membangkitkan data buatan. Kurva ROC (Receiver Operating Characteristic) dibangun untuk melihat nilai cut off optimum. Ada dua model klasifikasi, yaitu model rota- tion forest sebelum dan setelah ditangani dengan SMOTE. Hasil perbandingan menunjukkan bahwa model rotation forest setelah SMOTE dengan nilai cut off 0.6 adalah model terbaik. Model ini mampu meningkatkan nilai sensitivitas lebih dari 50% walaupun nilai akurasi dan spesifisitasnya menurun dibandingkan dengan pemodelan sebelum SMOTE. Kata kunci—data tidak seimbang; klasifikasi; magister IPB; rotation forest; SMOTE I. PENDAHULUAN A. Latar Belakang Sekolah Pascasarjana Institut Pertanian Bogor (SPs-IPB) awalnya memiliki tujuh program studi sejak didirikan pada tahun 1975 (IPB (2013)). IPB merupakan kampus yang terus mengembangkan in- ovasi hingga saat ini SPs-IPB memiliki 9 fakultas dengan 71 program studi magister. SPs-IPB mener- ima mahasiswa melalui jalur beasiswa dan mandiri. Calon mahasiswa biasanya memilih SPs-IPB den- gan beberapa alasan, diantaranya yaitu kompetensi dosen, daya saing lulusan dan standar akademik tinggi. Selain itu, lulusan IPB tersebar di dalam maupun luar negeri, jumlah dan kualitas riset salah satu tertinggi di Indonesia, kerjasama luas, fasilitas lengkap, dan mayor bidang pertanian terlengkap di Asia Tenggara. Data yang diperoleh dari Basis Data SPs-IPB menyatakan bahwa tidak semua mahasiswa program magister berhasil menyelesaikan studinya. Hal terse- but menjadi evaluasi untuk IPB agar lebih selektif menerima mahasiswa ke depannya. Mahasiswa pas- casarjana dinyatakan lulus apabila telah memenuhi persyaratan yang ditetapkan IPB. Syarat tersebut yaitu telah lulus dan menyelesaikan seluruh SKS yang disyaratkan, mendapat nilai minimal B pada penelitian yang sudah diseminarkan, lulus ujian akhir dan menyelesaikan tesis, serta melunasi biaya pendidikan dan administrasi lainnya. Banyak alasan mahasiswa lulus atau tidak lulus dalam melanjutkan studinya. Profil dan latar belakang pendidikan ma- hasiswa dapat diindikasikan menjadi faktor penye- bab keberhasilan studi mahasiswa. Penelitian ini dilakukan untuk memodelkan klasi- fikasi data mahasiswa program magister tahun 2011 hingga 2015. Status mahasiswa yaitu lulus dan tidak lulus (drop out dan mengundurkan diri) digunakan sebagai peubah respon sedangkan profil dan beber- apa latar belakang mahasiswa sebagai peubah pen- jelasnya. Metode klasifikasi yang digunakan adalah rotation forest. Metode ini lebih baik dibandingkan dengan metode pohon gabungan lainnya, seperti bagging, adaboost, dan random forest (Kuncheva and Rodriguez (2007)). Penelitian Raharjo (2016) juga menunjukkan rotation forest menghasilkan prediksi klasifikasi yang lebih baik dan konsisten serta efisien dalam waktu komputasi dibandingkan