1 SELEKSI FITUR MENGGUNAKAN FAST CORRELATION BASED FILTER PADA ALGORITMA VOTING FEATURE INTERVALS 5 Hida Nur Firqiani, Aziz Kustiyo , Endang Purnama Giri 1 Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut Pertanian Bogor ABSTRAK Seleksi fitur adalah salah satu tahapan praproses klasifikasi. Seleksi fitur dilakukan dengan cara memilih fitur-fitur yang relevan yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur-fitur yang tidak relevan. Seleksi fitur digunakan untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi. Pada penelitian ini dilakukan seleksi fitur menggunakan Fast Correlation Based Filter pada klasifikasi data menggunakan algoritma Voting Feature Intervals 5. Penelitian ini bertujuan menganalisis kinerja seleksi fitur pada klasifikasi data menggunakan algoritma Voting Feature Intervals 5. Penelitian ini akan membandingkan tingkat akurasi data pada algoritma klasifikasi Voting Feature Intervals 5 jika sebelumnya dilakukan seleksi fitur dan tanpa dilakukan seleksi fitur. Data yang digunakan pada penelitian ini memiliki dimensi yang beragam. Hasil dari penelitian ini berupa perbandingan nilai akurasi data pada klasifikasi menggunakan Voting Feature Intervals 5 jika sebelumnya dilakukan seleksi fitur dan tidak dilakukan seleksi fitur. Hasil yang diperoleh menunjukkan bahwa nilai akurasi klasifikasi dengan seleksi fitur lebih baik daripada tanpa seleksi fitur. Dari keempat data yang digunakan, tingkat akurasi data mengalami peningkatan jika menggunakan seleksi fitur. Rata-rata hasil akurasi data tanpa seleksi fitur yaitu 81.66% sedangkan menggunakan seleksi fitur yaitu 85.51% . Kata Kunci: seleksi fitur, voting feature intervals, fast correlation based filter, klasifikasi. PENDAHULUAN Latar Belakang Klasifikasi adalah proses menemukan sekumpulan model yang menggambarkan serta membedakan kelas-kelas data. Tujuan dari klasifikasi adalah agar model yang dihasilkan dapat digunakan untuk memprediksi kelas dari suatu data yang tidak mempunyai label kelas. Jika diberikan sekumpulan data yang terdiri dari beberapa fitur dan kelas, maka klasifikasi adalah menemukan model dari kelas tersebut sebagai fungsi dari fitur-fitur yang lain. Pada umumnya algoritma klasifikasi menggunakan semua fitur yang terdapat pada data untuk membangun sebuah model, padahal tidak semua fitur tersebut relevan terhadap hasil klasifikasi. Apabila hal tersebut terjadi pada data yang memiliki ukuran dan dimensi yang sangat besar, maka membuat kinerja algoritma menjadi tidak efektif dan efisien, misalnya saja waktu pemrosesan menjadi lebih lama akibat banyak fitur yang harus diproses. Salah satu solusi yang digunakan untuk mengatasi masalah tersebut adalah dengan menggunakan seleksi fitur. Seleksi fitur adalah salah satu tahap praproses pada klasifikasi. Seleksi fitur dilakukan dengan cara memilih fitur-fitur yang relevan terhadap data yang mempengaruhi hasil klasifikasi. Seleksi fitur digunakan untuk mengurangi dimensi data dan fitur yang tidak relevan, serta untuk meningkatkan efektifitas dan efisiensi kinerja dari algoritma klasifikasi. Algoritma Fast Correlation Based Filter adalah salah satu algoritma seleksi fitur yang dikembangkan oleh Yu dan Huan (2003). Konsep utama dari algoritma ini adalah menghilangkan fitur-fitur yang tidak relevan serta menyaring fitur-fitur yang redundant terhadap fitur-fitur yang lain. Berdasarkan penelitian yang dilakukan Yu dan Huan (2003) diperoleh hasil bahwa Fast Correlation Based Filter sangat efisien dalam melakukan seleksi fitur serta memberikan performa yang baik bagi kinerja algoritma klasifikasi, baik dari segi waktu maupun akurasi hasil klasifikasi. Penelitian Yu dan Huan (2003)