KLASIFIKASI TOPIK BERITA MENGGUNAKAN MUTUAL INFORMATION DAN BAYESIAN NETWORK Fahmi Salman Nurfikri 1 , Mohamad Syahrul Mubarok 2 , dan Adiwijaya 3 Fakultas Informatika, Telkom University Email: 1 fahmisalman@student.telkomuniversity.ac.id, 2 msyahrulmubarok@gmail.com, 3 adiwijaya@telkomuniversity.ac.id Abstrak Seiring dengan meningkatnya perkembangan internet, maka pertumbuhan informasi tekstual di internet terus mengalami peningkatan. Dengan peningkatan informasi tersebut, maka kebutuhan pengklasifikasian berita secara otomatis sangat dibutuhkan untuk menemukan informasi atau berita yang diinginkan. Salah satu cara untuk mengelopokan suatu berita ke dalam kategori tertentu berdasarkan informasi yang terdapat dalam berita tersebut adalah text classification. Salah satu metode dalam text classification adalah Bayesian Network. Bayesian Network merupakan salah satu metode reasoning yang memodelkan hubungan antar variabel dalam Probabilistic Graphical Model (PGM). Keuntungan Bayesian Network dibandingkan dengan metode yang lain yaitu, cocok untuk dataset yang kecil dan tidak lengkap, dapat menangani ketidakpastian dan pengambilan keputusan, dan komputasi yang cepat. Selain itu, dilakukan seleksi fitur dengan menggunakan metode Mutual Information untuk mengurangi jumlah dimensi dan untuk meningkatkan performa klasifikasi. Hasil dari klasifikasi ini dinyatakan dalam F1-measure micro-average dengan nilai performansi sebesar 75,34%. Kata kunci : Text classification, Bayesian Network, Mutual Information, F1-measure Abstract Along with the increasing of the internet development, the growth of textual information on internet continues to experience enhancement. With the increase of the information, then the need for automatical classification of news is needed to find the desired information or news. One of ways to disguise a story into a particular category based on the information contained in the news is text classification. One of methods in text classification is Bayesian Network. Bayesian Network is one of reasoning methods which modeled the relationship between variables in the Probabilistic Graphical Model (PGM). Bayesian Network advantages compared by another methods are suitable for small and incomplete datasets, can handle uncertainty and retrieval decisions, and rapid computing. In addition, feature selection is performed using the Mutual Information method for reduce the number of dimensions and to improve the performance of classification. The results of this classification is expressed in F1-measure micro-average with a performance value of 75.34%. Keywords : Text classification, Bayesian Network, Mutual Information, F1-measure I. PENDAHULUAN Berita suatu informasi mengenai kejadian atau peristiwa yang hangat 1 . Berita tidak hanya menyebar melalui televisi atau surat kabar saja, berita juga menyebar melalui Internet. 1. kbbi.web.id 2. www.ida.or.id 3. www.pcplus.co.id ISSN : 2355-9365 e-Proceeding of Engineering : Vol.5, No.1 Maret 2018 | Page 1579