Jurnal Teknik Informatika Unika St. Thomas (JTIUST), Volume 06 Nomor 01, Juni 2021, ISSN: 2548-1916, e-ISSN: 2657-1501 133 Prediksi Tweet Netizen Menggunakan Random Forest, Decision Tree, Naïve Bayes, dan Ensemble Algorithm Vivi nadenia Harahap *1 , Deci Irmayani 2 , Syaiful Zuhri Harahap 3 1,2,3 Universtias Labuhan Batu, Rantau Prapat, Indonesia Email: nadeniaharahap@gmail.com *1 , deacyirmayani@gmail.com 2 , syaifulzuhriharahap@gmail.com 3 Abstrak Gubernur DKI Jakarta saat ini, meski sudah terpilih sejak tahun 2017 selalu menarik untuk dibicarakan atau bahkan dikomentari. Komentar yang muncul berasal dari media secara langsung atau melalui media sosial. Twitter menjadi salah satu media sosial yang sering digunakan sebagai media untuk mengomentari gubernur terpilih bahkan bisa menjadi trending topic di media sosial Twitter. Netizen yang berkomentar pun beragam, ada yang selalu menge-Tweet kritik, ada yang berkomentar Positif, dan ada pula yang hanya me-retweet. Dalam penelitian ini, prediksi apakah Netizen aktif akan cenderung selalu menimbulkan komentar Positif atau Negatif akan dilakukan dalam penelitian ini. Model algoritma yang digunakan adalah Decision Tree, Naïve Bayes, Random Forest, dan juga Ensemble. Data Twitter yang diolah harus melalui preprocessing terlebih dahulu sebelum dilanjutkan menggunakan Rapidminer. Dalam uji coba menggunakan Rapidminer dilakukan dalam empat kali uji coba dengan membagi menjadi dua bagian yaitu data testing dan data latih. Perbandingan yang dilakukan adalah 10% data pengujian: 90% data pelatihan, kemudian 20% data pengujian: 80% data pelatihan, kemudian 30% data pengujian: 70% data pelatihan, dan yang terakhir adalah 35% data pengujian: 65% data pelatihan. Rata-rata Akurasi untuk algoritma Decision Tree adalah 93,15%, sedangkan untuk algoritma Naïve Bayes Akurasinya adalah 91,55%, kemudian untuk algoritma Random Forest adalah 93,41, dan yang terakhir adalah algoritma Ensemble dengan Akurasi sebesar 93,42%. sini. 65% data pelatihan. Rata-rata Akurasi untuk algoritma Decision Tree adalah 93,15%, sedangkan untuk algoritma Naïve Bayes Akurasinya adalah 91,55%, kemudian untuk algoritma Random Forest adalah 93,41, dan yang terakhir adalah algoritma Ensemble dengan Akurasi sebesar 93,42%. sini. 65% data pelatihan. Rata-rata Akurasi untuk algoritma Decision Tree adalah 93,15%, sedangkan untuk algoritma Naïve Bayes Akurasinya adalah 91,55%, kemudian untuk algoritma Random Forest adalah 93,41, dan yang terakhir adalah algoritma Ensemble dengan Akurasi sebesar 93,42%. sini. Kata kunci- Pohon Keputusan, Naïve Bayes, Hutan Acak, Set, Twitter Abstract The current governor of DKI Jakarta, even though he has been elected since 2017, is always interesting to talk about or even comment on. The comments that appear come from the media directly or through social media. Twitter is one of the social media that is often used as a medium for commenting on the elected governor, it can even become a trending topic on Twitter social media. Netizens who commented also varied, some always tweeted criticism, some commented positively, and some just retweeted. In this study, predictions of whether active netizens will tend to always cause positive or negative comments will be carried out in this study. The algorithm model used is Decision Tree, Naïve Bayes, Random Forest, and also Ensemble. Twitter data that is processed must go through preprocessing before continuing to use Rapidminer. In the trial using Rapidminer, it was carried out in four trials by dividing it into two parts, namely testing data and training data. The comparison made is 10% test data: 90% training data, then 20% test data: 80% training data, then 30% test data: 70% training data, and the last is 35% test data: 65% training data. The average accuracy for the Decision Tree algorithm is 93.15%, while for the Naïve Bayes algorithm the