Analisis Trending Topik Pada Twitter menggunakan Metode Naive Bayes dengan Pembobotan TF-IDF Saut Sihol Ritonga¹, Erwin Budi Setiawan 2 , Isman Kurniawan 3 1,2,3 Fakultas Informatika, Universitas Telkom, Bandung 4 Divisi Digital Service PT Telekomunikasi Indonesia 1 ritongasihol@gmail.com, 2 erwinbudisetiawan@telkomuniversity.ac.id, 3 ismankrn@telkomuniversity.ac.id Abstrak Twitter adalah salah satu media sosial yang banyak sekali para penggunanya menceritakan berbagai macam banyak kejadian oleh karena itu perlu megklasifikasi topik menjadi dengan akurasi tinggi untuk lebih baik pengambilan informasi. Oleh karena itu penulis melakukan penelitian untuk mengatasi masalah ini dengan membagi beberapa tren topik twitter. Pembobotan yang digunakan adalah TF-IDF dengan menggunakan Naïve Bayes. Akurasi terbaik pada pembobotan TF-IDF menggunakan klasifikasi Naïve Bayes didapat pada skenario data training, data tesing 80:20 adalah 57.08% dan memiliki nilai f-measure 0.52. Trending pertama yang terdeteksi dari pengambilan data dari bulan 25 Juli sampai 28 Agustus adalah politik dengan persentase 26.88% lalu kedua senbud persentase 8.65% dan yang ketiga hukam 8.27%. Kata Kunci: Twitter, Naive Bayes, TF-IDF, Topik. Abstract Twitter is one of the many social media users who tell a wide variety of events so it is necessary to classify topics into high accuracy for better information retrieval. Therefore, the authors conducted research to overcome this problem by dividing a number of Twitter topic trends. The weighting used is TF-IDF by using Naïve Bayes. The best accuracy on TF-IDF weighting using the Naïve Bayes classification is obtained in the training data scenario, the 80:20 testing data is 57.08% and has an f-measure value of 0.52. The first trend detected from data collection from July 25 to August 28 is politic with a percentage of 26.88%, then second senbud with a percentage of 8.65% and a third with 8.27% hukam. Keyword: Twitter, Naive Bayes, TF-IDF, Topic. 1. Pendahuluan Perkembangan teknologi informasi sampe saat ini semakin pesat dan memberi banyak manfaat di semua aspek sosial. Perkembangan teknologi informasi sangat membantu manusia dalam menyelesaikan suatu pekerjaan yang harus diiringi dengan tenaga Sumbe Daya Manusia (SDM). Perkembangan teknologi informasi dipermudah dengan adanya sosial media aplikasi seperti Facebook, Twitter, Path, Snapchat, Instagram, Telegram dan sebagainya. Dan salah satu teknologi informasi yang sampe saat ini paling sering di gunakan adalah twitter. Twitter adalah situs mikroblog yang sangat populer[1], tempat pengguna mencari informasi sosial dan waktu yang tepat seperti berita terkini, posting tentang selebritas, dan trending topic. Pengguna memposting pesan teks pendek yang disebut tweet, yaitu dibatasi oleh 140 karakter dan dapat dilihat oleh pengikut pengguna. Siapa pun yang memilih untuk memiliki yang lain tweet yang diposting di timeline satu disebut pengikut. Tweet telah digunakan sebagai media untuk informasi real-time atau banyak dibicarakan banyak orang diseminasi ini telah digunakan dalam berbagai kampanye, pemilihan umum, dan sebagai media berita[2]. Bahkan Indonesia menduduki peringkat 5 di Dunia pengguna Twitter. persentase yang sangat tinggi dari trending topik adalah tagar dimana tagar tesebut mengatas namakan orang lain atau kata kata lainnya makanya perlu sekali mengklasifikasi topik ini kedalam kategori umum sehingga mudah di pahami dalam pengambilan informasi. Untuk mendapatkan data berita dan tweet dari Twitter kita lakukan crawling. Crawling data merupakan tahap dalam penelitian yang bertujuan untuk mengumpulkan data atau mengunduh data dari suatu database. Pengumpulan data dari penelitian ini yaitu data yang di unduh dari server Twitter berupa user dan tweet beserta atribut-atributnya[9]. Trending Topic adalah suatu kejadian yang paling terkenal dan terjadi di dunia nyata dan banyak dibahas di media sosial terutama pada Twitter. Kejadian-kejadian yang terkenal ini membuat semua orang terutama para pengguna Twitter tertarik untuk membahasnya di media sosial. Semakin banyak pengguna media sosial yang membahas kejadian tersebut, maka kejadian itu semakin terkenal[7]. ISSN : 2355-9365 e-Proceeding of Engineering : Vol.7, No.1 April 2020 | Page 2806