ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 4, Tahun 2016, Halaman 763-770 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian ANALISIS KECENDERUNGAN INFORMASI DENGAN MENGGUNAKAN METODE TEXT MINING (Studi Kasus: Akun twitter @detikcom) Syaifudin Karyadi 1 , Hasbi Yasin 2 , Moch. Abdul Mukid 3 1 Mahasiswa Departemen Statistika FSM Universitas Diponegoro 2,3 Staff Pengajar Departemen Statistika FSM Universitas Diponegoro e-mail syaifudinkaryadi@gmail.com ABSTRACT The internet is an extraordinary phenomenon. Starting from a military experiment in the United States, the internet has evolved into a 'need' for more than tens of millions of people worldwide. The number of internet users is large and growing, has been creating internet culture. One of the fast growing social media twitter. Twitter is a microblogging service that stores text database called tweets. To make it easier to obtain information that is dominant discussed, then sought the topic of twitter tweet using clustering. In this research, grouping 500 tweets from twitter account @detikcom using k-means clustering. The results of this study indicate that the maximum index Dunn, the best grouping K-means clustering to obtain the dominant topic as many as three clusters, namely the government, Jakarta, and politics. Keywords: text mining, clustering,, k-means , dunn index, and twitter. 1. PENDAHULUAN Menurut Francis dan Flynn (2010), text mining adalah teknologi baru yang digunakan untuk data perusahaan yang selalu bertambah sehingga data teks yang tidak terstruktur tersebut dapat dianalisis. Salah satu inovasi software yang dapat meringankan biaya bagi penambang teks adalah software yang bersifat open source. Dua jenis sofware open source yang sangat populer dan diunggulkan adalah R dan Perl. R adalah bahasa pemrograman yang mendukung hal-hal yang berkaitan dengan statistik dan digunakan pada hal-hal yang berhubungan dengan ilmu pasti, matematis. Beberapa informasi penting yang dapat diperoleh dari twitter antara lain seperti melihat sejarah perkembangan manusia, sejarah obama terpilih menjadi presiden, dll. Tersedia dalam tweet- tweet yang bisa dirunut di twitter. Penelitian ini dilakukan pengelompokkan 500 tweet dari akun twitter @detikcom menggunakan metode k-means clustering yang bertujuan untuk untuk mengetahui kecenderungan topik pemberitaan dan mengetahui topik yang paling sering muncul. Hasil analisis pada akun twitter berita tersebut akan memberikan gambaran pemberitaan akhir-akhir ini. Penelitian ini menjadi penting mengingat akun @detikcom merupakan akun berita online dengan followers terbanyak, sehingga berita yang disampaikan juga akan mempengaruhi pengetahuan dan presepsi publik terhadap suatu masalah. 2. TINJAUAN PUSTAKA 2.1. Twitter Twitter diluncurkan sebagai situs micro- blogging pada Maret 2006 yang memungkinkan pengguna untuk mengirim update status hingga 140 karakter, yang dikenal sebagai tweets. Sejak diluncurkan, twitter telah mengumpulkan basis pengguna yang besar dan sekarang memiliki lebih dari 300 juta pengguna per Juni 2011 (Goyal dan Diwakar, 2011).