Jurnal Nasional Komputasi dan Teknologi Informasi Vol. 3 No. 3, Desember 2020 P-ISSN 2620-8342 E-ISSN 2621-3052 Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI ) 187 Penerapan Data Mining Untuk Prediksi Penjualan Mobil Menggunakan Metode K-Means Clustering Sufajar Butsianto 1 , Nindi Tya Mayangwulan 2 Universitas Pelita Bangsa, Jl. Inspeksi Kalimalang No.9, Cibatu, Kec. Cikarang Pusat, Bekasi, Jawa Barat 17530 e-mail : Sufajar@pelitabangsa.ac.id Abstraks -Penggunaan mobil di Indonesia setiap tahunnya selalu meningkat dan membuat perusahaan otomotif berlomba-lomba dalam peningkatan penjualannya. Tujuan dari penelitian ini untuk mengelompokan data penjualan kedalam sebuah cluster dengan metode Data Mining Algoritma K-Means Clustering. Data Penjualan nantinya akan dikelompokan berdasarkan kemiripan data tersebut sehingga data dengan karakteristik yang sama akan berada dalam satu cluster. Atribut yang digunakan adalah brand dan penjualan. Cluster yang terbentuk setelah dilakukan proses K-Means Clustering terbagi menjadi tiga cluster yaitu Cluster 0 jumlah anggota 235 dengan presentase 26% dikategorikan Laris, Cluster 1 jumlah anggota 604 dengan presentase 67% dikategorikan Kurang Laris, dan Cluster 2 jumlah angota 61 dengan presentase 7% dikategorikan Paling Laris, dari proses clustering diatas dapat diperoleh validasi DBI (Davies Bouldin Index) dengan nilai 0,341 Kata kunci : Data Mining, Clustering,K-Means, Penjualan Mobil 1. Pendahuluan Pada zaman sekarang kebutuhan masyarakat terhadap moda transportasi semakin meningkat, untuk itu masyarakat memiliki kendaraan mobil pribadi untuk menjalankan kegiatan sehari-hari. Setiap masyarakat pasti menginginkan mobil yang nyaman untuk digunakan dalam beraktivitas, dan saat membeli pun mareka pasti akan mencari mobil yang nyaman untuk mereka digunakan. Bermacam merek mobil banyak dijual, dengan berbagai jenis dan tipe mobil. Mobil sendiri memiliki berbagai macam merek diantaranya Mitshubishi, Toyota, Suzuki, dan lain. Perusahaan otomotif sendiri berusaha mencari tahu mobil dengan merek apa yang dinginkan oleh masyarakat, supaya dapat memenuhi keinginan masyarakat dan memprediksi penjualan mereka kedepannya. Dalam penelitian ini penulis melakukan penelitian tentang penjualan mobil di Indonesia, dimana penelitian ini bertujuan untuk mengetahui hasil dari pengelompokkan penjualan berdasarkan jumlah penjualan per bulan selama 5 tahun. Objek penelitian yang penulis teliti berasal dari 900 data yang diperoleh dari gaikindo. Penelitian yang digunakan penulis yaitu penelitian kualitatif, karena data yang diperoleh nantinya akan berupa kata-kata. Kata-kata tersebut diperoleh dari proses filter data yang telah berhasil dibersihkan. Dimana nanti aka diproses untuk mengetahui hasil clustering dan akurasi didalamnya. Pemilihan metode K-Means dikarenakan metode ini harus menggunakan data fisik tidak abstrak dan bersfat jelas, hal ini sesuai dengan data yang akan digunakan pada permesalahan didalam pengelompokkan jumlah penjualan mobil di Indonesia. Selain itu, metode ini bersifat fleksibel sebab pengguna dapat memnentukan jumlah cluster yang akan dibuat. 2. Tinjauan Pustaka 2.1 Sistem K-means K-Means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan waktu komputasi yang relatif cepat dan efisien. Namun, K-Means mempunyai mempunyai kelemahan yang diakibatkan oleh penentuan pusat awal cluster. Hasil cluster yang terbentuk dari metode K-Means ini sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan.[4][11] Algoritma K-Means merupakan metode non hierarki yang pada awalnya mengambil sebagian banyaknya komponen populasi untuk dijadikan pusat cluster awal. Pada tahap ini pusat cluster dipilih secara acak dari sekumpulan populasi data. Berikutnya K-Means menguji masing-masing komponen di dalam populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang telah didefinisikan tergantung dari jarak minimum antar komponen dengan tiap-tiap cluster. Posisi pusat cluster akan dihitung kembali sampai semua komponen data digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan terbentuk posisi pusat cluster baru.[1] Tahapan melakukan clustering atau pengelompokan dengan metode K-Means adalah sebagai berikut : [9] 1. Pilih jumlah cluster k. 2. Inisialisasi k pusat clusterini bisa dilakukan dengan berbagai cara. Namun yang paling sering dilakukan adalah dengan cara random. Pusat-pusat cluster diberiduberi nilai awal dengan angka-