Jurnal Nasional Komputasi dan Teknologi Informasi
Vol. 3 No. 3, Desember 2020
P-ISSN 2620-8342
E-ISSN 2621-3052
Copyright © Jurnal Nasional Komputasi dan Teknologi Informasi (JNKTI )
187
Penerapan Data Mining Untuk Prediksi Penjualan Mobil Menggunakan
Metode K-Means Clustering
Sufajar Butsianto
1
, Nindi Tya Mayangwulan
2
Universitas Pelita Bangsa,
Jl. Inspeksi Kalimalang No.9, Cibatu, Kec. Cikarang Pusat, Bekasi, Jawa Barat 17530
e-mail : Sufajar@pelitabangsa.ac.id
Abstraks -Penggunaan mobil di Indonesia setiap tahunnya selalu meningkat dan membuat perusahaan
otomotif berlomba-lomba dalam peningkatan penjualannya. Tujuan dari penelitian ini untuk mengelompokan
data penjualan kedalam sebuah cluster dengan metode Data Mining Algoritma K-Means Clustering. Data
Penjualan nantinya akan dikelompokan berdasarkan kemiripan data tersebut sehingga data dengan karakteristik
yang sama akan berada dalam satu cluster. Atribut yang digunakan adalah brand dan penjualan. Cluster yang
terbentuk setelah dilakukan proses K-Means Clustering terbagi menjadi tiga cluster yaitu Cluster 0 jumlah
anggota 235 dengan presentase 26% dikategorikan Laris, Cluster 1 jumlah anggota 604 dengan presentase 67%
dikategorikan Kurang Laris, dan Cluster 2 jumlah angota 61 dengan presentase 7% dikategorikan Paling Laris,
dari proses clustering diatas dapat diperoleh validasi DBI (Davies Bouldin Index) dengan nilai 0,341
Kata kunci : Data Mining, Clustering,K-Means, Penjualan Mobil
1. Pendahuluan
Pada zaman sekarang kebutuhan masyarakat terhadap moda transportasi semakin meningkat, untuk itu
masyarakat memiliki kendaraan mobil pribadi untuk menjalankan kegiatan sehari-hari. Setiap masyarakat pasti
menginginkan mobil yang nyaman untuk digunakan dalam beraktivitas, dan saat membeli pun mareka pasti
akan mencari mobil yang nyaman untuk mereka digunakan. Bermacam merek mobil banyak dijual, dengan
berbagai jenis dan tipe mobil. Mobil sendiri memiliki berbagai macam merek diantaranya Mitshubishi, Toyota,
Suzuki, dan lain. Perusahaan otomotif sendiri berusaha mencari tahu mobil dengan merek apa yang dinginkan
oleh masyarakat, supaya dapat memenuhi keinginan masyarakat dan memprediksi penjualan mereka
kedepannya.
Dalam penelitian ini penulis melakukan penelitian tentang penjualan mobil di Indonesia, dimana penelitian
ini bertujuan untuk mengetahui hasil dari pengelompokkan penjualan berdasarkan jumlah penjualan per bulan
selama 5 tahun. Objek penelitian yang penulis teliti berasal dari 900 data yang diperoleh dari gaikindo.
Penelitian yang digunakan penulis yaitu penelitian kualitatif, karena data yang diperoleh nantinya akan
berupa kata-kata. Kata-kata tersebut diperoleh dari proses filter data yang telah berhasil dibersihkan. Dimana
nanti aka diproses untuk mengetahui hasil clustering dan akurasi didalamnya.
Pemilihan metode K-Means dikarenakan metode ini harus menggunakan data fisik tidak abstrak dan
bersfat jelas, hal ini sesuai dengan data yang akan digunakan pada permesalahan didalam pengelompokkan
jumlah penjualan mobil di Indonesia. Selain itu, metode ini bersifat fleksibel sebab pengguna dapat
memnentukan jumlah cluster yang akan dibuat.
2. Tinjauan Pustaka
2.1 Sistem K-means
K-Means mempunyai kemampuan mengelompokkan data dalam jumlah yang cukup besar dengan
waktu komputasi yang relatif cepat dan efisien. Namun, K-Means mempunyai mempunyai kelemahan yang
diakibatkan oleh penentuan pusat awal cluster. Hasil cluster yang terbentuk dari metode K-Means ini
sangatlah tergantung pada inisiasi nilai pusat awal cluster yang diberikan.[4][11]
Algoritma K-Means merupakan metode non hierarki yang pada awalnya mengambil sebagian
banyaknya komponen populasi untuk dijadikan pusat cluster awal. Pada tahap ini pusat cluster dipilih secara
acak dari sekumpulan populasi data. Berikutnya K-Means menguji masing-masing komponen di dalam
populasi data dan menandai komponen tersebut ke salah satu pusat cluster yang telah didefinisikan
tergantung dari jarak minimum antar komponen dengan tiap-tiap cluster. Posisi pusat cluster akan dihitung
kembali sampai semua komponen data digolongkan kedalam tiap-tiap pusat cluster dan terakhir akan
terbentuk posisi pusat cluster baru.[1]
Tahapan melakukan clustering atau pengelompokan dengan metode K-Means adalah sebagai berikut :
[9]
1. Pilih jumlah cluster k.
2. Inisialisasi k pusat clusterini bisa dilakukan dengan berbagai cara. Namun yang paling sering
dilakukan adalah dengan cara random. Pusat-pusat cluster diberiduberi nilai awal dengan angka-