Pemetaan Tindak Kejahatan Jalanan di Kota Semarang Menggunakan Algoritma K-Means Clustering Widi Astuti 1 dan Djoko Adi Widodo 2 Jurusan Teknik Elektro, Fakultas Teknik, Universitas Negeri Semarang, Indonesia diast824@gmail.com 1 , djokoadiwidodo@mail.unnes.ac.id 2 Abstrak‡ Data kejahatan di Polrestabes Semarang merupakan kumpulan berbagai kasus kejahatan yang kemudian dikelompokkan berdasarkan peraturan yang mengatur yaitu KUHP (Kitab Undang-undang Hukum Pidana) dan Non KUHP, jumlah kejahatan per wilayah polisi sektor, dan jumlah kejahatan per jenis kasus kejahatan. Pengelompokan data dapat memberikan penemuan informasi baru yang sebelumnya tidak diketahui.Penelitian ini bertujuan untuk memetakan data kejahatan jalanan di Kota Semarang periode tahun 2014. Penelitian ini menggunakan metode observasi dan metode studi pustaka. Analisis data menggunakan teknik text mining yang terdiri tiga tahapan yaitu preprocessing, representation, dan knowledge discovery (penggalian informasi menggunakan clustering algoritma k-means. Selanjutnya dievaluasi menggunakan metode Entropy. Hasil penelitian diperoleh 3 cluster/kelompok tindak kejahatan jalanan berdasarkan waktu kejadian dan 7 kelompok menurut modus operandi. Berdasarkan nilai Entropy, kualitas algoritma k-means dalam pengelompokan waktu kejadian adalah baik karena data yang terkumpul dalam satu kelompok memiliki kemiripan tinggi dibandingkan data pada kelompok lain dan untuk pengelompokan modus operandi adalah cukup baik karena ada satu kelompok yang anggota kelompoknya memiliki tingkat kemiripan yang rendah. Simpulan dari penelitian ini yaitu algoritma k-means dapat digunakan untuk pengelompokan data teks kejahatan jalanan. Saran yang dapat diberikan adalah supaya lebih teliti dalam menentukan jumlah kelompok sehingga data dapat terkelompok dengan baik sesuai kemiripan masing-masing data. Kata kunci² Tindak kejahatan, Text mining, K-Means, Entropy I. PENDAHULUAN Kota Semarang merupakan salah satu kota besar sebagai ibukota propinsi Jawa Tengah. Sebagai sebuah kota besar, kota Semarang memiliki luas wilayah 373,67 km2 dengan jumlah penduduk 1.268.292 jiwa dan 16 kecamatan. Banyaknya jumlah penduduk menimbulkan berbagai masalah sosial di dalam masyarakat seperti kemiskinan, pengangguran, dan lainnya. Adanya masalah sosial mendorong beberapa orang untuk melakukan tindak kejahatan. Salah satu jenis tindak kejahatan adalah kejahatan jalanan. Makaampoh dalam menyatakan tindak kekerasan dalam KUHP salah satunya adalah aksi kejahatan jalanan (Street Crime) seperti pencurian, pemerasan, pemerkosaan, penganiayaan, tindak kekerasan terhadap orang atau barang, perilaku mabuk di muka umum, yang tentunya dapat mengganggu ketertiban umum serta menimbulkan keresahan di masyarakat [1]. Berdasarkan hasil observasi yang dilakukan di kantor Bidang Operasional (Bin Ops) Reskrim, rincian data kasus kejahatan dikelola oleh Bidang Operasional Reskrim. Pengolahan data kejahatan dilakukan secara manual oleh petugas dengan menggunakan aplikasi pengolah angka Ms. Excel. Adapun atribut data yaitu Nomor Laporan Polisi (No LP), Waktu Kejadian, Tempat Kejadian Perkara (TKP), Kelurahan, Kecamatan, Tindak Pidana (TP)/Pasal, Kerugian, Modus Operandi (MO), dan Keterangan. Data kasus kejahatan tersebut dikelompokan sesuai dengan wilayah Polsek (Polisi Sektor) dan menurut KUHP (Kitab Undang-undang Hukum Pidana) atau NON KUHP. Untuk kasus kejahatan jalanan, seperti pencurian, penculikan, penganiayaan, dan perampasan tidak dicatat secara terpisah. Rincian data kejahatan jalanan masih dicatat bersamaan dengan kasus kejahatan lainnya. Adapun data kejahatan jalanan yang diolah lebih lanjut antara lain jumlah kasus pencurian yang terjadi menurut wilayah Polsek. Berdasarkan latar belakang di atas, maka dirumuskan permasalah sebagai berikut yaitu bagaimana kualitas algoritma k-means clustering dalam memetakan tindak kejahatan jalanan meliputi penganiayaan, pencurian, penjambretan, perampokan, dan pemerasan di kota Semarang pada tahun 2014. Menurut Linoff dan Berry, clustering adalah proses pengelompokan satu set data objek menjadi beberapa kelompok atau klaster sehingga objek dalam sebuah klaster memiliki kemiripan yang tinggi satu sama lain, tetapi sangat berbeda dengan objek dalam kelompok lainnya. Salah satu algoritma yang sering digunakan adalah algoritma k-means [2]. ISSN 1411 - 0059 Jurnal Teknik Elektro Vol. 8 No. 1 Januari - Juni 2016 5