Jurnal METHODIKA, Vol. 2 No. 2 NOPEMBER 2016 ISSN : 2442-7861 175 PENGUJIAN TINGKAT KEMIRIPAN SKRIPSI MAHASISWA DENGAN ALGORITMA GENETIKA MENGGUNAKAN POSI FORMULATION Darwis Robinson Manalu Program Studi Sistem Informasi, Universitas Methodist Indonesia Jln Hang Tuah No 8 Medan manaludarwis@gmail.com Abstract Measures the percentage similarity becomes important documents today because of the many digital documents in particular scientific work. Measurements were performed by using keywords solution of some of the documents that the user selected after the competition keywords. The process of determining keywords algorithm solution with genetics to produce the latest generation of the best with Jaccard Function. Then the similarity calculation process will be done using the keyword query comparing the solution with an existing document in a database that is in the post title, abstract, keywords and references. Similarity calculation method used is the Percentage of Similarity (POSI) Formulation. The number of keywords found on each document will be distributed in the whole of keywords that are found to produce a percentage of similarity. From the tests results obtained similarity of documents idDoc-661 amounted to 32.26%, 24.19% in the second sequence idDoc-665 and the third number of 19.35% on idDoc-663 and fourth at 12.90% in idDoc -667 and the latter by 11.29% in idDoc-666. Based on these tests can find out similarities with the other documents. Keywords: Document similarity, Genetic Algorithm (GA), Jaccard Function, POSI Formulation 1. PENDAHULUAN DEngan meningkatnya jumlah hasil penelitian maupun karya ilmiah lainnya dalam bentuk karya ilmiah digital terutama pada bidang akademik seperti skripsi, tesis, jurnal, prosiding dan sejenisnya, sehingga kemungkinan karya ilmiah dapat terjadi kemiripan seperti pada judul tulisan, abstrak, permasalahan, metode yang digunakan, objek penelitian, pembahasan dan hasilnya. Agar penulisan sebuah karya ilmiah tidak terjadi pengulangan maka perlu dilakukan antisipasi sejak dini. Pengujian kemiripan karya ilmiah merupakan pendeteksian kesamaan beberapa dokumen dengan membandingkan isi dokumen sehingga menghasilkan bobot atau nilai kemiripan dari karya ilmiah yang dibandingkan. Salah satu kegunaan perbandingan isi dokumen adalah untuk membantu pengguna dalam pengelompokan karya ilmiah dan juga memungkinkan pengguna mengetahui apakah isi karya ilmiah yang satu merupakan karya ilmiah yang pada dasarnya sama dengan karya ilmiah yang lain. Hal ini berfungsi untuk mengetahui apakah sebuah karya ilmiah mirip dengan karya ilmiah lain (Sihombing, 2010). Pengujian kemiripan karya ilmiah ini dapat dilakukan dengan beberapa teknik, misalnya teknik pencarian informasi, teknik penghitungan statistik, atau dengan menggunakan informasi sintaktik dari kalimat perkalimatnya (Taufiq, 2013). Pendekatan-pendekatan tersebut tidaklah sempurna, masih terdapat beberapa kelemahan, misalnya penghitungan statistik yang membandingkan frekuensi kata dari dokumen satu dengan dokumen yang lain, tidak memperhatikan struktur kalimat. Sedangkan dalam teknik sintaktik kalimat, urutan kata dalam kalimat diperiksa unsur semantiknya dengan cara mengolah letak kata sesuai tatabahasanya atau dengan penggantian sebuah kata dengan sinonim dari kata tersebut. Teknik ini mempunyai kelemahan, yaitu setiap kata dikelompokkan pada label masing- masing untuk mengetahui struktur kalimat. Penelitian ini bertujuan mengembangkan pengujian kemiripan satu dokumen dengan dokumen lain yang berada dalam satu database. Proses yang akan dilakukan adalah dengan mengadakan kompetisi kata kunci untuk mendapatkan kata kunci solusi (keyword solution) yang ada pada sebuah dokumen menggunakan algoritma genetika metode Jaccard. Dalam pengujian sebuah karya ilmiah dapat dibandingkan dengan multi dokumen yang telah dikelompokkan dalam sebuah server atau pusat database. Dimana informasi terhadap sebuah dokumen tersebut sudah dimasukkan terlebih dahulu dalam bentuk digital seperti kata kunci, id dokumen, abstrak, judul, dan informasi penting yang dapat mewakili informasi dokumen tersebut seperti daftar pustaka atau referensi utama yang digunakan. Sehingga diharapkan dokumen yang diuji kemiripannya dapat menghasilkan persentase kemiripan antara dokumen yang dipilih oleh user dibandingkan dengan sekumpulan dokumen lainnya dalam database. Maka pengguna karya ilmiah dapat terbantu dalam mengetahui isi dari sebuah dokumen/karya ilmiah tanpa harus membaca isi keseluruhan dokumen tersebut. Adapun rumusan masalah dalam penelitian ini adalah berapa persentase kemiripan sebuah dokumen jika dibandingkan dengan dokumen lain di dalam sebuah database dengan proses algoritma genetika menggunakan Perentage of Similarity (POSI) Formulation” adapun kajian yang dibahas adalah metode yang digunakan Jaccard Function, karya ilmiah yang diuji adalah berupa dokumen jurnal yang telah memiliki format penulisan yang sama, Formula perhitungan pengukuran kemiripan dengan POSI Formulation. Data yang digunakan yang bersumber dari karya Ilmiah/Prosiding Seminar Nasional Ilmu Komputer (SNIKOM) APTIKOM Wilayah I Tahun 2013 serta pengujian kata kunci solusi dilakukan terhadap judul tulisan, kata kunci, abstrak dan referensi. Aplikasi yang dirancang digunakan secara multiuser dan menyediakan fasilitas pencarian dokumen pada aplikasi untuk memudahkan mengetahui isi karya ilmiah. Adapun tujuan penelitian ini adalah untuk mengetahui hasil persentase kemiripan sebuah karya ilmiah dengan karya ilmiah lainnya. Sedangkan manfaatnya adalah pengguna dapat mengetahui dengan cepat kemiripan karya ilmiah tanpa harus membaca keseluruhan isi dokumen. Adapun kontribusi penelitian yang dilakukan adalah: 1. Menambah salah satu cara untuk mengukur kemiripan dokumen berbasis teks dalam sebuah pusat data yang terdiri dari dokumen jurnal dan karya ilmiah lainnya. 2. Membuat clustering dalam database server untuk mempercepat proses pengukuran kemiripan menggunakan fungsi SQL.