Indra Kharisma, M. Sukrisno Mardiyanto, “Penyusunan Taksonomi Rekayasa Perangkat Lunak Berdasarkan Penelusuran Mesin Pencari”, Proceedings of Seminar Nasional Ilmu Komputer General Approach on Multidisciplinary Application. Yogyakarta , 19 November 2011. Penyusunan Taksonomi Rekayasa Perangkat Lunak Berdasarkan Penelusuran Mesin Pencari Indra Kharisma R. 1 , M. Sukrisno Mardiyanto 2 1 Universitas Airlangga Kampus C Mulyorejo Surabaya indrakharisma@unair.ac.id 2 Institut Teknologi Bandung Jl. Ganesha 8 Bandung sukrisno@informatika.org AbstractSoftware engineering taxonomy is needed to categorize and find the trend of software engineering, taxonomy itself is a hierarchical structure based on internal data to classify information. Software engineering taxonomy are made based on term linkages evaluation in document collection. Query are retrieved using the key phrase identification algorithms, this query are required to collect specific document from search engines. Collection of software engineering documents should be preprocessing and then extracted to get term of software engineering. Software engineering term mapping need to be done for analyzing data in taxonomy development. Clustering mechanism using the k-means algorithm is choosen to be strategy to create taxonomy. node taxonomy name is made based on centroids of clusters. To create a child node structure, recursive clustering are performed based on documents grouping result, for each group of documents is performed clustering to get a child node. It has been designed and implemented software for developing software engineering taxonomy based on search engine result, it’s allows users to create a taxonomy and iteratively improve it. Based on evaluation results involving group of experts, key phrase identification algorithm are prove can generate search query and terms that are closely related to software engineering. draft of software engineering taxonomy based assessement by experts have 61% suitability with software enginering concept. In addition child node compliance with his parent are rated by 60%. Keywords: Taxonomy Generation, Key Phrase Identification I. LATAR BELAKANG Taksonomi merupakan pengorganisasian informasi yang penting karena merupakan dasar dalam memahami suatu informasi. Taksonomi membantu memahami isi berdasarkan hubungan hirarkis serta hubungan yang bersilangan. Rekayasa perangkat lunak sendiri memiliki beberapa taksonomi yaitu SWEBOK [1], Computer Curriculum– Software Engineering (SE2004)[2] dan Computing Classification System versi 1998 (CCS98) yang berlaku sampai tahun 2011[3]. Perkembangan informasi yang ada didalam dunia maya terus berkembang secara ekponensial setiap waktunya. Internet merupakan gudang informasi yang menyimpan banyak pengetahuan, dengan bantuan mesin pencari penguna dengan mudah bisa mendapatkan pengetahuan yang diinginkannya. Kumpulan informasi tersebut memberi peluang untuk melakukan knowledge discovery terhadap koleksi dokumen untuk mendapatkan taksonomi. Untuk itu pada penelitian ini mengusulkan pembuatan taksonomi rekayasa perangkat lunak berdasarkan atas dokumen hasil pencarian mesin pencari sebagai alternatif dalam pembuatan taksonomi. Dengan mengunakan data yang tersedia pada mesin pencari yang merupakan representasi informasi yang ada didalam internet, diharapkan dinamika perubahan pengetahuan dapat terbaca. Dibutuhkan kata kunci pencarian yang sesuai untuk menyeleksi dokumen yang berhubungan dengan rekayasa perangkat lunak dari mesin pencari. mekanisme yang digunakan untuk mendapatkan kata kunci pencarian adalah dengan mengunakan algoritma key phrase identification[4]. Algoritma tersebut membutuhkan kata kunci pembangkit. Koleksi istilah rekayasa perangkat lunak yang terdapat di SWEBOK [1] dan Computing Classification System[3] sebagai kata kunci pembangkit. Dokumen hasil pencarian diekstraksi untuk mendapatkan taksonomi pengetahuan rekayasa perangkat lunak. Taksonomi tersebut didapatkan dengan metode clustering dengan pustaka WEKA. Algoritma clustering yang digunakan dalam pembuatan taksonomi adalah algoritma k-means. Taksonomi tersebut berguna untuk mengetahui kecenderungan yang sedang berlangsung pada bidang rekayasa perangkat lunak terutama yang tersedia World Wide Web, selain itu taksonomi ini dapat lebih mengkarakteristikan perkembangan ilmu rekayasa perangkat lunak pada saat ini. Penelitian ini mencoba mengkelompokan informasi tentang rekayasa perangkat lunak yang tersedia di internet menjadi taksonomi rekayasa perangkat lunak. Penelitian ini mengunakan mesin pencari yang popular digunakan sebagai sumber data untuk mendapatkan kecenderungan rekayasa perangkat lunak yang terjadi saat ini Untuk menyusun taksonomi rekayasa perangkat lunak dari dokumen rekayasa perangkat lunak, masalah-masalah yang akan dikaji adalah menentukan kata kunci untuk mendapatkan dokumen rekayasa perangkat lunak, mengolahan dokumen rekayasa perangkat lunak untuk mendapatkan intisari dokumen, serta menyusun taksonomi rekayasa perangkat lunak.