Ekstraksi Kata Kunci Otomatis untuk Dokumen Berbahasa Indonesia menggunakan metode Genitor-plus-Extractor (GenEx) Gregorius Satia Budhi 1 , Agustinus Noertjahyana 2 , Risky Yuniarto Susilo 3 1, 2, 3) Teknik Informatika Universitas Kristen Petra Surabaya E-Mail: greg@petra.ac.id, agust@petra.ac.id Abstrak Ekstraksi Kata Kunci Otomatis adalah sebuah aplikasi yang digunakan untuk menghasilkan sebuah daftar keyphrase / kata kunci secara otomatis. Algoritma utama yang digunakan adalah algortima GenEx yang dibuat oleh Turney, dengan beberapa penyesuaian karena digunakan untuk ekstraksi keyphrase dari artikel berbahasa Indonesia. Penyesuaian dilakukan pada proses stemming pada bagian Extractor dengan menggantinya mengunakan algoritma Porter Stemmer for Bahasa Indonesia yang dibuat oleh Tala. Penyesuaian perlu dilakukan karena kata dalam bahasa Indonesia memiliki tiga macam imbuhan (prefiks, infiks dan suffiks) sementara kata dalam bahasa Inggris hanya memiliki imbuhan dibelakang (suffiks). GenEx adalah algoritma yang memanfaatkan Algortima Genetika (Genitor) untuk membentuk sekelompok parameter yang digunakan saat mengekstrak kata kunci dari sebuah artikel didalam proses Extractor. Hasil pengujian nilai recall dari keyphrase yang di- generate terhadap kata kunci dari author bernilai rata - rata 60%. Sementara hasil pengujian oleh responden menunjukkan bahwa 95% responden menyatakan bila keyphrase yang di-generate dapat mewakili artikelnya. Kedua hasil menunjukkan bahwa aplikasi ini telah berhasil menggenerate kata kunci (keyphrase) yang sesuai dan dapat mewakili artikel yang diproses. Kata kunci: Ekstraksi Kata Kunci Otomatis, Kata kunci, Algoritma GenEx, Porter Stemmer for Bahasa Indonesia, Dokumen Berbahasa Indonesia Abstract Automatic Keyword Extraction is an application used to generate a list of keyphrases / keywords automatically. The main algorithm that is used is GenEx by Turney, with some adjustments because it is used for keyphrase extraction from articles in Indonesian language. Adjustments are made on the process of stemming inside the Extractor part. It is replaced with “Porter Stemmer for Bahasa Indonesia” algorithm by Tala. Adjustments need to be made because the words in the Indonesian language has three kinds of affixes (prefix, infix and suffix) while the English word has only suffixes. GenEx is an algorithm that uses Genetic algorithms (Genitor) to form a group of parameters that are used when extracting keywords from an article in the Extractor. The test results of recall value for keyphrase that are generated by the application divided by the number of keyword author worth the average of 60%. While the results of testing by the respondents indicated that 95% of respondents said if the keyphrase that are generated could represent the article. Both results indicate that the application has been successfully generating the keywords (keyphrases) that are suitable and can represent the processed article. Key words: Automatic Keyphrase Extraction, Keyphrase, GenEx algorithm, Porter Stemmer for Bahasa Indonesia, Indonesian Language Document