Konferensi Nasional Sistem dan Informatika 2010; Bali, November 13, 2010 KNS&I09-037 216 ANALISIS DAN IMPLEMENTASI METODE ITEM-BASED CLUSTERING HYBRID PADA RECOMMENDER SYSTEM Ramadhanuz A Djamal, Warih Maharani, dan Angelina Prima Kurniati Fakultas Informatika Institut Teknologi Telkom, Bandung ramadhanuz@gmail.com, wrh@ittelkom.ac.id, dan apk@ittelkom.ac.id ABSTRACT A recommender system is an application to search and recommend items by predicting ratings based on the similarity of user’s characteristic information. Item-Based Clustering Hybrid Method (ICHM) is one of hybrid recommender system that combines the collaborative filtering and content based filtering. The purpose of combination between content based filtering and collaborative filtering in ICHM is to overcome each filtering method shortcomings. ICHM recommender system has another advantage that it can predict new items that have no rating at all. This paper explains about the implementation and result analysis of ICHM applied on film recommendation data of MovieLens.org. The implementation is done based on literature study performed. The analysis is done by comparing Means Absolute Error (MAE) under some testing scenario. The analysis is carried out for two types of cases, which are cold start problem and non-cold start problem. The higher the number of clusters, the lower the MAE would be. c coefficient only affects MAE on non-cold start problem. Keywords: Recommender System, Collaborative Filtering, CorrCF Algorithm, RecTree Method. 1. Pendahuluan Dua pendekatan yang umum digunakan dalam membangun sebuah sistem rekomendasi adalah Content-based Filtering dan Collaborative Filtering [1,7] . Beberapa penelitian telah menyebutkan bahwa pendekatan Content-based Filtering efektif, namun memiliki keterbatasan ketika seorang user meminta rekomendasi suatu item yang memiliki jenis konten yang berbeda dengan items yang pernah dipilih olehnya. Untuk menutupi kekurangan Content-based Filtering tersebut, maka dibangun pendekatan Collaborative Filtering. Pendekatan ini terbukti berhasil dalam beberapa penelitian dan praktis, namun pendekatan ini memiliki kelemahan di saat suatu item masuk dan sama sekali belum ada yang memberi rating, item tersebut tidak akan pernah direkomendasikan ke user mana pun. Maka pendekatan hybrid diusulkan untuk menutupi kekurangan-kekurangan tersebut. Item-based Clustering Hybrid Method (ICHM) adalah salah satu metode yang menggunakan pendekatan hybrid atau menggabungkan kedua pendekatan tersebut. Kelebihan ICHM ini adalah dapat mengatasi masalah rekomendasi untuk item yang baru dan belum di-rating [7] . ICHM membangun Group-rating berdasarkan konten atau atribut yang dimiliki item dan membagi items tersebut menjadi beberapa cluster atau grup. Group-rating ini yang meningkatkan performa dari collaborative filtering dalam fase perhitungan kemiripan. Tulisan ini membahas penerapan ICHM dalam sistem rekomendasi film. Item yang menjadi objek rekomendasi adalah film yang telah di-rating oleh user yang diperoleh dari dataset MovieLens.org. Setelah diterapkan, hasil prediksi rating sistem rekomendasi dievaluasi dengan Mean Absolute Error (MAE). 2. Landasan Teori 2.1 Sistem Rekomendasi Sistem rekomendasi (recommender system) adalah sebuah sistem yang bekerja untuk melakukan pencarian dan mendapatkan rekomendasi berupa informasi, produk, atau layanan yang bersifat personal [7] . Cara pencarian item yang akan direkomendasikan dapat dilakukan berdasarkan kemiripan, baik berupa kemiripan suatu item dengan item lainnya berdasarkan konten atau kemiripan selera suatu user dengan user lain berdasarkan rating yang diberikan pada item. Pada pertengahan 1990 banyak riset tentang sistem rekomendasi untuk menemukan pendekatan-pendekatan baru untuk mengatasi masalah membanjirnya informasi yang tersedia di Internet [1, 3] . Pendekatan sistem rekomendasi yang paling umum digunakan pada sistem rekomendasi adalah pendekatan content-based filtering dan collaborative filtering [12] . 2.2 Content-based dan Collaborative Filtering Pendekatan content-based filtering bekerja dengan mencari kedekatan suatu item yang akan direkomendasikan ke user dengan items yang telah diambil oleh user tersebut sebelumnya berdasarkan kemiripan antar kontennya. Beberapa penelitian membuktikan bahwa pendekatan content-based efektif pada pencarian item berbasis teks berdasarkan topiknya [6] . Namun pendekatan ini memiliki kekurangan, antara lain [1, 6] :