ESCUELA SUPERIOR POLITÉCNICA DEL LITORAL CENTRO DE INVESTIGACIÓN CIENTÍFICA Y TECNOLÓGICA Recomendaciones con Filtrado Colaborativo Basado en Usuario y en Ítem Aplicando el Paradigma Map-Reduce Mervyn Macias 1 Freddy De la Rosa 2 Cristina Abad 3 Facultad de Ingeniería Eléctrica y Computación Escuela Superior Politécnica del Litoral Campus “Gustavo Galindo V.” Km. 30.5, Vía Perimetral, Apartado 09-01-5863, Guayaquil, Ecuador www.espol.edu.ec merv_mm@hotmail.com 1 , freddyfdelarosa@gmail.com 2 , cristina.abad@gmail.com 2 Resumen Un sistema de recomendaciones es un tipo específico de filtro de información que ayuda al usuario a seleccionar ítems de su interés tales como películas, músicas, páginas Web, revistas, libros, etc. Actualmente, los sitios Web que prestan estos servicios requieren que la gran cantidad de información recibida por todas las acciones implícitas o explícitas de millones de usuarios sobre millones de ítems, sea procesada de una manera rápida y con la menor infraestructura posible, esto con el fin de obtener rápidos y mejores índices de preferencias útiles y a menor costo El presente trabajo tiene como objetivo presentar dos alternativas de procesamiento de recomendaciones de ítems musicales basados en las preferencias implícitas de los usuarios y utilizando un modelo de programación masiva y escalable dentro del framework de Hadoop como un sistema de la ejecución de tareas en paralelo y tolerante a fallos. Palabras claves: Filtrado colaborativo, Sistema de archivos distribuidos Hadoop (HDFS), Mahout, coeficiente correlación de Pearson. Abstract A system of recommendations is a specific type of filter of information that helps the user to select such articles of his (her, your) interest as movies, musical, web pages, magazines, books, etc. Nowadays, the web sites that give these services need that the great quantity of information got for all the implicit or explicit actions of million users on million articles, is tried in a rapid way and with the minor possible infrastructure, this in order to obtain rapid and better indexes of useful preferences and to minor cost The Present work has as aim to present two alternatives of processing recommendation of musical articles based on the implicit preferences of the users and using a model of massive and scalable programming inside Hadoop's framework as a system of the execution of tasks in parallel and tolerantly to failures. Keywords: Colaborative filtering, Hadoop Distributed File System (HDFS), Mahout, coefficient Pearson's correlation.