376 Herramienta para el Descubrimiento de Reglas de Predicción en Educación basada en web Cristóbal Romero Morales Departamento de Informática Campus de Rabanales 14071 Córdoba 957-218630 cromero@uco.es Sebastián Ventura Soto Departamento de Informática Campus de Rabanales 14071 Córdoba 957-218349 sventura@uco.es Carlos de Castro Lozano Departamento de Informática Campus de Rabanales 14071 Córdoba 957-211020 cdecastro@uco.es RESUMEN En este artículo se va a describir una herramienta específica que se ha desarrollado para facilitar la realización del proceso de descubrimiento de conocimiento sobre los datos de utilización de los usuarios de Sistemas Hipermedia Adaptativos para Educación basada en Web (SHAEW). La información descubierta se va a presentar en forma de reglas de predicción que además de ser comprensibles, muestran relaciones importantes entre dichos datos. Utilizando este conocimiento el profesor o autor de los cursos de tipo SHAEW puede tomar decisiones sobre modificaciones para mejorar el funcionamiento de los cursos. Palabras Clave minería de datos, educación basada en web, reglas de predicción. 1. INTRODUCCIÓN En la actualidad existen multitud de herramientas tanto comerciales como de libre distribución para la realización de diferentes tareas de minería de datos, principalmente el descubrimiento de reglas. De entre todas ellas se pueden destacar DBMiner [5] y Weka [4] por ser sistemas de dominio público muy populares, tener un entorno gráfico integrado y permitir realizar casi todas las tareas de minería de datos. El principal inconveniente que presentan estas herramientas es que son complejas de manejar para una persona no experta en minería de datos, además de que al ser de propósito general no se puede realizar un tratamiento específico del conocimiento de dominio en particular como el de los SHAEWs [1]. Debido a estos problemas, se ha desarrollado una herramienta específica que se ha denominado EPRules (Education Prediction Rules) con el objetivo de facilitar el proceso de descubrimiento de reglas de predicción en sistemas educativos basados en web [3]. Se ha implementado en el lenguaje de programación Java y está orientada para ser utilizada por el profesor o autor del curso. Su principal característica es su especialización en educación, utilizando atributos concretos, filtros y restricciones específicas para datos de utilización de los ASWE. También permite añadir nuevos algoritmos de descubrimiento de reglas y nuevas medidas de evaluación de reglas, con sólo modificar los ficheros de configuración. A continuación, se va a describir el proceso de descubrimiento de información implementado en EPRules, posteriormente se describe el interfaz de dicha herramienta y finalmente las pruebas realizadas y las principales conclusiones. 2. PROCESO DE DESCUBRIMIENTO Utilizando esta herramienta el profesor o autor del curso puede realizar todo el proceso de descubrimiento de conocimiento, desde seleccionar y preprocesar los datos de utilización de los cursos, hasta visualizar las reglas descubiertas al aplicar los algoritmos de minería de datos (ver Figura 1). Las reglas de predicción tienen el formato: Si Atributo=Valor ... Entonces Atributo=Valor, y se van a utilizar un conjunto de medidas objetivas y subjetivas para evaluar su interés, como son: soporte, confianza, ganancia, entropía, j-media, novedad, certeza, etc [5]. Figure 1. Proceso de Descubrimiento de Conocimiento. El proceso de descubrimiento comienza siempre con la selección de la base de datos donde se encuentran almacenados los datos de utilización ya preprocesados del curso que se desea utilizar. Si los datos no se encuentran preprocesados, se debe previamente preprocesar los ficheros logs capturados por el curso y almacenarlos en una base de datos. A continuación se debe seleccionar el algoritmo de descubrimiento de conocimiento aplicar y sus parámetros específicos, además de las restricciones tanto objetivas como subjetivas que se desean que cumplan las reglas descubiertas. Tras finalizar la ejecución del algoritmo, se visualiza el conjunto de reglas de predicción descubiertas: los elementos que forman el antecedente y consecuente de la regla, así como las medidas de evaluación de cada regla y se determina si el conjunto de reglas descubiertas son o no interesantes, tanto por su número, como por su calidad respecto a las diferentes medidas, como por su significado semántico. Entonces se decide o bien utilizar el conjunto de reglas o un subconjunto de las reglas descubiertas, si se consideran suficientemente interesantes para tomar decisiones sobre posibles modificaciones a realizar en el curso, o bien se vuelve a aplicar el algoritmo con distintos parámetros o restricciones para descubrir un conjunto de reglas más interesante que el actual. Todo este proceso se realiza de una forma directa desde la herramienta gráfica EPRules desarrollada específicamente para el problema de descubrimiento de reglas de predicción en SHAEWs.