1 Reglas heurísticas: Alternativa para la depuración de reglas de asociación interesantes Mirna López Espindola 1 , Antonio Martínez Alcántara 2 y Adolfo Guzmán Arenas 3 1 Colegio de Postgraduados ISEI-Cómputo Aplicado, Km 36.5 Carretera México- Texcoco, Montecillo, Municipio de Texcoco, Edo. de México 56230, México. sysmyr@yahoo.com.mx 2 Colegio de Postgraduados ISEI-Cómputo Aplicado, Km 36.5 Carretera México- Texcoco, Montecillo, Municipio de Texcoco, Edo. de México 56230, México. antonio@colpos.colpos.mx 3 CIC, Instituto Politécnico Nacional, Av. Juan de Dios Batís s/n, esquina con Miguel Otón de Mendizábal, México, D.F., 07738. México aguzman@cic.ipn.mx Resumen. El almacenamiento de información en grandes bases de datos dificulta la extracción de datos útiles o interesantes para un usuario y un objetivo específico. El objetivo del descubrimiento de información en bases de datos (KDD) es la obtención de información útil mediante el proceso de minería de datos. Una parte de tal proceso, es la depuración de información, marco en el cual se sitúa el presente trabajo. Tal depuración contempla varias formas de representar la información y diversos métodos para llevarla a cabo. Nosotros utilizaremos reglas de asociación para representar la información y proponemos un conju nto de reglas heurísticas para su depuración. Las reglas heurísticas fueron obtenidas con base en los elementos que, según diversas definiciones del concepto “interesante”, identifican cuando y en que circunstancias algo es interesante. Proponemos un algoritmo para indicar el orden y circunstancias en que cada regla heurística se aplicará. Finalmente, se realiza un ejemplo de la aplicación de nuestro algoritmo y se comprarán los resultados a los obtenidos con el algoritmo de [28]. Palabras clave: Interesante, regla de asociación, regla heurística. 1. Introducción La búsqueda de información interesante, representada en forma de reglas de asociación, implica diversos métodos ([1], [2], [15], [16], [18], [19], [20], [21], [22], [28], [30] y [31]). En el presente trabajo se definen y utilizan un conjunto de reglas heurísticas cuya parte fundamental de su formulación es comprender que implica el que la información en una base de datos sea considerada como interesante, por lo que buscaremos definir el concepto desde dos perspectivas: la filosófica y la psicológica, ya que estas áreas