Estudio de la influencia de las medidas de complejidad de los datos en los Sistemas de Clasificaci´on Basados en Reglas Difusas: An´alisis de la Raz´on Discriminante de Fisher Juli´an Luengo 1 Salvador Garc´ıa 1 Jos´e Ram´on Cano 2 Francisco Herrera 1 1 Dept. CCIA, ETSIIT, Univ. Granada, Granada, 18071, Espa˜ na, {julianlm,salvagl,herrera}@decsai.ugr.es 2 Dept. Ciencias de la Computaci´on, CPS, Univ. Ja´en, Linares, 23700, Espa˜ na, jrcano@ujaen.es Resumen El uso de Sistemas de Clasificaci´on Basa- dos en Reglas Difusas es bien conocido y tiene multitud de aplicaciones actualmente. No obstante, los problemas de clasificaci´on pueden ser complejos, y esta complejidad ha sido tipificada y medida por diversos autores. La capacidad de predicci´on de un clasificador, y por tanto de un Sistema de Clasificaci´on Basado en Reglas Difusas, posee una fuerte dependencia con la complejidad inherente de los datos usados. En este trabajo presentamos un estudio pre- liminar sobre el comportamiento de los sis- temas de clasificaci´on basados en reglas di- fusas para la medida de complejidad de- nominada ”raz´on discriminante de Fisher”. Queremos estudiar en que medida las me- didas de complejidad nos pueden apor- tar conocimiento a priori sobre el compor- tamiento de los sistemas basados en reglas di- fusas para estos problemas. Para ello comen- zamos con esta primera medida y con un con- junto de bases de datos artificiales que se han generado para disponer de valores de la me- dida de Fisher en todo su rango, que nos permiten extraer unas primeras conclusiones y plantear diferentes trabajos a realizar de cara a tener un completo estudio para esta medida. Palabras Clave: Clasificadores, Medidas de Complejidad, Medidas de Solapamiento, Sis- temas de Clasificaci´on Basados en Reglas Di- fusas. 1 INTRODUCCI ´ ON Los Sistemas de Clasificaci´on Basados en Reglas Difusas (SCBRD) [4] son m´etodos de clasificaci´on que emplean reglas difusas para representar el conocimiento. Los SCBRDs se encuentran muy ex- tendidos en la actualidad, con numerosas aplicaciones y estudios de su comportamiento y efectividad [9]. En la literatura especializada existen precedentes re- cientes que intentan caracterizar los datos sobre los que trabaja un m´etodo de clasificaci´on utilizando las llamadas medidas de complejidad [1, 8]. Las medi- das de complejidad se han aplicado en an´alisis simi- lares para algunos Sistemas de Clasificaci´on que toman como base las medidas de Ho y Basu[1]. Entre ellos podemos encontrar selecci´on de caracter´ısticas [6] y algoritmos de inducci´on de reglas[11, 3]. anchez et al. [16] analizan el efecto de la complejidad de datos en un clasificador K-Vecinos m´as Cercanos. Sin em- bargo, no se ha aplicado ning´ un an´alisis de este tipo a los SCBRDs. Para efectuar este estudio preliminar utilizaremos una medida de complejidad para el solapamiento de las clases [8]: La raz´on discriminante de Fisher. Quer- emos analizar la relaci´on existente entre los resulta- dos obtenidos por los SCBRD y los valores de esta medida de solapamiento. Para ello, hemos analizado el comportamiento de modelos SCBRDs sencillos con- siderando conjuntos de datos generados de acuerdo a la medida establecida en [8]. A su vez, lo hemos com- parado con un algoritmo cl´asico de clasificaci´on como es C4.5 [15], de forma que sea posible ver las diferencias entre modelos de clasificaci´on de diferentes familias. Esta contribuci´ on se organiza de la siguiente manera. En la Secci´on 2 se describen los SCBRDs, y en partic- ular el modelo usado en nuestro estudio. En la Secci´on 3 se define y describe la medida de solapamiento que emplearemos. Asimismo, en la Secci´on 4 se establece el marco experimental y los resultados obtenidos. Fi- ESTYLF08, Cuencas Mineras (Mieres - Langreo), 17 - 19 de Septiembre de 2008 XIV Congreso Español sobre Tecnologías y Lógica fuzzy 257