27 27 Preprocesamiento de datos estructurados Structured Data Preprocessing * Claudia L. Hernández G. ** Jorge E. Rodríguez R. Fecha de recepción: 13 de marzo de 2008 Fecha de aceptación: 20 de abril de 2008 Resumen El propósito del preprocesamiento de datos es principalmente corregir las incon- sistencias de los datos que serán la base de análisis en procesos de minería de datos. En el caso de las fuentes de datos estruc- turadas, el propósito no es distinto y pueden ser aplicadas di- versas técnicas estadísticas y de aprendizaje computacional. Con el preprocesamiento de datos se pretende que los datos que van a ser utilizados en tareas de análisis o descubrimiento de conocimiento conserven su coherencia. A lo largo del pre- sente artículo, se realizará la descripción de diferentes técni- cas existentes junto con algunos algoritmos asociados a tareas destacadas de preprocesamiento de datos estructurados como limpieza y transformación. Luego, se hace una revisión de al- gunos algoritmos asociados a las técnicas utilizadas con más frecuencia, lo cual podrá permitir la comparación de su efecti- vidad dependiendo del conjunto de datos utilizado, en trabajos futuros. Palabras clave: preprocesamiento, discretización, minería OLAP, normalización, limpieza, integración, transformación, reducción de la dimensionalidad. * Ingeniera de Sistemas. Candidata a Magíster en Ciencias de la Computación y las Comunicaciones, Universidad Dis- trital Francisco José de Caldas. Correo electrónico: clhernandez@gmail.com ** Ingeniero de Sistemas. Especialista en Telemática. Especialista en Ingeniería de Software. Magíster en Ingeniería de Sistemas. Docente de la Universidad Distrital Francisco José de Caldas. Correo electrónico: jrodri@udistrital.edu.co VINCULOS 8 Book 1.indb 27 04/09/2009 02:50:07 p.m.