Aplicação de Métodos de Extração e Seleção de Atributos para Classificação de Regiões Joanito de Andrade Oliveira Luciano Vieira Dutra Camilo Daleles Rennó Instituto Nacional de Pesquisas Espaciais - INPE Caixa Postal 515 - 12201-970 - São José dos Campos - SP, Brasil. {joanito,dutra,camilo}@dpi.inpe.br Abstract. Good feature extraction and selection methods are crucial for an adequate performance of remote sensing data classification methods. When data dimensionality is very high, a search strategy should be used to select the set of features that gives the minimum classification error or minimize an alternate cheaper criterion related to the classification error. In this paper different search strategies are compared for the case where a region classifier is used. Landsat imagery is first segmented using standard region growing technique. Afterwards a large number of features are extracted from regions, and a smaller set of features is selected by means of three types of search strategy. The set of features selected by each criterion is classified based on minimum Mahalanobis distance and classification accuracy is calculated. As there is no deterministic relation between standard feature selection methods and classification error, is possible to conclude that all search strategies should be used to narrow the number of choices assessments and taking the final decision based on classification error. Keywords: feature extraction, feature selection, region classification. 1. Introdução A evolução da tecnologia de computação, em termos de hardware, bem como o desenvolvimento de algoritmos mais eficientes para manipulação de imagens digitais, tem permitido um número crescente de aplicações de reconhecimento de padrões em sensoriamento remoto. O desenvolvimento de um sistema de reconhecimento de padrões requer: a definição do padrão das classes, um ambiente de aquisição dos dados, a representação do padrão, a extração e seleção de atributos, a análise de agrupamento, o desenvolvimento e aprendizado do classificador, a seleção das amostras de treinamento e teste, e a avaliação do desempenho do classificador (Jain et al., 2000). Pode-se pensar que quanto maior o número de atributos para representar um padrão (classe), maior o poder discriminatório do classificador. Porém, nem sempre isso é verdade. Na prática o que acontece é uma degradação na acurácia dos resultados da classificação com o aumento da dimensionalidade dos dados mantendo-se constante o número de amostras de treinamento. Segundo Jain et al. (2000), existem duas razões para reduzir esta dimensionalidade: diminuir o custo de processamento e aumentar a acurácia da classificação. A seleção de atributos é uma tarefa de difícil realização, pois depende dos dados de entrada, isto é, do domínio da aplicação, assim como do classificador a ser utilizado, por exemplo: paramétrico, não-paramétrico ou redes neurais (Dutra e Huber, 1999). Essa fase é destinada à escolha dos atributos que melhor distinguem as classes previamente selecionadas. A maioria dos métodos de seleção de atributos utiliza princípios estatísticos, ou seja, medidas estatísticas entre os atributos para cada conjunto de classes, selecionando os atributos que contém informações relevantes para a separabilidade das classes. Este trabalho tem por objetivo aplicar métodos de extração e seleção de atributos para classificação de regiões. Atributos de texturas são extraídos das regiões em estudo e métodos de seleção são aplicados a fim de reduzir a dimensionalidade. 4201 Anais XII Simpósio Brasileiro de Sensoriamento Remoto, Goiânia, Brasil, 16-21 abril 2005, INPE, p. 4201-4208.