EXTRAÇÃO DE CARACTERÍSTICAS PARA PALAVRAS MANUSCRITAS BASEADA EM CONCEITOS DA TEORIA DE CONJUNTOS FUZZY N. R. Gomes 1 , L. L. Lee Departamento de Comunicações Faculdade de Engenharia Elétrica e Computação - UNICAMP Campinas, São Paulo - 130870, Brasil 1 Pesquisa realizada com suporte financeiro da FAPESP. ABSTRACT Este artigo apresenta um método para extração de características de palavras manuscritas com base na teoria de conjuntos fuzzy. Nesse método, após efetuados os processos de segmentação e de extração de características, uma palavra manuscrita é representada por uma seqüência ordenada de segmentos de linha. Para cada um desses segmentos são calculados valores de pertinência a conjuntos fuzzy representando diferentes tipos de segmentos de linha curva e de linha reta. A posição dos segmentos de linha em uma letra ou em parte de uma letra resultante do processo de segmentação da palavra é também avaliada por meio de conjuntos fuzzy. Os Modelos Ocultos de Markov Fuzzy são empregados para classificar as palavras manuscritas. Uma base de dados composta por palavras manuscritas extraídas de cheques é utilizada para testar o sistema de reconhecimento de palavras. 1. INTRODUÇÃO Muitos pesquisadores têm tratado o problema de reconhecimento de manuscritos impondo restrições ao vocabulário e/ou a quantidade de variações de estilos de escrita, e aumentando o número de amostras de palavras para treinamento do sistema [6][11]. Por exemplo, treinando um sistema de reconhecimento com um número grande de amostras para um número reduzido de variações de estilos de escrita pode-se melhorar significativamente o desempenho do sistema. No entanto, alguns sistemas de reconhecimento processam uma grande variedade de estilos de escrita, tornando difícil o armazenamento de uma quantidade adequada de amostras de treinamento capaz de cobrir essa variedade de estilos. Uma possível solução apresentada na literatura, é a extração de características que possam representar adequadamente palavras manuscritas, apesar da variabilidade de estilos. O objetivo deste artigo é propor um método para extrair características que sejam menos susceptíveis a variação de estilos de escrita utilizando a teoria de conjuntos fuzzy. Como um resultado, tal abordagem deve permitir treinar um sistema de reconhecimento com um número reduzido de amostras. Este artigo está organizado da seguinte forma: Na seção 2 é apresentada uma visão geral do sistema desenvolvido; Na seção 3 é explicado o pré-processamento e o algoritmo de segmentação de palavras manuscritas; A seção 4 é dedicada a extração de características e aos vetores de características. Na seção 5 é apresentado nosso procedimento de classificação. Finalizando, na seção 6 é mostrado alguns resultados experimentais e as comentários finais a respeito do trabalho desenvolvido. 2. VISÃO GERAL DO SISTEMA A idéia básica em nosso sistema de reconhecimento diz respeito a transformação de uma palavra manuscrita em uma seqüência ordenada de linhas curvas, linhas retas e loops a fim de reduzir a variação de estilos de escrita. O sistema de reconhecimento proposto é composto de duas fases: uma fase de treinamento e uma fase de reconhecimento. Tanto na fase de treinamento como na fase de reconhecimento a imagem de uma palavra manuscrita é pré-processada, segmentada e suas características são extraídas. Os procedimentos incluídos no pré-processamento são bem conhecidos na literatura, nominalmente, suavização, rotação e correção de inclinação [3]. Após o pré-processamento a imagem de uma palavra é segmentada em caracteres. O resultado final dessa operação são letras e/ou partes de letras, ambas denominadas genericamente neste artigo como segmentos da palavra. No procedimento de extração de características cada segmento da palavra é decomposto em segmentos de linha, para os quais são calculados valores de pertinência a conjuntos fuzzy representando diferentes tipos de segmentos de linha curva e de linha reta. Dessa forma, é possível representar uma palavra como uma seqüência ordenada de linhas, sendo que cada uma dessas linhas apresenta um valor específico de pertinência a cada conjunto fuzzy. A referida seqüência é processada durante o procedimento de classificação por Modelos Ocultos de Markov Fuzzy (FHMMs) [11]. A palavra a ser reconhecida é classificada na classe de palavras que apresentar o maior valor de similaridade conforme um algoritmo de Viterbi Fuzzy [11]. 3. PRÉ-PROCESSAMENTO Neste trabalho as operações de pré-processamento visam a correção de rotação e correção de inclinação de palavras manuscritas. Antes e após efetuar essas correções, as imagens de palavras manuscritas sofrem um processo de suavização com objetivo de reduzir ruídos [3][7]. O algoritmo de correção de rotação faz uso do ângulo ϕ entre a linha de base da palavra e o eixo horizontal como é ilustrado na Figura 1. O ângulo ϕ é usado para normalizar a linha de base da palavra, fazendo-a paralela ao eixo horizontal. O algoritmo desenvolvido [7] para