Abstract— There is a growing need for recognition of digits manuscripts for use in various situations, such as recognition of handwritten postal address digits for automated redirection of letters in the mail, acknowledgment of nominal values in bank checks. Recognition of handwritten digits faces great difficulty in dealing with intra-class variation due to different writing styles, different degrees of inclination of the characters. Optical character recognition systems, also known as OCR, identifying and recognizing printed characters through images, an already widespread functionality in scanners, mobile devices, among others. This paper presents the use of the classifier Optimum- Path Forest (OPF) applied in handwriting recognition digits. A new feature extraction method is proposed using signature of the characters, and the OPF algorithm is used in the classification. According to the results presented, it appears that the detection and recognition of characters are being carried out satisfactorily in the Manhattan distance stood out with an average accuracy of 99.53%, and get training times and test lower than the other methods such as It is the characteristic of OPF method. KeywordsMachine learning techniques, Pattern Recognition, Digital Image Processing, Computer Vision, OCR Applications, Optimum-Path Forest, OPF. I. INTRODUÇÃO OMPUTADORES podem executar muitas operações com um tempo consideravelmente menor que os humanos poderiam fazer. Contudo, nem sempre, essa rapidez é a melhor escolha para resolver um problema. Muitas tarefas com as quais os computadores falham consideravelmente os humanos fazem melhor. Muitas dessas tarefas, nas quais os computadores perdem estão relacionadas à natureza interpretativa e de multiprocessamento do cérebro. Uma maneira simples de caracterizar bem a diferença entre o computador e Homem seria comparar o computador, que é uma máquina serial, com o nosso cérebro, que é altamente paralelo e possui como característica principal a capacidade de aprender coisas [1]. O reconhecimento ótico de caracteres (Optical Character Recognition - OCR) permite que uma máquina possa reconhecer automaticamente um caractere através de um mecanismo óptico. As tentativas da engenharia em reconhecer caracteres impressos, ou manuscritos, iniciaram antes da Segunda Guerra Mundial, mas isso não foi possível até a G. S. Lopes, Instituto Federal de Educação, Ciência e Tecnologia do Ceará (IFCE), Fortaleza, Ceará, Brasil, gustavo.lopes@ppgcc.ifce.edu.br D. C. da S. Vieira, Instituto Federal de Educação, Ciência e Tecnologia do Ceará (IFCE), Fortaleza, Ceará, Brasil, davidclifte@ppgcc.ifce.edu.br A. W. de O. Rodrigues, Instituto Federal de Educação, Ciência e Tecnologia do Ceará (IFCE), Fortaleza, Ceará, Brasil, wendell@ifce.edu.br P. P. Rebouças Filho, Instituto Federal de Educação, Ciência e Tecnologia do Ceará (IFCE), Fortaleza, Ceará, Brasil, pedrosarf@ifce.edu.br década de 50, quando a associação dos Bancos e a Indústria dos serviços financeiros criaram fundos para a pesquisa e desenvolvimento da tecnologia [2,3]. Existem muitos documentos de importância histórica, técnica e econômica que existem somente na forma impressa, como cartas nos correios que precisam ter o CEP reconhecido, cheques de banco onde o seu valor manuscrito e assinatura devem ser identificado, esse processo consome muito tempo e com alta possibilidade de erros. Um sistema OCR pode ajudar a reduzir os custos de digitalização destes documentos. Existem muitas técnicas bem sucedidas de implementação de OCR que vêm sendo aplicadas em áreas como reconhecimento de texto manuscrito, reconhecimento de texto impresso de forma mecânica, e reconhecimento de notas musicais [4-6]. O classificador de padrões OPF (Optimum-Path Forest), foi criado com o intuito de aliar eficiência no processo de treinamento, com eficácia na etapa de classificação dos dados, é um Framework, e também considerado um classificador de abordagem matemática simples e fundamentado em conceitos de Teoria dos grafos [7,8] vem sendo amplamente utilizado em aplicações de reconhecimento de padrões. Classificadores neurais tendem a possuir um desempenho significantemente melhor que outros tipos de classificadores nessa base. Algoritmos convolutivos lideram os registros das melhores taxas de classificação. O trabalho mais bem sucedido utiliza uma associação de redes convolutivas junto com o aumento da base de treinamento utilizando distorções elásticas, tendo obtido uma taxa de erro de 0,27%. Este trabalho propõe uma nova abordagem de extração e classificação de caracteres manuscritos baseado na extração de características usando a assinatura dos caracteres, e propõe a classificação de dígitos manuscritos utilizando o algoritmo de aprendizagem Optimum-Path Forest (OPF) mantendo uma taxa de erro equivalente ou menor que os classificadores atuais [9,10]. II. RECONHECIMENTO ÓPTICO DE CARACTERES Nesta seção é descrito a base de dados utilizada para este estudo, o Mixed National Institute of Standards and Technology (MNIST). Além disto, apresenta a abordagem proposta para extração dos atributos e para a classificação utilizando o método OPF. A. Base de Dados: MNIST O banco de dados Mixed National Institute of Standards and Technology (MNIST) [11], disponível em http://yann.lecun.com/exdb/mnist/. Há 60.000 imagens de formação (algumas dessas imagens de treinamento também podem ser utilizados para fins de validação cruzada), os C Recognition of Handwritten Digits Using the Signature Features and Optimum-Path Forest G. S. Lopes, D. C. da S. Vieira, A. W. O. Rodrigues and P. P. Rebouças Filho IEEE LATIN AMERICA TRANSACTIONS, VOL. 14, NO. 5, MAY 2016 2455