Recuperação de Informação Baseada em Conteúdo Usando Saliências Cristiane de Fátima dos Santos 1 cris_f_santos@yahoo.com.br Célia A. Zorzo Barcelos 1 celiazb@ufu.com.br Marcos Aurélio Batista 2 marcos.4d@uol.com.br 1 Universidade Federal de Uberlândia- 0 xx(34)-3239-4470 2 Universidade Federal de Goiás -0 xx(64)3441-1510 Abstract A recuperação baseada em forma pode ser realizada eficientemente através de saliências, já que este é um descritor robusto invariante à mudanças de escala, translações, rotações, etc. Para se obter as saliências, um método muito eficaz foi proposto recentemente: a Transformada Imagem Floresta (IFT). O objetivo de nosso trabalho é realizar a recuperação de informação baseada em saliência, utilizando a IFT, explorando o balanceamento entre a quantidade de detalhes e a preservação da propriedade de invariância, o que reflete imediatamente nas medidas de precisão x revocação. Alem disso, é objetivo encontrar o melhor valor representante para a saliência. 1. Introdução A recuperação baseada em conteúdo pode ser feita baseada principalmente em três aspectos: cor, forma e textura, sendo que se pode utilizar apenas um destes ou mesmo uma combinação qualquer. Em algumas situações, a forma é o aspecto mais importante [13], sendo que a invariância quanto a transformações é imprescindível: as características de uma forma devem se manter constantes à medida que a imagem é rotacionada, transladada, etc. Descritores baseados em saliência se sobressaem [7][8][13] e podem ser imunes até mesmo a ruídos [6][15]. Enquanto alguns descritores utilizam aproximações, tal qual código da cadeia, aproximações poligonais, BAS (Beam Angle Statistics), dimensão fractal, etc. [2][3][13][18], saliências busca capturar a própria essência da forma, ou seja, suas curvas mais significativas, quantificando-as e referenciando-as através de sua posição relativa. Outros aspectos concernentes à qualidade do descritor podem ser analisados. Por exemplo, a compactabilidade e a separabilidade que são respectivamente a variação do descritor para objetos de uma mesma classe e a variação do descritor quanto a classes distintas [4][15]. No caso de descritores projetados visando recuperação de informação baseada em conteúdo, a preocupação maior deve ser relativa à efetividade que podem propiciar ao sistema CBIR (Content Based Image Retrieval), afinal, deve se garantir que os documentos serão corretamente representados através desse descritor e conseqüentemente recuperados durante as consultas. A medição de quanto o descritor fornece efetividade ao sistema é facilitada através do uso das medidas de precisão e revocação [19]. 2. Saliências da forma Para avaliar se um pixel é de saliência é necessário conhecer sua área de influência sendo que quanto maior o valor atribuído a tal área maior a probabilidade deste pixel ser saliente. Saliências da forma podem ser obtidas através de dilatação exata com propagação de rótulos (EDLP Exact Dilation with Label Propagation) conforme algoritmo proposto por Costa et. al. [5]. Por isso, antes que o algoritmo seja aplicado deve ser feita a rotulação: determina se o conjunto de sementes S, sendo que este conjunto é constituído de todos os N pixels do contorno, um pixel arbitrário bem como uma direção (sentido horário ou anti- horário) são escolhidos, a partir daí o contorno é