Recuperação de Informação Baseada em Conteúdo Usando Saliências Cristiane de Fátima dos Santos 1 cris_f_santos@yahoo.com.br Célia A. Zorzo Barcelos 1 celiazb@ufu.com.br Marcos Aurélio Batista 2 marcos.4d@uol.com.br 1 Universidade Federal de Uberlândia- 0 xx(34)-3239-4470 2 Universidade Federal de Goiás -0 xx(64)3441-1510 Abstract A recuperação baseada em forma pode ser realizada eficientemente através de saliências, já que este é um descritor robusto invariante à mudanças de escala, translações, rotações, etc. Para se obter as saliências, um método muito eficaz foi proposto recentemente: a Transformada Imagem Floresta (IFT). O objetivo de nosso trabalho é realizar a recuperação de informação baseada em saliência, utilizando a IFT, explorando o balanceamento entre a quantidade de detalhes e a preservação da propriedade de invariância, o que reflete imediatamente nas medidas de precisão x revocação. Alem disso, é objetivo encontrar o melhor valor representante para a saliência. 1. Introdução A recuperação baseada em conteúdo pode ser feita baseada principalmente em três aspectos: cor, forma e textura, sendo que se pode utilizar apenas um destes ou mesmo uma combinação qualquer. Em algumas situações, a forma é o aspecto mais importante [13], sendo que a invariância quanto a transformações é imprescindível: as características de uma forma devem se manter constantes à medida que a imagem é rotacionada, transladada, etc. Descritores baseados em saliência se sobressaem [7][8][13] e podem ser imunes até mesmo a ruídos [6][15]. Enquanto alguns descritores utilizam aproximações, tal qual código da cadeia, aproximações poligonais, BAS (Beam Angle Statistics), dimensão fractal, etc. [2][3][13][18], saliências busca capturar a própria essência da forma, ou seja, suas curvas mais significativas, quantificando-as e referenciando-as através de sua posição relativa. Outros aspectos concernentes à qualidade do descritor podem ser analisados. Por exemplo, a compactabilidade e a separabilidade que são respectivamente a variação do descritor para objetos de uma mesma classe e a variação do descritor quanto a classes distintas [4][15]. No caso de descritores projetados visando recuperação de informação baseada em conteúdo, a preocupação maior deve ser relativa à efetividade que podem propiciar ao sistema CBIR (Content Based Image Retrieval), afinal, deve se garantir que os documentos serão corretamente representados através desse descritor e conseqüentemente recuperados durante as consultas. A medição de quanto o descritor fornece efetividade ao sistema é facilitada através do uso das medidas de precisão e revocação [19]. 2. Saliências da forma Para avaliar se um pixel é de saliência é necessário conhecer sua área de influência sendo que quanto maior o valor atribuído a tal área maior a probabilidade deste pixel ser saliente. Saliências da forma podem ser obtidas através de dilatação exata com propagação de rótulos (EDLP – Exact Dilation with Label Propagation) conforme algoritmo proposto por Costa et. al. [5]. Por isso, antes que o algoritmo seja aplicado deve ser feita a rotulação: determina se o conjunto de sementes S, sendo que este conjunto é constituído de todos os N pixels do contorno, um pixel arbitrário bem como uma direção (sentido horário ou anti- horário) são escolhidos, a partir daí o contorno é