Extens˜ ao do XQuery com opera¸ c˜oesdeselec¸c˜ ao para a constru¸c˜ ao interactiva das perguntas Alda Lopes Gan¸ carski 1 and Pedro Rangel Henriques 2 1 Universidade do Minho, Braga, Portugal email: aldalopes@di.uminho.pt Membro do LIP6, Universit´ e Paris 6, Paris, Fran¸ca 2 University do Minho, Braga, Portugal email: prh@di.uminho.pt Abstract. XQuery ´ e a linguagem de interroga¸c˜ao proposta pelo W3C para XML usando restri¸c˜oes estruturais e sobre o conte´ udo.XQueryest´a a ser complementado com a linguagem Full-Text para realizar opera¸c˜oes sobre textos, tratando-os como uma sequˆ encia de palavras, sinais de pontua¸c˜ao e espa¸cos. Dada a natureza complexa das perguntas estru- turadas do XQuery, prop˜oe-se, neste artigo, uma extens˜ao para permi- tir a selec¸ c˜ao do subconjunto interessante de elementos de cada resul- tado interm´ edio das perguntas. Os resultados interm´ edios s˜ao, portanto, acess´ ıveis ao utilizador durante a constru¸c˜ao das perguntas, o que torna mais f´acil obter o resultado desejado. As opera¸c˜oes de selec¸c˜ao s˜ao for- malmente definidas, estendendo a gram´atica do XQuery e definindo novas fun¸c˜oes. Estas defini¸c˜oes podem ser usadas para construir um sistema de processamento adequado. 1 Introdu¸ c˜ ao O XQuery [4] ´ e a proposi¸ c˜ ao do W3C como linguagem de interroga¸ c˜ ao padr˜ ao para XML. Esta linguagem utiliza, entre outras fun¸ c˜ oes, a defini¸ c˜ ao de caminhos (paths), atrav´ es da linguagem XPath [3], para aceder a elementos ou atributos dos documentos. Surgiram, entretanto, trabalhos que estendem estas linguagens com opera¸ c˜ oes de similaridade textual da Recupera¸ c˜ ao de Informa¸ c˜aotradicional [2], propondo m´ etodos de c´ alculo de relevˆ ancia, como os apresentados em [5]. Uma opera¸ c˜ ao de similaridade textual consiste em verificar se um texto aborda um assunto expresso em linguagem natural. O resultado dessa verifica¸ c˜ ao ´ ea relevˆ ancia do texto, normalmente um valor no intervalo [0, 1]. O W3C prop˜oe a linguagem Full-Text como um complemento ao XQuery e ao XPath que inclui a possibilidade de associar um score (ou relevˆ ancia) a uma express˜ ao que verifica se uma dada frase existe no conte´ udo de um elemento ou atributo. O c´ alculo da relevˆ ancia fica a cargo da aplica¸ c˜ ao. Contudo, a dificuldade na constru¸ c˜ ao das perguntas estruturadas levou ` a defini¸ c˜ ao da linguagem de interroga¸ c˜ ao interactiva IXDIRQL [6]. Esta linguagem tem por base o XPath, estendendo-o, n˜ ao s´ o com opera¸ c˜ oes de similaridade