Uso de ontologias para gerenciamento e acesso a documentos na web Marcirio Silveira Chaves Renata Vieira Sandro Rigo Universidade do Vale do Rio dos Sinos - UNISINOS {marcirio, renata, rigo}@exatas.unisinos.br Resumo A maior parte dos documentos disponíveis na Web hoje está identificado apenas com informações de exibição. Diante da necessidade de prover meios mais adequados para possibilitar acesso – mediado por máquina – ao repositório de informações disponível na Web, é necessário a utilização da tecnologia XML, que possibilita a exploração da semântica dos conteúdos desses documentos. Este trabalho apresenta um estudo sobre técnicas para organização, apresentação e busca de informações na Internet e explora um exemplo de aplicação destas técnicas. A tecnologia XML, juntamente com RDF e RDF Schema, é utilizada para fornecer um suporte estrutural para a representação das informações. A utilização de uma ontologia serve de base para um acesso inteligente na busca de informações. Os resultados alcançados permitem a exibição de documentos na Web em diversos formatos e a obtenção de respostas otimizadas a consultas na base de dados. A próxima etapa consiste na construção de uma interface em linguagem natural para auxiliar na elaboração de uma consulta. Palavras-chaves: Ontologia, RDF e XML 1. Introdução Este artigo é um estudo sobre a aplicação de técnicas para organização, apresentação e busca de informações através da Internet. O estudo de caso é o documento de caracterização das disciplinas que é constituído de informações sobre os cursos de graduação de uma universidade, tais como: nome da disciplina, conteúdo e bibliografia, entre outras. A tecnologia estudada é XML (eXtensible Markup Language), que está rapidamente tornado-se uma das tecnologias mais amplamente adotadas para intercâmbio e representação de informações na World Wide Web. Para organizar e produzir um acesso inteligente às informações é apresentada uma ontologia com os termos mais relevantes para o domínio universidade e para a aplicação do documento de estudo de caso. Além da ontologia, o mesmo documento é representado na forma de RDF que segundo [PIT00], é a base para o processamento de metadados e permite a exploração de consultas através destes metadados. A exibição dos documentos é tratada com folhas de estilo XSL que permite a apresentação das partes de um documento que interessem a determinados usuários e atende a necessidade dos diferentes departamentos de uma universidade. Este artigo está organizado como segue. A seção 2 apresenta o documento de caracterização das disciplinas. A seção 3 introduz a tecnologia XML, a gramática DTD e a XSL. A seção 4 descreve a consulta a documentos XML. Na seção 5 é apresentada a semantic web através da ontologia para o documento de estudo de caso, o aplicativo XML RDF, as consultas em RDF e o esquema RDF(S). Finalmente, na seção 6 é descrita a conclusão e a contribuição deste artigo. 2. Caracterização das disciplinas Nosso estudo de caso é baseado no documento de caracterização das disciplinas de uma universidade e apresenta as informações relacionadas a cada disciplina dos cursos de graduação oferecidos. Diante de um contexto tão amplo de informações optou-se por organizar as mesmas de forma semântica e estruturada para facilitar e possibilitar a extração de dados relacionados, ou seja, busca-se permitir consultas do tipo: em quais disciplinas o conteúdo qualidade de