Composição de Modelos em Eletrofisiologia Cardíaca Ely Edison Matos 1 , Fernanda Campos 1,2 , Regina Braga 1,2 , Rodrigo Weber dos Santos 1,3 1 Mestrado em Modelagem Computacional 2 Núcleo de Pesquisa em Qualidade de Software (NPQS) 3 Laboratório de Fisiologia Computacional (FISIOCOMP) 1,2,3 Universidade Federal de Juiz de Fora (UFJF), Brasil Resumo - Nossa pesquisa é focada no uso de ontologias para enriquecer semanticamente modelos de células. Neste artigo introduzimos a Cell Component Ontology – CelO, uma ontologia expressa em OWL-DL. Esta ontologia captura tanto a estrutura do modelo de uma célula quanto as propriedades dos seus componentes funcionais. CelO é utilizada em uma arquitetura orientada a serviços, o framework CelOWS, para descrever, realizar inferências e consultar modelos CellML. O objetivo principal da arquitetura é melhorar o reuso e a composição de modelos existentes e permitir a validação semântica de novos modelos. Palavras chaves: Biologia Sistêmica, Modelos Celulares, Ontologias. Abstract - Our research focus on the use of ontologies to enrich the construction of new cell models. In this paper we introduce the Cell Component Ontology - CelO, an ontology expressed in OWL-DL. This ontology captures both the structure of a cell model and the properties of functional components. We are using this ontology in a Web project CelOWS where the use of CelO allows describing, reasoning, querying and composing CellML models. It aims to improve the reuse and composition of existent models and allow semantic validation of new models. Key-words : Systems Biology, Celular Models, Ontologies. Introdução A Bioinformática tem contribuído para a remodelagem das ciências da vida, porém, para progressos futuros, será necessário o estudo dos sistemas biológicos como um todo, incluindo a compreensão do funcionamento dos órgãos e dos sistemas associados. A Biologia Sistêmica (tradução adotada para Systems Biology) [1] objetiva desenvolver o entendimento em nível sistêmico dos sistemas biológicos, adotando uma abordagem orientada a sistemas para descrever os processos dinâmicos dentro e entre as células biológicas. Neste contexto, para que um modelo possa ser simulado computacionalmente, duas questões importantes devem ser tratadas. A primeira se refere à própria representação do modelo. Embora diagramas, descrição textual e equações possam ser usadas na publicação dos modelos, elas não só estão sujeitas aos erros tipográficos como também à falta de definição das condições iniciais ou de contorno necessárias à simulação. A segunda questão está relacionada à implementação. A necessidade de aplicar métodos numéricos avançados atua como fator limitante para o efetivo uso e estudo do modelo. Estas questões incentivaram o desenvolvimento da linguagem CellML (Cell Markup Language) [2], uma linguagem de marcação criada especificamente para representação de modelos biológicos. Baseada na linguagem XML (eXtensible Markup Language) [3], CellML especifica elementos que podem ser usados para representar um modelo de maneira formal, sem ambigüidades, legível por humanos e processável por máquina. As equações matemáticas são representadas em MathML (Mathematical Markup Language) [4], o que as torna independentes de uma implementação específica. CellML, no entanto, não é totalmente adequada para o processo de criação de novos modelos, uma vez que não provê mecanismos de anotação que facilitem o reuso e modificação de novos componentes. Outra questão importante está associada à validação do modelo descrito em CellML. Por ser baseada em XML, a validação do modelo é eminentemente sintática. Através do uso de DTD 1 ou de XML Schemas [5] o modelo pode ser validado quanto a erros de sintaxe e em relação à aderência à especificação CellML. Porém, questões 1 DTDs (Document Type Definition) estabelecem a gramática válida em um documento XML