ISBN: 84-9769-160-1 241 XXIV Congreso Anual de la Sociedad Española de Ingeniería Biomédica • Pamplona, 6, 7, 8 de noviembre de 2006 Integración semántica y estandarización de datos clínicos basada en arquetipos D. Moner 1 , J. A. Maldonado 1 , D. Boscá 1 , J. T. Fernández 2 , C. Angulo 1 , P. J. Vivancos 2 , M. Robles 1 1 Grupo de Informática Biomédica, Universidad Politécnica de Valencia, Valencia, España, {damoca, jamaldo, diebosto, cangulo, mrobles}@upv.es 2 Departamento de Informática y Sistemas, Universidad de Murcia, Murcia, España, {jfernand, pedroviv}@um.es Resumen Una de las necesidades básicas de cualquier profesional sanitario es tener acceso al registro de todos los datos clínicos disponibles de sus pacientes. Cuando esta información está en soporte informático (Historia Clínica Electrónica o HCE) normalmente está distribuida por diversos sistemas autónomos y heterogéneos cuya interopeabilidad es difícil de conseguir. La arquitectura del modelo dual ha aparecido como una nueva propuesta para obtener una representación homogénea de la HCE con una separación clara entre la información (representada por un modelo de referencia) y el conocimiento (representado por un modelo de arquetipos). Esta arquitectura está originalmente pensada para la implantación de nuevos sistemas de información sanitarios pero también puede utilizarse como base de un sistema para la integración y estandarización de información. Con este objetivo se ha implementado LinkEHR-Ed, una herramienta para el desarrollo de arquetipos como elementos de integración y normalización de fuentes de datos heterogéneas y no estandarizadas. 1. Introducción El intercambio de información entre profesionales sanitarios o entre sistemas informáticos es hoy en día un proceso crítico para el sector sanitario. Debido a la especial sensibilidad de los datos clínicos y a sus restricciones éticas y legales, en este intercambio se debe evitar cualquier tipo de error de interpretación de los datos. En este escenario aparecen dos problemas principales. Por un lado, en muchos hospitales no existe un sistema de información unificado. La información sanitaria se encuentra distribuida entre sistemas heterogéneos y autónomos cuya interconexión e integración es difícil de lograr. Esto podría ser resuelto desplegando un nuevo sistema de información integrado para toda la organización pero representaría un gran coste económico, una migración problemática de las aplicaciones actuales y una difícil adaptación de los usuarios al nuevo sistema. Otra solución sería usar una estrategia basada en un sistema de información federado que conecte fuentes de datos heterogéneas ofreciendo una vista unificada a modo de repositorio virtual centralizado [1]. Por otro lado, un sistema de información sanitario puede carecer de una definición semántica adecuada de la información que maneja, hasta el punto de hacer imposible la interoperabilidad de sistemas diferentes. No existe una solución sencilla a este problema debido a la complejidad y tamaño del dominio clínico. Hay del orden de O(100.000) – O(1.000.000) términos y entre 200.000 – 300.000 conceptos, que además nunca estarán totalmente definidos debido a su constante evolución [2]. Esto implica que un modelo de información tradicional nunca estará completamente adaptado a los requerimientos cambiantes de la organización. 2. Arquitectura de modelo dual La arquitectura de modelo dual es una propuesta que intenta resolver estos problemas definiendo una separación clara entre información y conocimiento. La primera se estructura a través de un Modelo de Referencia (MR) que contiene las entidades básicas capaces de representar cualquier información contenida en la HCE. Por su parte, el conocimiento se representa utilizando un Modelo de Arquetipos (MA). Los arquetipos son definiciones formales de conceptos clínicos como puede ser un informe de alta, un análisis de glucosa o la historia familiar. Son combinaciones estructuradas y restringidas de las entidades del MR, dotándolo de significado o semántica. Ejemplos de arquitecturas de modelo dual son el estándar europeo CEN/TC251 EN13606 [3] y la iniciativa internacional sin ánimo de lucro openEHR [4]. HL7 v3 [5] no se puede considerar un auténtico estándar de modelo dual aunque emplea una estrategia similar. 2.1. Modelo de Referencia El MR es un modelo orientado a objetos que se utiliza para representar las propiedades genéricas y estables de la información contenida en cualquier HCE. Se compone de un conjunto reducido de clases o entidades que son los bloques constructivos de la HCE. También permite almacenar la información de contexto que acompaña a todos los datos clínicos para cumplir con los requisitos éticos y legales de calidad de la información. En resumen, el MR codifica la información y no cómo debe presentarse o almacenarse en soporte informático. Pueden existir diferentes MR adaptados a diferentes objetivos o diseñados bajo distintas perspectivas. Por ejemplo, el MR propuesto por el CEN está orientado a la representación de documentos clínicos mientras que el propuesto por openEHR se centra más en la propia