AMC, vol 50 (2), abril-junio 2008 94 Nota estadística Asociación entre variables cuantitativas: análisis de correlación Jorge Camacho-Sandoval En la investigación clínica frecuentemente se miden numerosas variables en los individuos incluidos en el estudio. Muchas veces interesa determinar si existe relación entre algunas de esas variables, o predecir el valor de una de ellas conociendo el valor de otras. En ocasiones interesa determinar si distintos instrumentos, métodos o personas obtienen valores similares cuando se mide una variable en las mismas unidades experimentales. Esos tres objetivos requieren métodos de análisis distintos. La presente nota se refere al primer objetivo: determinar si existe asociación entre variables. En el gráfco de dispersión del índice de tabaquismo y el índice de mortalidad por cáncer de pulmón adjunto, se puede observar que conforme se incrementa el índice de tabaquismo, se incrementa de forma lineal, el índice de mortalidad. Es decir, se puede representar la asociación entre esas variables, con una línea recta. En el segundo gráfco de dispersión, entre el número de cigarrillos fumados y la mortalidad por cáncer de riñón, se observa una relación que no es lineal, sino curvilínea. En ambos casos las variables están relacionadas, pero la forma de la relación es distinta. El método más común de determinar si existe asociación lineal entre dos variables cuantitativas continuas es el Análisis de Correlación de Pearson. Con este método se obtiene el Coefciente de Correlación de Pearson, usualmente representado por la letra R. Como suele utilizarse una muestra, lo que se obtiene en realidad es un estimado del coefciente de correlación poblacional, r. Dos aspectos importantes del coefciente de correlación son su magnitud y su signo. La magnitud refeja la intensidad de la asociación entre las dos variables; el valor absoluto de la magnitud puede variar entre cero y uno. Valores cercanos a cero indican que las variables no están asociadas, es decir, que el valor de una variable es independiente del valor de la otra. El signo, por su parte, refeja cómo están asociados los valores de ambas variables. Si el signo es positivo indica que a valores altos de una variable corresponden valores altos de la otra, o a valores bajos de una variable corresponden valores bajos de la otra. Si el signo es negativo, indica que a valores altos de una variable corresponden valores bajos de la otra. Es decir, el sigo positivo indica que los valores de ambas variables cambian en el mismo sentido, mientras que el signo negativo indica que cambian en sentido contrario. En la fórmula se observa que las unidades de ambas variables aparecen en el numerador y denominador, por lo tanto, se anulan aritméticamente, por lo que el coefciente de correlación no tiene unidades de medición. El cálculo del coefciente de correlación es muy sencillo. Si se supone que se tienen dos variables cuantitativas continuas, por ejemplo, el número promedio de cigarros consumidos en cientos por persona (X), y la tasa de mortalidad por cáncer de pulmón en 15 localidades, en muertes por cien mil habitantes (Y), como se muestra en el Cuadro 1, una de las formas de cálculo es la siguiente (Zar, 1999): ISSN 0001-6002/2008/50/2/94-96 Acta Médica Costarricense, ©2008 Colegio de Médicos y Cirujanos Profesor, Maestría en Epide- miología, Postgrado en Ciencias Veterinarias, UNA. Correspondencia: Correo electrónico: jcamacho@ice.co.cr