AMC, vol 50 (2), abril-junio 2008
94
Nota estadística
Asociación entre variables cuantitativas:
análisis de correlación
Jorge Camacho-Sandoval
En la investigación clínica frecuentemente se miden numerosas variables en los individuos
incluidos en el estudio. Muchas veces interesa determinar si existe relación entre algunas de esas
variables, o predecir el valor de una de ellas conociendo el valor de otras. En ocasiones interesa
determinar si distintos instrumentos, métodos o personas obtienen valores similares cuando se
mide una variable en las mismas unidades experimentales. Esos tres objetivos requieren métodos
de análisis distintos. La presente nota se refere al primer objetivo: determinar si existe asociación
entre variables.
En el gráfco de dispersión del índice de tabaquismo y el índice de mortalidad por cáncer de
pulmón adjunto, se puede observar que conforme se incrementa el índice de tabaquismo, se
incrementa de forma lineal, el índice de mortalidad. Es decir, se puede representar la asociación
entre esas variables, con una línea recta. En el segundo gráfco de dispersión, entre el número de
cigarrillos fumados y la mortalidad por cáncer de riñón, se observa una relación que no es lineal,
sino curvilínea. En ambos casos las variables están relacionadas, pero la forma de la relación es
distinta.
El método más común de determinar si existe asociación lineal entre dos variables
cuantitativas continuas es el Análisis de Correlación de Pearson. Con este método se obtiene el
Coefciente de Correlación de Pearson, usualmente representado por la letra R. Como suele
utilizarse una muestra, lo que se obtiene en realidad es un estimado del coefciente de correlación
poblacional, r.
Dos aspectos importantes del coefciente de correlación son su magnitud y su signo. La
magnitud refeja la intensidad de la asociación entre las dos variables; el valor absoluto de la
magnitud puede variar entre cero y uno. Valores cercanos a cero indican que las variables no
están asociadas, es decir, que el valor de una variable es independiente del valor de la otra.
El signo, por su parte, refeja cómo están asociados los valores de ambas variables. Si el
signo es positivo indica que a valores altos de una variable corresponden valores altos de la otra,
o a valores bajos de una variable corresponden valores bajos de la otra. Si el signo es negativo,
indica que a valores altos de una variable corresponden valores bajos de la otra. Es decir, el sigo
positivo indica que los valores de ambas variables cambian en el mismo sentido, mientras que el
signo negativo indica que cambian en sentido contrario. En la fórmula se observa que las unidades
de ambas variables aparecen en el numerador y denominador, por lo tanto, se anulan
aritméticamente, por lo que el coefciente de correlación no tiene unidades de medición.
El cálculo del coefciente de correlación es muy sencillo. Si se supone que se tienen dos
variables cuantitativas continuas, por ejemplo, el número promedio de cigarros consumidos en
cientos por persona (X), y la tasa de mortalidad por cáncer de pulmón en 15 localidades, en
muertes por cien mil habitantes (Y), como se muestra en el Cuadro 1, una de las formas de
cálculo es la siguiente (Zar, 1999):
ISSN 0001-6002/2008/50/2/94-96
Acta Médica Costarricense, ©2008
Colegio de Médicos y Cirujanos
Profesor, Maestría en Epide-
miología, Postgrado en Ciencias
Veterinarias, UNA.
Correspondencia:
Correo electrónico:
jcamacho@ice.co.cr