Test t pareado

El test t pareado compara dos medidas relacionadas calculando la diferencia para cada sujeto y aplicando un test t de una muestra a esas diferencias. Al eliminar la variabilidad entre sujetos, es más potente que el test t de dos muestras cuando el emparejamiento es efectivo.

¿Por qué el análisis pareado?

Cuando los mismos sujetos se miden dos veces (antes/después, izquierda/derecha, dos tratamientos en diseño cruzado), las dos observaciones dentro de cada par están correlacionadas. Un test t de dos muestras ignora esta correlación e incluye la variabilidad entre sujetos en el error estándar, dificultando la detección del efecto del tratamiento.

El test t pareado calcula \(d_i = X_{i,2} - X_{i,1}\) para cada sujeto y contrasta \(H_0: \mu_d = 0\) usando un test t de una muestra sobre los \(d_i\). La variabilidad entre sujetos desaparece del análisis.

Hipótesis

Test \(H_0\) \(H_1\)
Bilateral \(\mu_d = 0\) \(\mu_d \neq 0\)
Unilateral derecho \(\mu_d = 0\) \(\mu_d > 0\)
Unilateral izquierdo \(\mu_d = 0\) \(\mu_d < 0\)

De forma más general, el test puede evaluar \(H_0: \mu_d = \delta_0\) para cualquier diferencia hipotética \(\delta_0\) (habitualmente 0).

Estadístico del test

Dados \(n\) pares con diferencias \(d_i = X_{i,2} - X_{i,1}\):

\[\bar{d} = \frac{1}{n}\sum d_i, \qquad S_d = \sqrt{\frac{\sum(d_i - \bar{d})^2}{n-1}}\]

\[t = \frac{\bar{d} - \delta_0}{S_d / \sqrt{n}}\]

Bajo \(H_0\), \(t \sim t(n-1)\). Esto es idéntico a la fórmula del test t de una muestra aplicado a las diferencias.

⚠️ Analizar datos pareados como muestras independientes malgasta potencia

Si aplicas un test t de dos muestras a datos pareados, el error estándar incluye la variabilidad entre sujetos que se cancela en el análisis pareado. El resultado es un IC más amplio y un p-valor menos significativo, pudiendo pasar por alto un efecto real.

El error inverso también existe: tratar muestras independientes como pareadas (emparejando observaciones arbitrariamente) también es incorrecto e infla los grados de libertad. Adecua siempre el análisis al diseño del estudio.

Ejemplos

Ejemplo 1: presión arterial antes y después de la medicación (bilateral)

Diez pacientes tienen la presión arterial sistólica medida antes y después de 4 semanas de tratamiento:

Paciente Antes Después \(d_i\)
1 152 141 -11
2 148 139 -9
3 165 158 -7
4 143 138 -5
5 156 143 -13
6 160 152 -8
7 149 145 -4
8 158 148 -10
9 144 139 -5
10 162 155 -7

\(\bar{d} = -7{,}9\) mmHg, \(S_d = 2{,}88\) mmHg.

Estadístico del test:

\[t = \frac{-7{,}9 - 0}{2{,}88/\sqrt{10}} = \frac{-7{,}9}{0{,}911} \approx -8{,}673\]

P-valor (bilateral, \(gl = 9\)): \(p = 2 \times P(T_9 \leq -8{,}673) < 0{,}001\).

Decisión: rechazamos \(H_0\). La medicación reduce significativamente la presión arterial.

Dos paneles: el izquierdo muestra las presiones arteriales pareadas conectadas por líneas, el derecho muestra la distribución t con la región de rechazo y el estadístico observado

Ejemplo 2: nuevo programa de formación (unilateral derecho)

Ocho empleados completan una evaluación de rendimiento antes y después de un programa de formación. Puntuaciones (después - antes): \(+8, +5, +12, +3, +9, +6, +4, +7\).

\(\bar{d} = 6{,}75\), \(S_d = 2{,}87\).

Hipótesis: \(H_0: \mu_d = 0\) frente a \(H_1: \mu_d > 0\) (la formación mejora las puntuaciones).

Estadístico del test:

\[t = \frac{6{,}75}{2{,}87/\sqrt{8}} = \frac{6{,}75}{1{,}015} \approx 6{,}650\]

P-valor (unilateral derecho, \(gl = 7\)): \(p = P(T_7 \geq 6{,}650) < 0{,}001\).

Decisión: rechazamos \(H_0\). El programa de formación mejoró significativamente las puntuaciones de rendimiento.

Ganancia de potencia por el emparejamiento

El test t pareado es más potente que el test t de dos muestras cuando la correlación intrasujeto es positiva (es decir, los sujetos que puntúan alto antes también tienden a puntuar alto después). La varianza de las diferencias es:

\[\text{Var}(d_i) = \sigma_1^2 + \sigma_2^2 - 2\rho\sigma_1\sigma_2\]

Cuando \(\rho > 0\), \(\text{Var}(d_i) < \sigma_1^2 + \sigma_2^2\), que es lo que usa el test t de dos muestras. Cuanto mayor es la correlación intrasujeto, mayor es la ventaja en potencia del diseño pareado.

Realizar el test en R

before <- c(152, 148, 165, 143, 156, 160, 149, 158, 144, 162)
after  <- c(141, 139, 158, 138, 143, 152, 145, 148, 139, 155)

# Test t pareado
t.test(after, before, paired = TRUE, alternative = "two.sided")

# Equivalente: test t de una muestra sobre las diferencias
t.test(after - before, mu = 0, alternative = "two.sided")

Ambas llamadas dan resultados idénticos. La salida incluye \(\bar{d}\), \(t\), \(gl\), p-valor y un IC al 95% para \(\mu_d\).

💡 Cuándo usar el test t pareado

Usa el test t pareado cuando:

  • Los mismos sujetos se miden dos veces (antes/después, dos condiciones).
  • Los sujetos están emparejados por diseño (gemelos, casos y controles emparejados).
  • Cada observación del grupo 1 está vinculada de forma natural a una del grupo 2.

Usa el test t de dos muestras (Welch) cuando los sujetos de los dos grupos son distintos y no hay emparejamiento natural. En caso de duda: ¿puedes calcular \(d_i = X_{i,2} - X_{i,1}\) de forma significativa para cada unidad? Si la respuesta es sí, usa el pareado.