Intervalo de confianza para la diferencia de medias pareadas

Cuando se mide a los mismos sujetos dos veces, las dos observaciones dentro de cada par están correlacionadas. El IC pareado usa esta estructura para eliminar la variabilidad entre sujetos, produciendo un intervalo más estrecho e informativo que si se trataran las muestras como independientes.

¿Por qué el análisis pareado?

En un estudio antes-después, los pacientes difieren entre sí en aspectos que afectan al resultado (salud basal, edad, genética). Si se ignora el emparejamiento y se analizan los dos grupos como muestras independientes, toda esta variabilidad entre sujetos infla el error estándar, dificultando la detección del efecto del tratamiento.

El enfoque pareado elimina la variabilidad entre sujetos calculando la diferencia \(d_i = X_{i,\text{después}} - X_{i,\text{antes}}\) para cada sujeto. La variabilidad que queda en \(d_i\) refleja solo el efecto intrasujeto del tratamiento, que es lo que realmente se quiere estimar.

⚠️ Analizar datos pareados como muestras independientes es un error frecuente y costoso

Si se tienen datos pareados y se analizan ignorando el emparejamiento (contraste \(t\) de dos muestras), el error estándar será mayor de lo necesario y el IC más amplio de lo que debería ser. Se puede dejar de detectar un efecto real simplemente por usar el método incorrecto.

El error inverso también existe: tratar muestras independientes como pareadas (emparejando observaciones de forma artificial) infla los grados de libertad y estrecha el IC de forma incorrecta.

Adecua siempre el análisis al diseño del estudio.

Fórmula

Dados \(n\) pares con diferencias \(d_i = X_{i,\text{después}} - X_{i,\text{antes}}\), calcula:

\[\bar{d} = \frac{1}{n}\sum_{i=1}^n d_i, \qquad S_d = \sqrt{\frac{1}{n-1}\sum_{i=1}^n(d_i - \bar{d})^2}, \qquad \text{EE} = \frac{S_d}{\sqrt{n}}\]

Un IC al \((1-\alpha)\) para la diferencia media real \(\mu_d\) es:

\[\bar{d} \pm t_{\alpha/2,\; n-1} \cdot \frac{S_d}{\sqrt{n}}\]

Esto es idéntico al IC \(t\) de una muestra aplicado a las diferencias \(d_i\). El análisis pareado se reduce a un problema de una muestra.

Ejemplo paso a paso

Una clínica de fisioterapia mide las puntuaciones de dolor (escala 0-10) de 10 pacientes antes y después de un tratamiento de 4 semanas. Puntuaciones menores son mejores.

Paciente Antes Después \(d_i\) = Después - Antes
1 7,2 4,5 -2,7
2 6,8 4,1 -2,7
3 8,1 5,8 -2,3
4 5,9 3,2 -2,7
5 7,5 4,9 -2,6
6 6,3 3,8 -2,5
7 8,4 6,1 -2,3
8 7,0 4,0 -3,0
9 6,5 3,9 -2,6
10 7,8 5,2 -2,6

Paso 1: calcula \(\bar{d}\) y \(S_d\).

\[\bar{d} = \frac{-2{,}7 -2{,}7 -2{,}3 \cdots -2{,}6}{10} = -2{,}60\]

\[S_d = \sqrt{\frac{\sum(d_i - \bar{d})^2}{9}} \approx 0{,}207\]

Paso 2: error estándar.

\[\text{EE} = \frac{0{,}207}{\sqrt{10}} \approx 0{,}065\]

Paso 3: valor crítico con \(gl = 9\).

\[t_{0{,}025,\; 9} = 2{,}262\]

Paso 4: construye el IC.

\[\text{IC} = -2{,}60 \pm 2{,}262 \times 0{,}065 = -2{,}60 \pm 0{,}15 = (-2{,}75;\; -2{,}45)\]

Tenemos un 95% de confianza en que el tratamiento reduce el dolor entre 2,45 y 2,75 puntos en promedio. Todo el intervalo está por debajo de cero, lo que confirma una reducción estadísticamente significativa.

Dos paneles: el izquierdo muestra las medidas antes y después conectadas por líneas para cada paciente, el derecho muestra la distribución de las diferencias con el intervalo de confianza

Pareado vs independiente: la ganancia en eficiencia

Gráfico de barras comparando el error estándar y la amplitud del IC del análisis pareado frente al de dos muestras independientes para los mismos datos

El análisis pareado produce un IC mucho más estrecho porque calcular las diferencias dentro de cada sujeto elimina la variabilidad entre sujetos en las puntuaciones de dolor basales.

💡 Cuándo usar el IC pareado

Usa el IC pareado cuando:

  • Los mismos sujetos se miden dos veces (antes/después, izquierda/derecha, dos tratamientos en diseño cruzado).
  • Las observaciones están emparejadas por diseño (casos y controles emparejados, gemelos).

Usa el IC de dos muestras independientes cuando:

  • Los sujetos de los dos grupos son personas distintas sin emparejamiento natural.
  • Las medidas se toman en unidades distintas sin ninguna estructura de vinculación.

En caso de duda, revisa el diseño del estudio: ¿se vinculó específicamente cada observación del grupo 1 con una del grupo 2? Si la respuesta es sí, usa el análisis pareado.