Contraste de hipótesis para la varianza

El contraste chi-cuadrado para la varianza evalúa si la varianza de una población es igual a un valor especificado. Es la herramienta estándar para contrastar la varianza de una muestra, pero es muy sensible a las desviaciones de la normalidad: más que casi cualquier otro contraste habitual.

Hipótesis

Contraste \(H_0\) \(H_1\)
Bilateral \(\sigma^2 = \sigma_0^2\) \(\sigma^2 \neq \sigma_0^2\)
Unilateral derecho \(\sigma^2 = \sigma_0^2\) \(\sigma^2 > \sigma_0^2\)
Unilateral izquierdo \(\sigma^2 = \sigma_0^2\) \(\sigma^2 < \sigma_0^2\)

Estadístico del contraste

Dada una muestra de tamaño \(n\) con varianza muestral \(S^2\), el estadístico del contraste es:

\[\chi^2 = \frac{(n-1)S^2}{\sigma_0^2}\]

Bajo \(H_0\) y el supuesto de normalidad, este estadístico sigue una distribución \(\chi^2\) con \(n - 1\) grados de libertad. El p-valor se calcula a partir de esta distribución.

⚠️ Este contraste es extremadamente sensible a la no normalidad

A diferencia del contraste \(t\) para la media (que es bastante robusto frente a la no normalidad gracias al TCL), el contraste chi-cuadrado para la varianza no es nada robusto. Los datos no normales pueden producir resultados muy significativos aunque la varianza no haya cambiado, y pueden enmascarar cambios reales. Antes de aplicar este contraste:

  • Verifica la normalidad con un gráfico Q-Q o el contraste de Shapiro-Wilk.
  • Si la normalidad es dudosa, usa un contraste bootstrap para la varianza o informa un intervalo de confianza bootstrap.
  • El contraste de Levene es más robusto para comparar varianzas entre grupos.

Ejemplos

Ejemplo 1: consistencia del peso en envasado (bilateral)

Un fabricante de alimentación especifica que la varianza del peso de los envases no debe superar \(\sigma_0^2 = 4\) g². Un inspector de calidad muestrea 25 envases y obtiene \(S^2 = 6{,}2\) g². ¿Hay evidencia de que la varianza ha cambiado?

Hipótesis: \(H_0: \sigma^2 = 4\) frente a \(H_1: \sigma^2 \neq 4\).

Estadístico del contraste:

\[\chi^2 = \frac{24 \times 6{,}2}{4} = \frac{148{,}8}{4} = 37{,}2\]

P-valor (bilateral, \(gl = 24\)):

\[p = 2 \times \min\!\left(P(\chi^2_{24} \leq 37{,}2),\; P(\chi^2_{24} \geq 37{,}2)\right) = 2 \times P(\chi^2_{24} \geq 37{,}2) \approx 2 \times 0{,}036 = 0{,}072\]

Decisión: \(p = 0{,}072 > 0{,}05\), no rechazamos \(H_0\).

Los datos no aportan evidencia significativa al nivel del 5% de que la varianza difiera de 4 g². Sin embargo, el resultado está en el límite: \(S^2 = 6{,}2\) g² supera en un 55% el objetivo, lo que puede ser preocupante desde el punto de vista práctico aunque no sea estadísticamente significativo.

Distribución chi-cuadrado con regiones de rechazo bilaterales y el estadístico observado para el ejemplo del envasado

Ejemplo 2: precisión de un instrumento de medida (unilateral derecho)

Un laboratorio afirma que su balanza tiene una varianza de como máximo \(\sigma_0^2 = 0{,}01\) mg². Un metrólogo realiza 20 medidas y obtiene \(S^2 = 0{,}018\) mg². ¿Hay evidencia de que la varianza supera la especificación?

Hipótesis: \(H_0: \sigma^2 = 0{,}01\) frente a \(H_1: \sigma^2 > 0{,}01\).

Estadístico del contraste:

\[\chi^2 = \frac{19 \times 0{,}018}{0{,}01} = \frac{0{,}342}{0{,}01} = 34{,}2\]

P-valor (unilateral derecho, \(gl = 19\)):

\[p = P(\chi^2_{19} \geq 34{,}2) \approx 0{,}017\]

Decisión: \(p = 0{,}017 < 0{,}05\), rechazamos \(H_0\).

Hay evidencia significativa de que la varianza de la balanza supera la especificación. El instrumento debe recalibrarse o sustituirse.

Distribución chi-cuadrado con región de rechazo derecha y el estadístico observado para el ejemplo del instrumento de medida

Realizar el contraste en R

En R no existe una función var.test() para la varianza de una muestra (esa función compara dos varianzas). Usa:

# Contraste chi-cuadrado manual para la varianza
n    <- 25
s2   <- 6.2
sig0 <- 4
chi2_stat <- (n - 1) * s2 / sig0
df   <- n - 1

# P-valor bilateral
p_val <- 2 * min(pchisq(chi2_stat, df),
                 pchisq(chi2_stat, df, lower.tail = FALSE))

# O usando el paquete EnvStats
library(EnvStats)
varTest(x, sigma.squared = 4, alternative = "two.sided")

💡 Cuándo usar este contraste

Usa el contraste chi-cuadrado para la varianza cuando:

  • Quieras contrastar si la varianza de un proceso cumple una especificación (\(H_0: \sigma^2 = \sigma_0^2\)).
  • Los datos sean continuos y aproximadamente normales.
  • La muestra sea de un único grupo (para comparar varianzas de dos grupos, usa el test F o el contraste de Levene).

Verifica siempre la normalidad antes de aplicar este contraste. Un resultado significativo en datos no normales puede reflejar asimetría o colas pesadas más que un cambio en la varianza.