Intervalo de confianza para la varianza de una distribución normal

El intervalo de confianza para la varianza poblacional usa la distribución chi-cuadrado, no la normal ni la \(t\). Como la distribución chi-cuadrado está sesgada a la derecha, el intervalo es asimétrico: el límite superior siempre está más lejos de \(S^2\) que el límite inferior.

Fórmula

Si la población es normal y se observa una muestra de tamaño \(n\) con varianza muestral \(S^2\), entonces:

\[\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\]

Invertir este pivote da un intervalo de confianza al \((1-\alpha)\) para \(\sigma^2\):

\[\left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\; n-1}},\;\; \frac{(n-1)S^2}{\chi^2_{\alpha/2,\; n-1}}\right)\]

Obsérvese el orden de los valores críticos: el valor chi-cuadrado mayor (\(\chi^2_{1-\alpha/2}\)) va en el denominador del límite inferior, y el menor (\(\chi^2_{\alpha/2}\)) va en el denominador del límite superior.

Para un intervalo de confianza de la desviación típica \(\sigma\), toma la raíz cuadrada de ambos extremos.

⚠️ El IC para la varianza no es simétrico respecto a S²

El IC para la media es simétrico: de \(\bar{x} - \text{ME}\) a \(\bar{x} + \text{ME}\). El IC para la varianza no: el límite superior se extiende más por encima de \(S^2\) de lo que el límite inferior se extiende por debajo.

Esta asimetría proviene directamente del sesgo a la derecha de la distribución chi-cuadrado. Para \(n\) pequeño, la asimetría es notable. Por ejemplo, con \(n = 10\) y \(S^2 = 25\):

  • Límite inferior: \((9 \times 25)/19{,}02 \approx 11{,}8\), que está \(13{,}2\) por debajo de \(S^2\).
  • Límite superior: \((9 \times 25)/2{,}70 \approx 83{,}3\), que está \(58{,}3\) por encima de \(S^2\).

El límite superior está más de cuatro veces más lejos de \(S^2\) que el límite inferior.

Distribución chi-cuadrado y valores críticos

Distribución chi-cuadrado mostrando los valores críticos y las regiones de rechazo para un IC al 95% de la varianza

Ejemplos paso a paso

Ejemplo 1: precisión de un instrumento de medida

Un laboratorio de calibración realiza 20 medidas con un manómetro bajo condiciones idénticas. La varianza muestral de las lecturas es \(S^2 = 4{,}2\) bar². Construye un IC al 95% para la varianza poblacional.

Paso 1: identifica los ingredientes.

\[n = 20, \quad S^2 = 4{,}2, \quad gl = 19, \quad \alpha = 0{,}05\]

Paso 2: encuentra los valores críticos de la tabla chi-cuadrado.

\[\chi^2_{0{,}975,\; 19} = 32{,}85, \qquad \chi^2_{0{,}025,\; 19} = 8{,}91\]

Paso 3: calcula los límites.

\[\text{L. inferior} = \frac{19 \times 4{,}2}{32{,}85} = \frac{79{,}8}{32{,}85} \approx 2{,}43 \text{ bar}^2\]

\[\text{L. superior} = \frac{19 \times 4{,}2}{8{,}91} = \frac{79{,}8}{8{,}91} \approx 8{,}96 \text{ bar}^2\]

\[\text{IC al 95\% para } \sigma^2: (2{,}43;\; 8{,}96) \text{ bar}^2\]

Para la desviación típica: \((\sqrt{2{,}43};\; \sqrt{8{,}96}) = (1{,}56;\; 2{,}99)\) bar.

Ejemplo 2: consistencia del peso en envasado

Un fabricante de alimentación muestrea 15 envases. Los pesos (en gramos) dan \(S^2 = 6{,}8\) g². Construye un IC al 99% para \(\sigma^2\).

\[gl = 14, \quad \chi^2_{0{,}995,\; 14} = 31{,}32, \quad \chi^2_{0{,}005,\; 14} = 4{,}07\]

\[\text{L. inferior} = \frac{14 \times 6{,}8}{31{,}32} \approx 3{,}04 \text{ g}^2, \qquad \text{L. superior} = \frac{14 \times 6{,}8}{4{,}07} \approx 23{,}39 \text{ g}^2\]

\[\text{IC al 99\% para } \sigma^2: (3{,}04;\; 23{,}39) \text{ g}^2\]

El intervalo amplio refleja tanto el pequeño tamaño muestral (\(n=15\)) como el alto nivel de confianza (99%).

Gráfico de barras mostrando la asimetría de los intervalos de confianza para la varianza frente al IC simétrico de la media

El límite superior (naranja) siempre está más lejos de \(S^2\) que el límite inferior (azul), y la asimetría es más pronunciada en muestras pequeñas.

⚠️ El supuesto de normalidad es fundamental aquí

A diferencia del IC para la media (que es robusto frente a la no normalidad gracias al TCL), el IC para la varianza basado en la distribución chi-cuadrado es sensible a las desviaciones de la normalidad. Para poblaciones no normales, este intervalo puede ser sustancialmente incorrecto incluso para muestras grandes.

Si la normalidad es dudosa, considera:

  • Contrastar la normalidad antes de aplicar la fórmula.
  • Usar un IC bootstrap para la varianza, que no asume normalidad.
  • Informar \(S^2\) con un intervalo de confianza bootstrap cuando los datos estén claramente sesgados.

💡 Conexión con los contrastes de hipótesis

Un IC al \((1-\alpha)\) para \(\sigma^2\) está directamente relacionado con el contraste chi-cuadrado para la varianza. Si el valor hipotético \(\sigma^2_0\) cae fuera del IC, el contraste \(H_0: \sigma^2 = \sigma^2_0\) se rechaza al nivel \(\alpha\). Si cae dentro, \(H_0\) no se rechaza.

Esta dualidad significa que el IC contiene toda la información del contraste de hipótesis, y además muestra en qué medida el valor hipotético es plausible o implausible.