INICIO

Intervalo de confianza para el cociente de varianzas

El intervalo de confianza para \(\sigma_1^2/\sigma_2^2\) usa la distribución F y es siempre asimétrico: el límite superior está más lejos del cociente observado que el límite inferior. Se usa para comparar la variabilidad de dos procesos independientes y para verificar el supuesto de igualdad de varianzas antes de un contraste \(t\) con varianzas combinadas.

Fórmula

Dadas dos muestras independientes con varianzas muestrales \(S_1^2\) (\(n_1\) observaciones) y \(S_2^2\) (\(n_2\) observaciones), el estadístico:

\[F = \frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1,\; n_2-1)\]

Invertir este pivote da un IC al \((1-\alpha)\) para \(\sigma_1^2/\sigma_2^2\):

\[\left(\frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{1-\alpha/2,\; n_1-1,\; n_2-1}},\;\; \frac{S_1^2}{S_2^2} \cdot \frac{1}{F_{\alpha/2,\; n_1-1,\; n_2-1}}\right)\]

Nótese el orden: el valor crítico F mayor (\(F_{1-\alpha/2}\)) divide al límite inferior, y el menor (\(F_{\alpha/2}\)) divide al límite superior.

La relación recíproca de la distribución F da: \(F_{\alpha/2,\; d_1,\; d_2} = 1/F_{1-\alpha/2,\; d_2,\; d_1}\), lo que es útil cuando solo se dispone de tablas de la cola superior de la F.

⚠️ El test F para varianzas es extremadamente sensible a la no normalidad

A diferencia del contraste \(t\) para medias (que es bastante robusto frente a la no normalidad gracias al TCL), el test F para varianzas no es nada robusto. Los datos no normales pueden producir estadísticos F muy significativos incluso cuando las varianzas poblacionales son iguales, y viceversa.

Si la normalidad es dudosa:

Usa el test de Levene (basado en desviaciones absolutas respecto a la mediana): robusto frente a la no normalidad, disponible en R como leveneTest() del paquete car.
Usa el test de Bartlett para datos normales, el de Levene o el de Fligner-Killeen para datos no normales.
Para el propio IC, considera un intervalo de confianza bootstrap para el cociente.

Distribución F y el IC

La distribución F está sesgada a la derecha y es siempre positiva. El IC al 95% para el cociente de varianzas se define por los dos valores críticos que dejan el 2,5% en cada cola. El cociente observado \(S_1^2/S_2^2\) (línea verde) cae dentro de la región central en este ejemplo, confirmando que 1 está dentro del IC.

Distribución F mostrando los valores críticos y la región de confianza para el cociente de varianzas

Ejemplo paso a paso

Un ingeniero de calidad compara la consistencia de dos líneas de producción. Línea 1 (\(n_1 = 15\)) tiene \(S_1^2 = 4{,}0\) mm² y línea 2 (\(n_2 = 12\)) tiene \(S_2^2 = 2{,}0\) mm². Construye un IC al 95% para \(\sigma_1^2/\sigma_2^2\).

Paso 1: calcula el cociente observado.

\[F_{\text{obs}} = \frac{S_1^2}{S_2^2} = \frac{4{,}0}{2{,}0} = 2{,}0\]

Paso 2: encuentra los valores críticos F con \(gl_1 = 14\), \(gl_2 = 11\).

\[F_{0{,}975,\; 14,\; 11} = 3{,}095, \qquad F_{0{,}025,\; 14,\; 11} = 0{,}305\]

En R: qf(0.975, 14, 11) y qf(0.025, 14, 11).

Paso 3: calcula los límites.

\[\text{L. inferior} = \frac{2{,}0}{3{,}095} \approx 0{,}646, \qquad \text{L. superior} = \frac{2{,}0}{0{,}305} \approx 6{,}557\]

\[\text{IC al 95\% para } \sigma_1^2/\sigma_2^2: (0{,}65;\; 6{,}56)\]

Como el IC incluye el 1, no hay evidencia significativa de que las dos líneas difieran en variabilidad al nivel del 5%. Sin embargo, el intervalo amplio refleja los tamaños muestrales limitados: la línea 1 podría tener entre el 65% y el 656% de la varianza de la línea 2.

Gráfico de barras mostrando la asimetría del intervalo de confianza para el cociente de varianzas respecto al estadístico F observado

El límite superior se extiende más lejos de \(F_\text{obs}\) que el límite inferior en todos los casos: la asimetría de la distribución F hace que este IC sea siempre asimétrico, y es más pronunciada en muestras más pequeñas.

Cuando el IC excluye el 1

Una empresa farmacéutica compara la variabilidad de lote a lote de dos procesos de fabricación. Proceso A (\(n_1 = 30\), \(S_1^2 = 12{,}4\)) frente al proceso B (\(n_2 = 30\), \(S_2^2 = 4{,}1\)).

\[F_\text{obs} = 12{,}4/4{,}1 \approx 3{,}02\]

\[F_{0{,}975,\; 29,\; 29} \approx 2{,}101, \quad F_{0{,}025,\; 29,\; 29} \approx 0{,}476\]

\[\text{IC} = \left(\frac{3{,}02}{2{,}101};\; \frac{3{,}02}{0{,}476}\right) = (1{,}44;\; 6{,}34)\]

El IC excluye el 1: el proceso A es significativamente más variable que el proceso B. El cociente está entre 1,44 y 6,34, lo que significa que el proceso A tiene entre un 44% y un 534% más de varianza que el proceso B.

💡 Guía práctica

El IC para un cociente de varianzas es más útil para verificar el supuesto de igualdad de varianzas antes de un contraste \(t\) con varianzas combinadas. Si 1 está dentro del IC, el contraste combinado es defendible; si 1 está fuera, usa Welch.
Para comparar varianzas como objetivo principal (no solo como verificación de un supuesto), se prefiere el test de Levene por su robustez frente a la no normalidad.
En R: var.test(x, y) calcula el estadístico F y su IC. car::leveneTest(y ~ grupo) ofrece la alternativa robusta.
El IC solo es válido cuando ambas poblaciones son normales. Para datos no normales, aplica bootstrap directamente al cociente \(S_1^2/S_2^2\).