Distribución chi-cuadrado
La distribución chi-cuadrado surge de forma natural como la distribución de la suma de variables normales estándar al cuadrado. Es la base de los contrastes de hipótesis para la varianza, los tests de bondad de ajuste y los tests de independencia en tablas de contingencia.
Definición
Si \(Z_1, Z_2, \ldots, Z_\nu\) son variables aleatorias normales estándar independientes, entonces:
\[X = Z_1^2 + Z_2^2 + \cdots + Z_\nu^2 \sim \chi^2(\nu)\]
\(X\) sigue una distribución chi-cuadrado con \(\nu\) grados de libertad. Su PDF es:
\[f(x) = \frac{x^{\nu/2 - 1} e^{-x/2}}{2^{\nu/2}\,\Gamma(\nu/2)}, \quad x > 0\]
La distribución chi-cuadrado es un caso particular de la distribución gamma: \(\chi^2(\nu) = \text{Gamma}(\nu/2,\, 1/2)\).
La CDF no tiene forma cerrada y se calcula numéricamente. En la práctica, los valores críticos se leen de tablas chi-cuadrado o se calculan con software.
Efecto de los grados de libertad
Los grados de libertad \(\nu\) determinan completamente la distribución:
- \(\nu = 1\) o \(\nu = 2\): fuertemente asimétrica a la derecha, con la moda en 0 (\(\nu=1\)) o en \(x=0\) (\(\nu=2\), caso exponencial).
- \(\nu\) pequeño: muy asimétrica a la derecha con una cola derecha larga.
- \(\nu\) grande: progresivamente más simétrica, aproximándose a una distribución normal por el TCL.

Propiedades
Para \(X \sim \chi^2(\nu)\):
- Valor esperado (media)
\[E(X) = \nu\]
- Varianza
\[\text{Var}(X) = 2\nu\]
- Asimetría
\[\text{Asimetría} = \sqrt{\frac{8}{\nu}}\]
Siempre positiva. Disminuye a medida que \(\nu\) aumenta: la distribución se vuelve más simétrica para \(\nu\) grandes.
- Curtosis
\[g_2 = \frac{12}{\nu}\]
- Moda
\[\text{Moda} = \max(\nu - 2,\ 0)\]
Para \(\nu \leq 2\), la moda está en 0.
- Función cuantil
No existe forma cerrada; se calcula numéricamente. Los valores críticos más habituales están tabulados en las tablas chi-cuadrado.
💡 Aproximación normal para ν grande
Para \(\nu\) grande, la distribución chi-cuadrado se aproxima bien mediante una normal:
\[\chi^2(\nu) \approx N(\nu, 2\nu)\]
Una aproximación mejor (Wilson-Hilferty) usa la transformación de la raíz cúbica:
\[\left(\frac{X}{\nu}\right)^{1/3} \approx N\!\left(1 - \frac{2}{9\nu},\ \frac{2}{9\nu}\right)\]
Esta aproximación es precisa incluso para \(\nu\) moderados y es la que la mayoría del software usa internamente.
Aplicaciones
Intervalo de confianza y contraste para la varianza
Si \(S^2\) es la varianza muestral de \(n\) observaciones de una población \(N(\mu, \sigma)\), entonces:
\[\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)\]
Esto conduce a:
- Un intervalo de confianza al \((1-\alpha)\) para \(\sigma^2\):
\[\left(\frac{(n-1)S^2}{\chi^2_{1-\alpha/2,\, n-1}},\ \frac{(n-1)S^2}{\chi^2_{\alpha/2,\, n-1}}\right)\]
- Un contraste de hipótesis \(H_0: \sigma^2 = \sigma_0^2\) usando el estadístico \((n-1)S^2/\sigma_0^2\).
Un laboratorio mide 16 muestras de un compuesto químico. La desviación típica muestral es \(S = 0{,}08\) mg/L. Construye un IC al 95% para la varianza poblacional \(\sigma^2\).
Con \(n = 16\) y \(\alpha = 0{,}05\):
- \(\chi^2_{0{,}975,\, 15} \approx 27{,}49\) y \(\chi^2_{0{,}025,\, 15} \approx 6{,}26\).
\[\text{IC} = \left(\frac{15 \times 0{,}0064}{27{,}49},\ \frac{15 \times 0{,}0064}{6{,}26}\right) = (0{,}0035;\, 0{,}0153)\]
El IC al 95% para \(\sigma^2\) es \((0{,}0035;\, 0{,}0153)\) (mg/L)². Para \(\sigma\): \((\sqrt{0{,}0035},\, \sqrt{0{,}0153}) \approx (0{,}059;\, 0{,}124)\) mg/L.
Test de bondad de ajuste
El estadístico chi-cuadrado de Pearson:
\[\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}\]
sigue una distribución \(\chi^2(k-1)\) bajo \(H_0\) (o \(\chi^2(k-1-p)\) si se estimaron \(p\) parámetros a partir de los datos). Se usa para contrastar si las frecuencias observadas se ajustan a una distribución hipotética.
Test de independencia
Para una tabla de contingencia con \(r\) filas y \(c\) columnas, el mismo estadístico sigue \(\chi^2((r-1)(c-1))\) bajo independencia. Consulta el post sobre el test chi-cuadrado de Pearson para más detalles.
Figure 1: Distribución chi-cuadrado con 5 grados de libertad: la región de rechazo a α=0,05 comienza en el valor crítico 11,07
⚠️ Los tests chi-cuadrado requieren frecuencias esperadas suficientes
Todos los tests chi-cuadrado asumen que las frecuencias esperadas son suficientemente grandes para que la aproximación chi-cuadrado sea válida. La regla estándar: todas las frecuencias esperadas \(E_i \geq 5\). Si no se cumple, usa tests exactos (test exacto de Fisher para tablas 2×2, o tests multinomiales exactos para bondad de ajuste).
Ejemplo paso a paso: contraste de varianza
Una máquina produce tornillos con una varianza de diámetro especificada de \(\sigma_0^2 = 0{,}01\) mm². Un ingeniero de calidad mide 25 tornillos y obtiene \(S^2 = 0{,}015\) mm². ¿Hay evidencia de que la varianza ha aumentado?
\(H_0: \sigma^2 = 0{,}01\) frente a \(H_1: \sigma^2 > 0{,}01\) (contraste unilateral).
Estadístico del contraste:
\[\chi^2 = \frac{(n-1)S^2}{\sigma_0^2} = \frac{24 \times 0{,}015}{0{,}01} = 36\]
Valor crítico con \(\alpha = 0{,}05\) y \(\nu = 24\) gl:
\[\chi^2_{0{,}95,\, 24} \approx 36{,}42\]
Como \(36 < 36{,}42\), no rechazamos \(H_0\) al nivel del 5%. El p-valor es:
\[p = P(\chi^2_{24} > 36) \approx 0{,}053\]
Ligeramente por encima del 5%. La evidencia de un aumento de la varianza es sugerente pero no concluyente a este nivel de significación.
💡 Relación con otras distribuciones
- Gamma: \(\chi^2(\nu) = \text{Gamma}(\nu/2,\, 1/2)\).
- Normal: suma de normales estándar al cuadrado; para \(\nu\) grande, \(\chi^2(\nu) \approx N(\nu,\, 2\nu)\).
- t de Student: si \(Z \sim N(0,1)\) y \(V \sim \chi^2(\nu)\) son independientes, entonces \(Z/\sqrt{V/\nu} \sim t(\nu)\).
- Distribución F: cociente de dos variables chi-cuadrado independientes divididas por sus grados de libertad: \(F(\nu_1, \nu_2) = (\chi^2(\nu_1)/\nu_1) / (\chi^2(\nu_2)/\nu_2)\).
- Exponencial: \(\chi^2(2) = \text{Exp}(1/2)\).