Contraste de hipótesis para la media

El contraste de una muestra para la media evalúa si la media poblacional es igual a un valor hipotético específico. El contraste \(t\) es la herramienta estándar cuando \(\sigma\) es desconocida, que es casi siempre el caso en la práctica.

Hipótesis

La hipótesis nula especifica un valor \(\mu_0\) para la media poblacional. La alternativa depende de la pregunta de investigación:

Contraste \(H_0\) \(H_1\)
Bilateral \(\mu = \mu_0\) \(\mu \neq \mu_0\)
Unilateral derecho \(\mu = \mu_0\) \(\mu > \mu_0\)
Unilateral izquierdo \(\mu = \mu_0\) \(\mu < \mu_0\)

Usa el contraste bilateral por defecto. Usa el unilateral solo cuando la pregunta de investigación sea direccional y esa dirección se haya especificado antes de ver los datos.

Estadístico del contraste

Dada una muestra de tamaño \(n\) con media \(\bar{x}\) y desviación típica \(S\):

\[t = \frac{\bar{x} - \mu_0}{S / \sqrt{n}}\]

Bajo \(H_0\), este estadístico sigue una distribución \(t\) con \(n - 1\) grados de libertad. El p-valor se calcula a partir de esta distribución.

Cuando \(\sigma\) es conocida (raro en la práctica), sustituye \(S\) por \(\sigma\) y usa la normal estándar \(Z\) en lugar de \(t\).

⚠️ Usa siempre t cuando σ es desconocida, independientemente del tamaño muestral

Una regla habitual pero incorrecta dice: “usa \(z\) para muestras grandes (\(n > 30\)), usa \(t\) para muestras pequeñas”. Esto es incorrecto. La regla correcta: usa \(t\) siempre que \(\sigma\) se estime de los datos, independientemente de \(n\).

Para \(n\) grande, \(t\) y \(z\) dan resultados prácticamente idénticos, así que no hay ningún coste en usar siempre \(t\). Para \(n\) pequeño, usar \(z\) subestima la incertidumbre y produce contrastes anticonservadores.

Supuestos

El contraste \(t\) de una muestra requiere:

  • Las observaciones son independientes.
  • La población es normal, o \(n\) es suficientemente grande para que se aplique el TCL (habitualmente \(n \geq 30\) como regla práctica).

Para muestras pequeñas de poblaciones claramente no normales, considera el contraste de Wilcoxon de rangos con signo como alternativa no paramétrica.

Ejemplos

Ejemplo 1: vida útil de un componente (unilateral izquierdo)

Un fabricante afirma que su componente dura \(\mu_0 = 10\) años de media. Un equipo de calidad muestrea 25 unidades y obtiene \(\bar{x} = 9{,}5\) años, \(S = 1{,}0\) año. ¿Hay evidencia de que la media real es inferior a 10 años?

Hipótesis: \(H_0: \mu = 10\) frente a \(H_1: \mu < 10\).

Estadístico del contraste:

\[t = \frac{9{,}5 - 10}{1{,}0/\sqrt{25}} = \frac{-0{,}5}{0{,}2} = -2{,}500\]

P-valor (unilateral izquierdo, \(gl = 24\)):

\[p = P(T_{24} \leq -2{,}500) \approx 0{,}010\]

Decisión: \(p = 0{,}010 < 0{,}05\), rechazamos \(H_0\).

Conclusión: hay evidencia significativa al nivel del 5% de que la vida útil media real es inferior a 10 años. La afirmación del fabricante parece estar sobrevalorada.

Distribución t con región de rechazo izquierda mostrando el estadístico del contraste para el ejemplo de la vida útil del componente

Ejemplo 2: tiempo de respuesta del servidor (bilateral)

Un equipo de DevOps monitoriza el tiempo de respuesta de una API. El SLA exige \(\mu_0 = 200\) ms. Tras un despliegue, muestrean 40 peticiones: \(\bar{x} = 213\) ms, \(S = 38\) ms. ¿Ha cambiado el tiempo de respuesta medio?

Hipótesis: \(H_0: \mu = 200\) frente a \(H_1: \mu \neq 200\).

Estadístico del contraste:

\[t = \frac{213 - 200}{38/\sqrt{40}} = \frac{13}{6{,}011} \approx 2{,}163\]

P-valor (bilateral, \(gl = 39\)):

\[p = 2 \times P(T_{39} \geq 2{,}163) \approx 2 \times 0{,}018 = 0{,}036\]

Decisión: \(p = 0{,}036 < 0{,}05\), rechazamos \(H_0\).

Conclusión: hay evidencia significativa de que el despliegue cambió el tiempo de respuesta medio. El aumento observado de 13 ms es estadísticamente significativo. El equipo debería investigar si esta degradación es aceptable en la práctica.

Distribución t con regiones de rechazo bilaterales mostrando el estadístico del contraste para el ejemplo del tiempo de respuesta del servidor

Realizar el contraste en R

Ambos ejemplos pueden reproducirse con t.test():

# Ejemplo 1: unilateral izquierdo
t.test(x, mu = 10, alternative = "less")

# Ejemplo 2: bilateral
t.test(x, mu = 200, alternative = "two.sided")

La salida incluye el estadístico del contraste, los grados de libertad, el p-valor y un intervalo de confianza al 95% para \(\mu\).

💡 Interpretación del resultado

Un resultado significativo (\(p \leq \alpha\)) significa que los datos son incompatibles con \(H_0: \mu = \mu_0\). No indica cuánto difiere \(\mu\) de \(\mu_0\). Informa siempre el intervalo de confianza junto con el resultado del contraste: el IC muestra tanto la dirección como la magnitud de la desviación respecto a \(\mu_0\), que es lo que importa para las decisiones prácticas.