Contraste de hipótesis para la media
El contraste de una muestra para la media evalúa si la media poblacional es igual a un valor hipotético específico. El contraste \(t\) es la herramienta estándar cuando \(\sigma\) es desconocida, que es casi siempre el caso en la práctica.
Hipótesis
La hipótesis nula especifica un valor \(\mu_0\) para la media poblacional. La alternativa depende de la pregunta de investigación:
| Contraste | \(H_0\) | \(H_1\) |
|---|---|---|
| Bilateral | \(\mu = \mu_0\) | \(\mu \neq \mu_0\) |
| Unilateral derecho | \(\mu = \mu_0\) | \(\mu > \mu_0\) |
| Unilateral izquierdo | \(\mu = \mu_0\) | \(\mu < \mu_0\) |
Usa el contraste bilateral por defecto. Usa el unilateral solo cuando la pregunta de investigación sea direccional y esa dirección se haya especificado antes de ver los datos.
Estadístico del contraste
Dada una muestra de tamaño \(n\) con media \(\bar{x}\) y desviación típica \(S\):
\[t = \frac{\bar{x} - \mu_0}{S / \sqrt{n}}\]
Bajo \(H_0\), este estadístico sigue una distribución \(t\) con \(n - 1\) grados de libertad. El p-valor se calcula a partir de esta distribución.
Cuando \(\sigma\) es conocida (raro en la práctica), sustituye \(S\) por \(\sigma\) y usa la normal estándar \(Z\) en lugar de \(t\).
⚠️ Usa siempre t cuando σ es desconocida, independientemente del tamaño muestral
Una regla habitual pero incorrecta dice: “usa \(z\) para muestras grandes (\(n > 30\)), usa \(t\) para muestras pequeñas”. Esto es incorrecto. La regla correcta: usa \(t\) siempre que \(\sigma\) se estime de los datos, independientemente de \(n\).
Para \(n\) grande, \(t\) y \(z\) dan resultados prácticamente idénticos, así que no hay ningún coste en usar siempre \(t\). Para \(n\) pequeño, usar \(z\) subestima la incertidumbre y produce contrastes anticonservadores.
Supuestos
El contraste \(t\) de una muestra requiere:
- Las observaciones son independientes.
- La población es normal, o \(n\) es suficientemente grande para que se aplique el TCL (habitualmente \(n \geq 30\) como regla práctica).
Para muestras pequeñas de poblaciones claramente no normales, considera el contraste de Wilcoxon de rangos con signo como alternativa no paramétrica.
Ejemplos
Ejemplo 1: vida útil de un componente (unilateral izquierdo)
Un fabricante afirma que su componente dura \(\mu_0 = 10\) años de media. Un equipo de calidad muestrea 25 unidades y obtiene \(\bar{x} = 9{,}5\) años, \(S = 1{,}0\) año. ¿Hay evidencia de que la media real es inferior a 10 años?
Hipótesis: \(H_0: \mu = 10\) frente a \(H_1: \mu < 10\).
Estadístico del contraste:
\[t = \frac{9{,}5 - 10}{1{,}0/\sqrt{25}} = \frac{-0{,}5}{0{,}2} = -2{,}500\]
P-valor (unilateral izquierdo, \(gl = 24\)):
\[p = P(T_{24} \leq -2{,}500) \approx 0{,}010\]
Decisión: \(p = 0{,}010 < 0{,}05\), rechazamos \(H_0\).
Conclusión: hay evidencia significativa al nivel del 5% de que la vida útil media real es inferior a 10 años. La afirmación del fabricante parece estar sobrevalorada.

Ejemplo 2: tiempo de respuesta del servidor (bilateral)
Un equipo de DevOps monitoriza el tiempo de respuesta de una API. El SLA exige \(\mu_0 = 200\) ms. Tras un despliegue, muestrean 40 peticiones: \(\bar{x} = 213\) ms, \(S = 38\) ms. ¿Ha cambiado el tiempo de respuesta medio?
Hipótesis: \(H_0: \mu = 200\) frente a \(H_1: \mu \neq 200\).
Estadístico del contraste:
\[t = \frac{213 - 200}{38/\sqrt{40}} = \frac{13}{6{,}011} \approx 2{,}163\]
P-valor (bilateral, \(gl = 39\)):
\[p = 2 \times P(T_{39} \geq 2{,}163) \approx 2 \times 0{,}018 = 0{,}036\]
Decisión: \(p = 0{,}036 < 0{,}05\), rechazamos \(H_0\).
Conclusión: hay evidencia significativa de que el despliegue cambió el tiempo de respuesta medio. El aumento observado de 13 ms es estadísticamente significativo. El equipo debería investigar si esta degradación es aceptable en la práctica.

Realizar el contraste en R
Ambos ejemplos pueden reproducirse con t.test():
# Ejemplo 1: unilateral izquierdo
t.test(x, mu = 10, alternative = "less")
# Ejemplo 2: bilateral
t.test(x, mu = 200, alternative = "two.sided")
La salida incluye el estadístico del contraste, los grados de libertad, el p-valor y un intervalo de confianza al 95% para \(\mu\).
💡 Interpretación del resultado
Un resultado significativo (\(p \leq \alpha\)) significa que los datos son incompatibles con \(H_0: \mu = \mu_0\). No indica cuánto difiere \(\mu\) de \(\mu_0\). Informa siempre el intervalo de confianza junto con el resultado del contraste: el IC muestra tanto la dirección como la magnitud de la desviación respecto a \(\mu_0\), que es lo que importa para las decisiones prácticas.