Contraste de hipótesis para una proporción

El contraste z de una muestra para una proporción evalúa si la proporción de una población es igual a un valor hipotético específico. Se basa en la aproximación normal a la binomial, lo que requiere verificar que la muestra es suficientemente grande antes de aplicar el contraste.

Hipótesis

Contraste \(H_0\) \(H_1\)
Bilateral \(p = p_0\) \(p \neq p_0\)
Unilateral derecho \(p = p_0\) \(p > p_0\)
Unilateral izquierdo \(p = p_0\) \(p < p_0\)

Estadístico del contraste

Dados \(x\) éxitos en \(n\) ensayos, \(\hat{p} = x/n\). El estadístico del contraste es:

\[Z = \frac{\hat{p} - p_0}{\sqrt{p_0(1-p_0)/n}}\]

Bajo \(H_0\), \(Z\) sigue una distribución normal estándar. Nótese que el denominador usa \(p_0\), no \(\hat{p}\): calculamos el error estándar bajo la hipótesis nula, no bajo la proporción observada.

La aproximación normal es válida cuando se cumplen ambas condiciones:

\[n p_0 \geq 10 \quad \text{y} \quad n(1-p_0) \geq 10\]

⚠️ Cuando la aproximación normal falla, usa métodos exactos

Cuando \(np_0 < 10\) o \(n(1-p_0) < 10\) (eventos raros, muestras pequeñas o proporciones extremas), la distribución binomial está sesgada y la aproximación normal no es fiable. En esos casos:

  • Usa el contraste binomial exacto: binom.test() en R. Calcula el p-valor exacto a partir de la distribución binomial.
  • Para los intervalos de confianza, usa el intervalo de Wilson en lugar del de Wald.

La condición \(np_0 \geq 10\) (no \(\geq 5\), como indican los libros de texto más antiguos) es el umbral recomendado actualmente para la aproximación normal.

Ejemplos

Ejemplo 1: tasa de defectos en fabricación (bilateral)

Una línea de producción tiene una tasa de defectos histórica de \(p_0 = 0{,}08\). Tras un cambio de proceso, un ingeniero de calidad inspecciona 200 unidades y encuentra 22 defectuosas (\(\hat{p} = 0{,}110\)). ¿Ha cambiado la tasa de defectos?

Comprobación de condiciones: \(np_0 = 200 \times 0{,}08 = 16 \geq 10\) y \(n(1-p_0) = 184 \geq 10\). La aproximación normal es válida.

Hipótesis: \(H_0: p = 0{,}08\) frente a \(H_1: p \neq 0{,}08\).

Estadístico del contraste:

\[Z = \frac{0{,}110 - 0{,}08}{\sqrt{0{,}08 \times 0{,}92 / 200}} = \frac{0{,}030}{\sqrt{0{,}000368}} = \frac{0{,}030}{0{,}01918} \approx 1{,}564\]

P-valor (bilateral):

\[p = 2 \times P(Z \geq 1{,}564) = 2 \times 0{,}059 = 0{,}118\]

Decisión: \(p = 0{,}118 > 0{,}05\), no rechazamos \(H_0\).

El aumento observado del 8% al 11% en los defectos no es estadísticamente significativo al nivel del 5%. Sin embargo, el tamaño muestral puede ser insuficiente para detectar un cambio de esta magnitud de forma fiable. Sería conveniente un análisis de potencia antes de concluir que no ha habido cambio.

Distribución normal estándar con regiones de rechazo bilaterales mostrando el estadístico del contraste para el ejemplo de la tasa de defectos

Ejemplo 2: mejora de la tasa de conversión (unilateral derecho)

La tasa de conversión actual en el proceso de pago de una plataforma de comercio electrónico es \(p_0 = 0{,}32\). Tras un rediseño, 148 de 400 usuarios completan una compra (\(\hat{p} = 0{,}370\)). ¿Hay evidencia de que el rediseño mejoró la tasa de conversión?

Comprobación de condiciones: \(np_0 = 400 \times 0{,}32 = 128 \geq 10\) y \(n(1-p_0) = 272 \geq 10\). La aproximación normal es válida.

Hipótesis: \(H_0: p = 0{,}32\) frente a \(H_1: p > 0{,}32\).

Estadístico del contraste:

\[Z = \frac{0{,}370 - 0{,}32}{\sqrt{0{,}32 \times 0{,}68 / 400}} = \frac{0{,}050}{\sqrt{0{,}000544}} = \frac{0{,}050}{0{,}02333} \approx 2{,}144\]

P-valor (unilateral derecho):

\[p = P(Z \geq 2{,}144) \approx 0{,}016\]

Decisión: \(p = 0{,}016 < 0{,}05\), rechazamos \(H_0\).

Hay evidencia significativa al nivel del 5% de que el rediseño mejoró la tasa de conversión. La tasa aumentó aproximadamente 5 puntos porcentuales, una mejora relativa de alrededor del 16%.

Distribución normal estándar con región de rechazo derecha mostrando el estadístico del contraste para el ejemplo de la tasa de conversión

Realizar el contraste en R

# Ejemplo 1: bilateral
prop.test(x = 22, n = 200, p = 0.08, alternative = "two.sided", correct = FALSE)

# Ejemplo 2: unilateral derecho
prop.test(x = 148, n = 400, p = 0.32, alternative = "greater", correct = FALSE)

# Contraste binomial exacto (para muestras pequeñas)
binom.test(x = 22, n = 200, p = 0.08, alternative = "two.sided")

prop.test() usa la aproximación chi-cuadrado (equivalente al contraste z). correct = FALSE desactiva la corrección de continuidad de Yates, que rara vez es necesaria con muestras grandes.

💡 Interpretación del resultado

Un resultado significativo significa que los datos son incompatibles con \(H_0: p = p_0\). Informa siempre el tamaño del efecto junto con el p-valor: la diferencia \(\hat{p} - p_0\) y su intervalo de confianza transmiten tanto la significación estadística como la importancia práctica. Un cambio del 8% al 11% de defectos puede no ser estadísticamente significativo con \(n=200\), pero sí prácticamente importante; con \(n=2000\) sería muy significativo.