INICIO

Test z de dos muestras para proporciones

El test z de dos muestras para proporciones evalúa si dos proporciones poblacionales son iguales. Bajo \(H_0: p_1 = p_2\), ambos grupos comparten la misma proporción, por lo que se usa una estimación combinada para calcular el error estándar. Esto es lo que distingue al test del intervalo de confianza para \(p_1 - p_2\), que usa estimaciones individuales.

Hipótesis

Test	\(H_0\)	\(H_1\)
Bilateral	\(p_1 = p_2\)	\(p_1 \neq p_2\)
Unilateral derecho	\(p_1 = p_2\)	\(p_1 > p_2\)
Unilateral izquierdo	\(p_1 = p_2\)	\(p_1 < p_2\)

Estadístico del test

Dados \(x_1\) éxitos en \(n_1\) ensayos y \(x_2\) éxitos en \(n_2\) ensayos:

\[\hat{p}_1 = \frac{x_1}{n_1}, \quad \hat{p}_2 = \frac{x_2}{n_2}\]

Bajo \(H_0\), ambos grupos comparten una proporción común \(p\). Se estima combinando los datos:

\[\hat{p} = \frac{x_1 + x_2}{n_1 + n_2}\]

El estadístico del test es:

\[Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p})\left(\dfrac{1}{n_1} + \dfrac{1}{n_2}\right)}}\]

Bajo \(H_0\) y la aproximación normal, \(Z \sim N(0,1)\).

⚠️ EE combinado para el test, EE no combinado para el intervalo de confianza

El estadístico del test usa la proporción combinada \(\hat{p}\) en el error estándar, porque bajo \(H_0\) ambos grupos tienen la misma proporción real y combinarlos da una mejor estimación.

El intervalo de confianza para \(p_1 - p_2\) usa el error estándar no combinado \(\sqrt{\hat{p}_1(1-\hat{p}_1)/n_1 + \hat{p}_2(1-\hat{p}_2)/n_2}\), porque el IC no asume que \(H_0\) es verdadera.

Usar el EE no combinado en el test (o el combinado en el IC) es incorrecto.

La aproximación normal es válida cuando los cuatro recuentos son al menos 10:

\[n_1\hat{p} \geq 10, \quad n_1(1-\hat{p}) \geq 10, \quad n_2\hat{p} \geq 10, \quad n_2(1-\hat{p}) \geq 10\]

Para recuentos pequeños, usa el test exacto de Fisher.

Ejemplos

Ejemplo 1: test A/B de tasa de conversión (bilateral)

Una plataforma de comercio electrónico prueba dos diseños de página de pago. Versión A: 180 compras de 600 visitantes (\(\hat{p}_1 = 0{,}300\)). Versión B: 156 compras de 600 visitantes (\(\hat{p}_2 = 0{,}260\)). ¿Hay diferencia significativa en la tasa de conversión?

Proporción combinada:

\[\hat{p} = \frac{180 + 156}{600 + 600} = \frac{336}{1200} = 0{,}280\]

Comprobación de condiciones: \(600 \times 0{,}280 = 168 \geq 10\), \(600 \times 0{,}720 = 432 \geq 10\). Válido.

Estadístico del test:

\[Z = \frac{0{,}300 - 0{,}260}{\sqrt{0{,}280 \times 0{,}720 \times (1/600 + 1/600)}} = \frac{0{,}040}{\sqrt{0{,}2016/600}} = \frac{0{,}040}{0{,}01833} \approx 2{,}182\]

P-valor (bilateral): \(p = 2 \times P(Z \geq 2{,}182) \approx 0{,}029\).

Decisión: \(p = 0{,}029 < 0{,}05\), rechazamos \(H_0\). La versión A tiene una tasa de conversión significativamente mayor.

Distribución normal estándar con regiones de rechazo bilaterales y el estadístico z observado para el ejemplo del test A/B

Ejemplo 2: eficacia de una vacuna (unilateral izquierdo)

Un ensayo clínico asigna 500 participantes a la vacuna y 500 a placebo. Infecciones: 18 en el grupo vacuna (\(\hat{p}_1 = 0{,}036\)) y 42 en el grupo placebo (\(\hat{p}_2 = 0{,}084\)). ¿Es eficaz la vacuna (menor tasa de infección)?

Hipótesis: \(H_0: p_1 = p_2\) frente a \(H_1: p_1 < p_2\) (unilateral izquierdo, la vacuna tiene menor tasa).

Proporción combinada:

\[\hat{p} = \frac{18 + 42}{1000} = 0{,}060\]

Estadístico del test:

\[Z = \frac{0{,}036 - 0{,}084}{\sqrt{0{,}060 \times 0{,}940 \times (1/500 + 1/500)}} = \frac{-0{,}048}{\sqrt{0{,}0002256}} = \frac{-0{,}048}{0{,}01502} \approx -3{,}196\]

P-valor (unilateral izquierdo): \(p = P(Z \leq -3{,}196) \approx 0{,}001\).

Decisión: \(p = 0{,}001 < 0{,}05\), rechazamos \(H_0\). La vacuna reduce significativamente la tasa de infección.

Distribución normal estándar con región de rechazo izquierda y el estadístico z observado para el ejemplo de la eficacia de la vacuna

Conexión con el test chi-cuadrado

Para una tabla de contingencia \(2 \times 2\), el test z bilateral para proporciones y el test chi-cuadrado de independencia son matemáticamente equivalentes: \(Z^2 = \chi^2\) con \(gl = 1\). Para el ejemplo 1: \(Z^2 = 2{,}182^2 = 4{,}761 \approx \chi^2_{(1)}\).

El test chi-cuadrado se generaliza a tablas mayores de \(2 \times 2\); el test z es específico para dos proporciones y también maneja alternativas unilaterales, que el test chi-cuadrado no admite.

Realizar el test en R

prop.test() en R realiza este test usando la aproximación chi-cuadrado (equivalente al test z para dos proporciones):

# Ejemplo 1: test A/B (bilateral)
prop.test(x = c(180, 156), n = c(600, 600),
          alternative = "two.sided", correct = FALSE)

# Ejemplo 2: vacuna (unilateral izquierdo)
prop.test(x = c(18, 42), n = c(500, 500),
          alternative = "less", correct = FALSE)

# Test exacto de Fisher para recuentos pequeños
fisher.test(matrix(c(18, 482, 42, 458), nrow = 2))

correct = FALSE desactiva la corrección de continuidad de Yates. La corrección es conservadora y generalmente no se recomienda para muestras grandes.

💡 Cómo informar el resultado

Informa las dos proporciones, su diferencia y su intervalo de confianza junto con el resultado del test. Para el ejemplo 1: “La versión A convirtió al 30,0% frente al 26,0% de la versión B, una diferencia de 4,0 puntos porcentuales (IC al 95%: 0,5% a 7,5%; \(Z = 2{,}18\), \(p = 0{,}029\)).” El IC muestra el rango de tamaños del efecto plausibles, algo que el p-valor solo no revela.