Potencia de un contraste

La potencia de un contraste es la probabilidad de rechazar correctamente una hipótesis nula falsa. Un contraste con poca potencia pasa por alto efectos reales: produce muchos falsos negativos. Planificar una potencia adecuada antes de recoger los datos es uno de los pasos más importantes en el diseño de estudios.

Definición

La potencia se define como:

\[\text{Potencia} = P(\text{rechazar } H_0 \mid H_1 \text{ es verdadera}) = 1 - \beta\]

donde \(\beta = P(\text{no rechazar } H_0 \mid H_1 \text{ es verdadera})\) es la probabilidad de error de tipo II. Una potencia de 0,80 significa que hay un 80% de probabilidad de detectar un efecto real si este existe.

La potencia depende de cuatro cantidades, todas interrelacionadas:

  • Tamaño del efecto \(\delta\): cuán grande es la diferencia real.
  • Tamaño muestral \(n\): más datos siempre aumentan la potencia.
  • Nivel de significación \(\alpha\): un \(\alpha\) mayor aumenta la potencia pero también el riesgo de error de tipo I.
  • Variabilidad poblacional \(\sigma\): las poblaciones menos variables son más fáciles de estudiar.

Si se fijan tres de estas cantidades, la cuarta queda determinada. El análisis de potencia usa esta relación para encontrar el \(n\) mínimo necesario para lograr una potencia objetivo.

Visualización de la potencia

La potencia es el área bajo la distribución alternativa que cae en la región de rechazo. La siguiente figura muestra cómo varía con el tamaño del efecto y el tamaño muestral.

Dos paneles mostrando curvas de potencia en función del tamaño del efecto y el tamaño muestral para distintas configuraciones

Cálculo de la potencia para un contraste z de una muestra

Para un contraste z de una muestra bilateral con \(\sigma\) conocida, contrastando \(H_0: \mu = \mu_0\) frente a \(H_1: \mu = \mu_1\):

\[\text{Potencia} = \Phi\!\left(\frac{|\mu_1 - \mu_0|}{\sigma/\sqrt{n}} - z_{\alpha/2}\right) + \Phi\!\left(-\frac{|\mu_1 - \mu_0|}{\sigma/\sqrt{n}} - z_{\alpha/2}\right)\]

donde \(\Phi\) es la CDF de la normal estándar. Para usos prácticos, el segundo término es despreciable cuando el efecto no es pequeño, simplificando a:

\[\text{Potencia} \approx \Phi\!\left(\frac{|\mu_1 - \mu_0|}{\sigma/\sqrt{n}} - z_{\alpha/2}\right) = \Phi\!\left(d\sqrt{n} - z_{\alpha/2}\right)\]

donde \(d = |\mu_1 - \mu_0|/\sigma\) es la \(d\) de Cohen.

Cálculo de la potencia: control de calidad

Una fábrica controla el volumen de llenado. \(H_0: \mu = 500\) ml. El proceso se considera problemático si \(\mu = 498\) ml (un desplazamiento de 2 ml). \(\sigma = 5\) ml conocida, \(n = 40\), \(\alpha = 0{,}05\).

\[d = \frac{|498 - 500|}{5} = 0{,}4, \qquad d\sqrt{n} = 0{,}4 \times \sqrt{40} \approx 2{,}530\]

\[\text{Potencia} \approx \Phi(2{,}530 - 1{,}960) = \Phi(0{,}570) \approx 0{,}716\]

El contraste tiene una potencia del 71,6% para detectar un desplazamiento de 2 ml con \(n = 40\). Esto está por debajo del objetivo del 80%. Para alcanzar el 80% de potencia:

\[n \geq \left(\frac{z_{0{,}025} + z_{0{,}20}}{d}\right)^2 = \left(\frac{1{,}960 + 0{,}842}{0{,}4}\right)^2 = \left(\frac{2{,}802}{0{,}4}\right)^2 \approx 49\]

Con \(n = 49\) (redondeado a 50), el contraste alcanza \(\geq 80\%\) de potencia.

Example icon

Análisis de potencia a priori vs a posteriori

Análisis de potencia a priori

Se realiza antes de la recogida de datos. Se especifica la potencia deseada (por ejemplo, 0,80), el nivel de significación \(\alpha\) y el tamaño mínimo del efecto que se quiere detectar, y se despeja \(n\). Este es el uso correcto del análisis de potencia.

Análisis de potencia a posteriori (observada)

Se realiza después del estudio, usando el tamaño del efecto observado y el \(n\) real para calcular la potencia. Esta práctica es casi siempre poco informativa y frecuentemente engañosa.

⚠️ El análisis de potencia a posteriori no es útil

El análisis de potencia a posteriori usa el tamaño del efecto observado como si fuera el efecto real. Pero el efecto observado es una estimación ruidosa: para un resultado no significativo, el tamaño del efecto observado está sesgado a la baja por definición (si fuera suficientemente grande, el contraste habría sido significativo). La potencia a posteriori calculada a partir de un resultado no significativo es mecánicamente baja, lo que no aporta nada nuevo.

La respuesta correcta ante un resultado no significativo no es calcular la potencia a posteriori, sino reportar el intervalo de confianza del parámetro y discutir qué tamaños del efecto son compatibles con los datos.

Factores que aumentan la potencia

Dado un tamaño del efecto y \(\alpha\) fijos, la potencia puede aumentarse:

  • Aumentando \(n\): la palanca más directa.
  • Reduciendo \(\sigma\): mejores instrumentos de medida, muestras más homogéneas, control de factores de confusión.
  • Usando un contraste unilateral: si la dirección se conoce de antemano y está justificada, el valor crítico es menor, aumentando la potencia. Usar solo cuando sea apropiado.
  • Aumentando \(\alpha\): aceptar una tasa de error de tipo I mayor para reducir los de tipo II. Justificado cuando el coste de pasar por alto un efecto real supera al de una falsa alarma (por ejemplo, en pruebas de cribado).
  • Diseños pareados o emparejados: el emparejamiento elimina la variabilidad entre sujetos, reduciendo efectivamente \(\sigma\).

Gráfico de barras mostrando cómo cambia la potencia al aumentar cada factor uno a uno desde una configuración de referencia

Doblar \(n\) es la palanca más fiable. Cambiar a un contraste unilateral da un aumento moderado pero requiere justificación. Aumentar \(\alpha\) intercambia error de tipo I por potencia.

💡 Guía práctica para el análisis de potencia

  • Apunta a una potencia \(\geq 0{,}80\) para estudios exploratorios, \(\geq 0{,}90\) para ensayos confirmatorios.
  • Si no puedes alcanzar el 80% de potencia con un \(n\) viable, reconsidera si el estudio merece realizarse: un estudio con poca potencia tiene pocas probabilidades de ser informativo.
  • En R, el paquete pwr proporciona cálculos de potencia para todos los contrastes habituales: pwr.t.test(), pwr.p.test(), pwr.chisq.test(), etc.
  • Informa el tamaño del efecto y \(\sigma\) asumidos en el cálculo de potencia: los revisores necesitan evaluar si tus supuestos eran razonables.
  • Si se obtiene un resultado significativo en un estudio con poca potencia, la estimación del tamaño del efecto probablemente está inflada (maldición del ganador). Replica antes de actuar sobre él.