Intervalos de confianza bootstrap

Los intervalos de confianza bootstrap usan la distribución bootstrap de \(\hat{\theta}^*\) para construir un rango de valores plausibles para el verdadero parámetro \(\theta\). Existen cuatro métodos principales, que difieren en precisión, supuestos y coste computacional. El intervalo BCa es la opción más precisa de uso general.

Planteamiento y notación

A partir de \(B\) remuestras bootstrap tenemos estimaciones \(\hat{\theta}^*_1, \ldots, \hat{\theta}^*_B\). Sea \(\hat{\theta}^*_{(\alpha)}\) el cuantil \(\alpha\) de la distribución bootstrap. El estadístico observado en la muestra original es \(\hat{\theta}\).

  1. Intervalo percentil

El método más sencillo: usa directamente los cuantiles de la distribución bootstrap.

\[\text{IC}_\text{perc} = \left[\hat{\theta}^*_{(\alpha/2)},\; \hat{\theta}^*_{(1-\alpha/2)}\right]\]

Intuición: si la distribución bootstrap está centrada en \(\hat{\theta}\) y es simétrica, el intervalo percentil es una aproximación válida. Aplicación: ordena las \(B\) estimaciones bootstrap y toma los valores en las posiciones \(\lfloor B\alpha/2 \rfloor\) y \(\lceil B(1-\alpha/2) \rceil\).

Limitación: el intervalo percentil ignora el sesgo. Si la distribución bootstrap está desplazada respecto a la verdadera distribución muestral (es decir, \(E[\hat{\theta}^*] \neq \hat{\theta}\) o \(E[\hat{\theta}] \neq \theta\)), el intervalo tiene una cobertura incorrecta.

  1. Intervalo básico (invertido)

También llamado empírico o pivotal. Usa la distribución bootstrap de \(\hat{\theta}^* - \hat{\theta}\) como aproximación de la distribución muestral de \(\hat{\theta} - \theta\):

\[\text{IC}_\text{básico} = \left[2\hat{\theta} - \hat{\theta}^*_{(1-\alpha/2)},\; 2\hat{\theta} - \hat{\theta}^*_{(\alpha/2)}\right]\]

Intuición: refleja la distribución bootstrap alrededor de \(\hat{\theta}\). Esto corrige el sesgo en la localización de la distribución bootstrap, pero no la asimetría. Los límites están “invertidos”: el límite superior usa el cuantil inferior bootstrap y viceversa.

  1. Intervalo studentizado (bootstrap-t)

El intervalo más preciso cuando se dispone de una estimación del error estándar. Normaliza el estadístico bootstrap por su propio EE:

\[t_b^* = \frac{\hat{\theta}^*_b - \hat{\theta}}{\widehat{\text{EE}}^*_b}\]

\[\text{IC}_\text{stud} = \left[\hat{\theta} - t^*_{(1-\alpha/2)} \cdot \widehat{\text{EE}},\; \hat{\theta} - t^*_{(\alpha/2)} \cdot \widehat{\text{EE}}\right]\]

donde \(\widehat{\text{EE}}^*_b\) es el EE de \(\hat{\theta}^*_b\) estimado a partir de un bootstrap anidado dentro de cada remuestra (o analíticamente si se dispone de él), y \(\widehat{\text{EE}}\) es el EE de la muestra original.

Ventaja: tiene en cuenta la variación del EE entre las remuestras bootstrap, logrando precisión de segundo orden. Desventaja: requiere \(B \times B\) bootstrap anidado o una fórmula analítica del EE, lo que lo hace computacionalmente costoso.

  1. Intervalo BCa (corregido por sesgo y acelerado)

La recomendación estándar para uso general. Ajusta el intervalo percentil tanto por sesgo como por asimetría mediante dos cantidades:

  • Corrección por sesgo \(\hat{z}_0\): mide cuánto está desplazada la distribución bootstrap respecto a \(\hat{\theta}\).
  • Aceleración \(\hat{a}\): mide cómo varía el EE de \(\hat{\theta}\) con el verdadero valor del parámetro (estimado mediante jackknife).

\[\hat{z}_0 = \Phi^{-1}\!\left(\frac{\#\{\hat{\theta}^*_b < \hat{\theta}\}}{B}\right)\]

\[\hat{a} = \frac{\sum_{i=1}^n (\bar{\psi} - \psi_i)^3}{6\left[\sum_{i=1}^n (\bar{\psi} - \psi_i)^2\right]^{3/2}}, \quad \psi_i = \hat{\theta}_{(i)} \text{ (jackknife)}\]

\[\alpha_1 = \Phi\!\left(\hat{z}_0 + \frac{\hat{z}_0 + z_{\alpha/2}}{1 - \hat{a}(\hat{z}_0 + z_{\alpha/2})}\right), \quad \alpha_2 = \Phi\!\left(\hat{z}_0 + \frac{\hat{z}_0 + z_{1-\alpha/2}}{1 - \hat{a}(\hat{z}_0 + z_{1-\alpha/2})}\right)\]

\[\text{IC}_\text{BCa} = \left[\hat{\theta}^*_{(\alpha_1)},\; \hat{\theta}^*_{(\alpha_2)}\right]\]

Cuando \(\hat{z}_0 = 0\) (sin sesgo) y \(\hat{a} = 0\) (sin asimetría), el BCa se reduce al intervalo percentil. El BCa logra precisión de segundo orden: su error de cobertura es \(O(n^{-1})\) frente a \(O(n^{-1/2})\) del intervalo percentil.

Comparación de los cuatro métodos

Cuatro intervalos de confianza bootstrap comparados para el coeficiente de correlación muestral mostrando diferencias en amplitud y posición

Los cuatro intervalos difieren en posición y amplitud porque hacen correcciones distintas por sesgo y asimetría. Para una correlación próxima al límite (\(\hat{\rho} \approx 0{,}8\)), la distribución está sesgada a la izquierda y el BCa produce el intervalo asimétrico más adecuado.

Distribución bootstrap de la correlación con los límites de los cuatro intervalos marcados

Qué método usar

Método Precisión Requiere Mejor para
Percentil Primer orden \(B \geq 1000\) Estimaciones rápidas, distribuciones simétricas
Básico Primer orden \(B \geq 1000\) Corrige el sesgo de localización
Studentizado Segundo orden EE por remuestra Estadísticos pivotables con EE disponible
BCa Segundo orden \(B \geq 5000\) + jackknife Uso general, distribuciones asimétricas

⚠️ El intervalo percentil puede tener cobertura deficiente para estadísticos sesgados o asimétricos

El intervalo percentil asume que la distribución bootstrap tiene la misma forma que la verdadera distribución muestral. Cuando \(\hat{\theta}\) está sesgado o su distribución es asimétrica (habitual para estadísticos acotados como correlaciones, proporciones y varianzas), el intervalo percentil tiene una cobertura real inferior al nivel nominal.

Para correlaciones próximas a \(\pm 1\), varianzas y otros parámetros acotados, usa siempre BCa en lugar de percentil. Para la media muestral a partir de una distribución simétrica, los cuatro métodos dan resultados similares.

💡 IC bootstrap en R con el paquete boot

library(boot)

stat_fn  <- function(data, idx) median(data[idx])
boot_obj <- boot(x, stat_fn, R = 5000)

# Los cuatro intervalos a la vez
boot.ci(boot_obj, conf = 0.95,
        type = c("perc", "basic", "stud", "bca"))

Para el intervalo studentizado, la función statistic debe devolver un vector c(estimación, varianza). Para el BCa, se recomienda al menos \(B = 2000\); \(B = 5000\) para estabilidad en las colas.