¿Qué es un intervalo de confianza?

Un intervalo de confianza ofrece un rango de valores plausibles para un parámetro poblacional desconocido, construido a partir de datos muestrales. El nivel de confianza no describe una probabilidad sobre el parámetro: describe la fiabilidad del procedimiento usado para construir el intervalo.

Definición

Un intervalo de confianza (IC) es un intervalo \([L, U]\) construido a partir de datos muestrales tal que, si el procedimiento de muestreo y construcción se repitiese muchas veces, una proporción especificada de los intervalos resultantes contendría el verdadero parámetro poblacional. Su estructura general es:

\[\text{IC} = \text{Estimación puntual} \pm \text{Margen de error}\]

Para una media poblacional \(\mu\), las formas concretas son:

\[\bar{X} \pm z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}} \quad \text{(cuando } \sigma \text{ es conocida)}\]

\[\bar{X} \pm t_{\alpha/2,\, n-1} \cdot \frac{S}{\sqrt{n}} \quad \text{(cuando } \sigma \text{ es desconocida, que es casi siempre)}\]

El término \(z_{\alpha/2} \cdot \sigma/\sqrt{n}\) (o el equivalente con \(t\)) es el margen de error: la mitad de la amplitud del intervalo.

⚠️ La interpretación errónea más frecuente de los intervalos de confianza

Incorrecto: “Hay un 95% de probabilidad de que la verdadera media esté en el intervalo \([68{,}0;\, 72{,}0]\).”

Correcto: “Si repitiésemos este estudio muchas veces y construyésemos un IC al 95% cada vez, aproximadamente el 95% de esos intervalos contendría la verdadera media.”

La distinción importa porque \(\mu\) es una constante fija (desconocida), no una variable aleatoria. Una vez calculado el intervalo, o contiene a \(\mu\) o no: la probabilidad es 0 o 1. El 95% se refiere a la frecuencia a largo plazo del procedimiento, no a ningún intervalo concreto.

En estadística bayesiana, los intervalos de credibilidad sí tienen una interpretación probabilística directa. Los intervalos de confianza frecuentistas no.

Cómo se ven los intervalos de confianza en la práctica

Simulación de 50 intervalos de confianza mostrando cuáles contienen la verdadera media poblacional y cuáles no

La mayoría de los intervalos (verdes) contienen el verdadero \(\mu = 50\). Unos pocos (rojos) no: esto es lo esperado. En un gran número de repeticiones, exactamente el 95% cubriría \(\mu\).

Nivel de confianza y amplitud del intervalo

El nivel de confianza \((1-\alpha)\) controla el compromiso entre certeza y precisión:

  • Mayor nivel de confianza: intervalo más amplio, mayor certeza de contener \(\mu\), menos informativo.
  • Menor nivel de confianza: intervalo más estrecho, más preciso, pero más probable que no capture \(\mu\).

Tres intervalos de confianza al 90, 95 y 99 por ciento mostrando cómo la amplitud aumenta con la confianza

Con los mismos datos (\(\bar{x} = 70\), \(S = 10\), \(n = 100\)):

  • IC al 90%: \(70 \pm 1{,}66\) = \([68{,}34;\, 71{,}66]\)
  • IC al 95%: \(70 \pm 1{,}98\) = \([68{,}02;\, 71{,}98]\)
  • IC al 99%: \(70 \pm 2{,}63\) = \([67{,}37;\, 72{,}63]\)

Mayor confianza requiere una red más amplia.

Factores que afectan a la amplitud del intervalo

El margen de error \(t_{\alpha/2} \cdot S/\sqrt{n}\) depende de tres cosas:

  • Nivel de confianza: mayor \((1-\alpha)\) da un \(t_{\alpha/2}\) más grande e intervalos más amplios.
  • Tamaño muestral \(n\): mayor \(n\) reduce el margen de error como \(1/\sqrt{n}\).
  • Variabilidad \(S\): datos más variables dan intervalos más amplios.

Para reducir el margen de error a la mitad hay que cuadruplicar el tamaño muestral.

Cálculo paso a paso

Un hospital registra la estancia hospitalaria de 25 pacientes: \(\bar{x} = 6{,}4\) días, \(S = 3{,}1\) días. Construye un IC al 95% para \(\mu\).

Como \(\sigma\) es desconocida, se usa la distribución \(t\) con \(n - 1 = 24\) grados de libertad.

Valor crítico: \(t_{0{,}025,\, 24} = 2{,}064\).

Margen de error: \(2{,}064 \times 3{,}1/\sqrt{25} = 2{,}064 \times 0{,}62 = 1{,}28\).

\[\text{IC} = 6{,}4 \pm 1{,}28 = [5{,}12;\; 7{,}68] \text{ días}\]

Tenemos un 95% de confianza en que la estancia media real se encuentra entre 5,1 y 7,7 días. Esto no significa que haya un 95% de probabilidad de que \(\mu\) esté en este intervalo concreto: significa que el procedimiento que generó este intervalo acierta el 95% de las veces.

Example icon

Conexión con los contrastes de hipótesis

Un intervalo de confianza al \((1-\alpha)\) para \(\mu\) está directamente relacionado con un contraste bilateral al nivel de significación \(\alpha\):

  • Si \(\mu_0\) cae dentro del IC, el contraste \(H_0: \mu = \mu_0\) no se rechaza al nivel \(\alpha\).
  • Si \(\mu_0\) cae fuera del IC, el contraste se rechaza al nivel \(\alpha\).

El IC y el contraste de hipótesis siempre dan la misma conclusión. El IC suele ser más informativo porque muestra todo el rango de valores plausibles, no solo una decisión binaria de rechazar o no rechazar.

💡 Guía práctica para los intervalos de confianza

  • Cuando \(\sigma\) es desconocida (prácticamente siempre): usa la distribución \(t\), no \(z\).
  • Para proporciones: usa \(\hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}\), y comprueba que \(n\hat{p} \geq 10\) y \(n(1-\hat{p}) \geq 10\).
  • Más amplio no siempre es mejor: un IC muy amplio implica poca precisión. Informa tanto el intervalo como el tamaño muestral para que el lector pueda valorar la precisión.
  • No digas “la probabilidad de que \(\mu\) esté en el intervalo es el 95%”. Di “tenemos un 95% de confianza” o “el procedimiento captura \(\mu\) el 95% de las veces”.