Función de distribución acumulada

La función de distribución acumulada (CDF) da la probabilidad de que una variable aleatoria tome un valor menor o igual a un punto concreto. Funciona para cualquier tipo de variable aleatoria y es la base para calcular probabilidades, generar muestras aleatorias y definir cuantiles.

Definición

La función de distribución acumulada de una variable aleatoria \(X\) se define como:

ℹ️ CDF de una variable aleatoria

\[ F(x) = P(X \leq x), \quad \text{para todo } x \in \mathbb{R} \]

La CDF acumula probabilidad desde \(-\infty\) hasta \(x\). Está definida para cualquier número real \(x\), no solo para los valores donde \(X\) tiene probabilidad positiva.

Propiedades de la CDF

Toda CDF, independientemente del tipo de variable aleatoria, cumple las siguientes propiedades:

  • Límites: \(\lim_{x \to -\infty} F(x) = 0\) y \(\lim_{x \to +\infty} F(x) = 1\).
  • No decreciente: si \(a < b\) entonces \(F(a) \leq F(b)\).
  • Acotada: \(0 \leq F(x) \leq 1\) para todo \(x\).
  • Continua por la derecha: \(\lim_{h \to 0^+} F(x+h) = F(x)\).
  • Probabilidad en un intervalo: \(P(a < X \leq b) = F(b) - F(a)\).

La última propiedad es la más útil en la práctica: se puede calcular la probabilidad de cualquier intervalo con solo dos evaluaciones de la CDF.

CDF para variables aleatorias discretas

Para una variable aleatoria discreta con valores posibles \(x_1 < x_2 < \cdots\) y probabilidades \(p_i = P(X = x_i)\), la CDF es:

ℹ️ CDF para variables discretas

\[ F(x) = \sum_{x_i \leq x} p_i \]

La CDF de una variable discreta es una función escalonada: permanece constante entre valores consecutivos y da un salto en cada \(x_i\) igual exactamente a \(p_i\).

CDF de dos lanzamientos de moneda

Se lanza una moneda equilibrada dos veces. Sea (X) = número de caras. La PMF es:

  • \(P(X = 0) = 0{,}25\), \(P(X = 1) = 0{,}50\), \(P(X = 2) = 0{,}25\)

La CDF es:

  • \(F(x) = 0\) para \(x < 0\)
  • \(F(x) = 0{,}25\) para \(0 \leq x < 1\)
  • \(F(x) = 0{,}75\) para \(1 \leq x < 2\)
  • \(F(x) = 1{,}00\) para \(x \geq 2\)

Así, \(P(X \leq 1) = 0{,}75\): hay un 75% de probabilidad de obtener como máximo una cara.

Example icon
CDF de una Binomial(10; 0,5): función escalonada que salta en cada valor posible

Figure 1: CDF de una Binomial(10; 0,5): función escalonada que salta en cada valor posible

⚠️ En variables discretas, P(X < x) ≠ P(X ≤ x)

Para variables aleatorias discretas, las desigualdades estrictas y no estrictas no son equivalentes:

\[P(X < 2) = F(1) = 0{,}75 \neq P(X \leq 2) = F(2) = 1{,}00\]

La diferencia es exactamente \(P(X = 2) = 0{,}25\). Esta distinción desaparece para variables continuas, donde \(P(X = x) = 0\) para cualquier punto, pero para variables discretas importa y es una fuente habitual de errores en exámenes.

CDF para variables aleatorias continuas

Para una variable aleatoria continua con función de densidad de probabilidad \(f(x)\), la CDF es:

ℹ️ CDF para variables continuas

\[ F(x) = \int_{-\infty}^{x} f(t)\, dt \]

La CDF es una curva suave y no decreciente que va de 0 a 1. La relación entre PDF y CDF es:

\[f(x) = \frac{d}{dx} F(x)\]

La PDF es la derivada de la CDF, y la CDF es la integral de la PDF.

CDF de N(0,1): el área sombreada entre -1 y 1 es igual a F(1) - F(-1) ≈ 0,683

Figure 2: CDF de N(0,1): el área sombreada entre -1 y 1 es igual a F(1) - F(-1) ≈ 0,683

Usar la CDF para calcular probabilidades: tiempo de respuesta de un servidor

El tiempo de respuesta de un servidor web sigue una distribución exponencial con media 200 ms, por lo que (\lambda = 1/200).

La CDF es \(F(x) = 1 - e^{-x/200}\) para \(x > 0\).

  • Probabilidad de responder en menos de 100 ms: \(F(100) = 1 - e^{-0{,}5} \approx 0{,}393\)
  • Probabilidad de responder en menos de 500 ms: \(F(500) = 1 - e^{-2{,}5} \approx 0{,}918\)
  • Probabilidad de tardar entre 100 y 500 ms: \(F(500) - F(100) \approx 0{,}918 - 0{,}393 = 0{,}525\)

Las tres respuestas se obtienen con dos evaluaciones de la CDF.

Example icon

La CDF inversa: función cuantil

La función cuantil (o CDF inversa) es \(F^{-1}(p)\): da el valor \(x\) tal que \(F(x) = p\).

\[Q(p) = F^{-1}(p) = \inf\{x : F(x) \geq p\}\]

Así se definen formalmente los percentiles y cuantiles. La mediana es \(Q(0{,}5)\), el primer cuartil es \(Q(0{,}25)\), etc.

💡 La función cuantil es esencial para la simulación

Para generar muestras aleatorias de cualquier distribución, solo se necesita su función cuantil y un generador de números aleatorios uniformes. El método de la transformada inversa funciona así: si \(U \sim \text{Uniforme}(0,1)\), entonces \(X = F^{-1}(U)\) tiene exactamente la distribución con CDF \(F\). Esta es la base de la generación de números aleatorios en la mayoría del software estadístico.

CDF para variables aleatorias mixtas

Las variables aleatorias mixtas tienen una CDF que combina saltos (del componente discreto) con tramos suaves (del componente continuo). La CDF sigue siendo continua por la derecha y no decreciente, pero no es ni una función escalonada pura ni una curva suave.

CDF mixta: reclamaciones de seguros

Una póliza de seguro paga cero con probabilidad 0,6 (no se presenta ninguna reclamación) y una cantidad positiva que sigue una distribución exponencial en caso contrario. La CDF es:

  • \(F(0) = 0{,}6\) (salto de 0,6 en cero)
  • \(F(x) = 0{,}6 + 0{,}4(1 - e^{-\lambda x})\) para \(x > 0\) (crecimiento exponencial suave)

La CDF parte de 0, salta a 0,6 en \(x = 0\) y luego aumenta suavemente hasta 1.

Example icon