Función de distribución conjunta

La función de distribución conjunta extiende el concepto de la CDF a dos variables simultáneamente. Da la probabilidad de que tanto \(X\) como \(Y\) caigan por debajo de umbrales especificados al mismo tiempo, y es la base para calcular cualquier probabilidad que involucre un par de variables aleatorias.

Definición

La función de distribución conjunta (CDF conjunta) de dos variables aleatorias \(X\) e \(Y\) es:

\[ F_{X,Y}(x, y) = P(X \leq x,\ Y \leq y) \]

Da la probabilidad de que \(X\) tome un valor como máximo \(x\) y \(Y\) tome un valor como máximo \(y\), simultáneamente.

Propiedades

La CDF conjunta siempre satisface:

  • No decreciente: \(F_{X,Y}(x,y)\) es no decreciente tanto en \(x\) como en \(y\) por separado.
  • Límites en la frontera:
    • \(\lim_{x \to -\infty} F_{X,Y}(x,y) = 0\) para cualquier \(y\) fijo.
    • \(\lim_{y \to -\infty} F_{X,Y}(x,y) = 0\) para cualquier \(x\) fijo.
    • \(\lim_{x \to \infty,\, y \to \infty} F_{X,Y}(x,y) = 1\).
  • Continua por la derecha en ambos argumentos.
  • Recuperación de marginales: hacer tender un argumento a \(+\infty\) da la CDF marginal de la otra variable:

\[F_X(x) = \lim_{y \to \infty} F_{X,Y}(x,y), \qquad F_Y(y) = \lim_{x \to \infty} F_{X,Y}(x,y)\]

⚠️ La CDF conjunta da probabilidades de esquina, no de rectángulo

(F_{X,Y}(x,y)) es la probabilidad del cuadrante inferior izquierdo ((-\infty, x] \times (-\infty, y]). Para obtener la probabilidad de un rectángulo (P(a < X \leq b,\ c < Y \leq d)), se necesita la fórmula de inclusión-exclusión:

\[P(a < X \leq b,\ c < Y \leq d) = F_{X,Y}(b,d) - F_{X,Y}(a,d) - F_{X,Y}(b,c) + F_{X,Y}(a,c)\]

Es el análogo bidimensional de \(P(a < X \leq b) = F(b) - F(a)\).

Caso discreto

Para variables discretas, la CDF conjunta se obtiene sumando la PMF conjunta sobre todos los pares \((x', y')\) con \(x' \leq x\) e \(y' \leq y\):

\[F_{X,Y}(x,y) = \sum_{x' \leq x} \sum_{y' \leq y} P(X = x',\ Y = y')\]

La PMF conjunta se puede recuperar a partir de la CDF conjunta usando la fórmula de diferencias bidimensional:

\[p_{X,Y}(x,y) = F_{X,Y}(x,y) - F_{X,Y}(x-1,y) - F_{X,Y}(x,y-1) + F_{X,Y}(x-1,y-1)\]

Paso a paso: CDF conjunta a partir de la tabla ejercicio/salud

Usando la PMF conjunta de la sección anterior:

\(Y=1\) \(Y=2\) \(Y=3\)
\(X=0\) 0,15 0,10 0,05
\(X=1\) 0,05 0,20 0,15
\(X=2\) 0,02 0,08 0,20

Calculando \(F_{X,Y}(1, 2) = P(X \leq 1,\ Y \leq 2)\):

\[F_{X,Y}(1,2) = p(0,1) + p(0,2) + p(1,1) + p(1,2) = 0{,}15 + 0{,}10 + 0{,}05 + 0{,}20 = 0{,}50\]

Tabla completa de la CDF conjunta:

\(y=1\) \(y=2\) \(y=3\)
\(x=0\) \(0{,}15\) \(0{,}25\) \(0{,}30\)
\(x=1\) \(0{,}25\) \(0{,}55\) \(0{,}70\)
\(x=2\) \(0{,}27\) \(0{,}65\) \(1{,}00\)

Cada celda acumula todas las probabilidades conjuntas del rectángulo superior izquierdo hasta ese punto.

Example icon
CDF conjunta como mapa de calor: los valores se acumulan desde la esquina superior izquierda, alcanzando 1 en la inferior derecha

Figure 1: CDF conjunta como mapa de calor: los valores se acumulan desde la esquina superior izquierda, alcanzando 1 en la inferior derecha

Caso continuo

Para variables continuas, la CDF conjunta es la integral doble de la PDF conjunta:

\[F_{X,Y}(x,y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f_{X,Y}(x', y')\, dy'\, dx'\]

La PDF conjunta se recupera diferenciando:

\[f_{X,Y}(x,y) = \frac{\partial^2 F_{X,Y}(x,y)}{\partial x\, \partial y}\]

CDF conjunta de dos variables normales estándar independientes: la superficie sube de 0 en la esquina inferior izquierda a 1 en la superior derecha

Figure 2: CDF conjunta de dos variables normales estándar independientes: la superficie sube de 0 en la esquina inferior izquierda a 1 en la superior derecha

Probabilidad de un rectángulo para variables continuas

Sean (X) e (Y) variables normales estándar independientes. ¿Cuánto vale (P(-1 \leq X \leq 1,\ 0 \leq Y \leq 1))?

Usando la fórmula de inclusión-exclusión y el hecho de que \(F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y)\) para variables independientes:

\[P(-1 \leq X \leq 1,\ 0 \leq Y \leq 1) = [F_X(1) - F_X(-1)] \times [F_Y(1) - F_Y(0)]\]

\[= [0{,}841 - 0{,}159] \times [0{,}841 - 0{,}500] = 0{,}683 \times 0{,}341 \approx 0{,}233\]

Aproximadamente el 23% de las observaciones caen en ese rectángulo.

Example icon

Independencia mediante la CDF conjunta

\(X\) e \(Y\) son independientes si y solo si su CDF conjunta se factoriza:

\[F_{X,Y}(x,y) = F_X(x) \cdot F_Y(y) \quad \text{para todo } x, y\]

Esto es equivalente a la factorización de la PMF o la PDF conjunta, pero expresado en términos de CDF. El ejemplo continuo anterior usa esto directamente: como \(X\) e \(Y\) son normales independientes, \(F_{X,Y}(x,y) = \Phi(x)\cdot\Phi(y)\).