Función de densidad de probabilidad conjunta

La función de densidad de probabilidad conjunta (PDF conjunta) de dos variables aleatorias continuas describe cómo se distribuye la probabilidad sobre todos los pares de valores posibles. Al igual que la PDF univariante, no da probabilidades directamente: las probabilidades se obtienen integrando sobre una región del plano.

Definición

Una función \(f_{X,Y}(x,y)\) es la PDF conjunta de dos variables aleatorias continuas \(X\) e \(Y\) si:

\[ P(a \leq X \leq b,\ c \leq Y \leq d) = \int_{a}^{b} \int_{c}^{d} f_{X,Y}(x,y)\, dy\, dx \]

Para ser una PDF conjunta válida, \(f_{X,Y}\) debe cumplir:

  • \(f_{X,Y}(x,y) \geq 0\) para todo \((x,y)\).
  • \(\int_{-\infty}^{\infty}\int_{-\infty}^{\infty} f_{X,Y}(x,y)\, dy\, dx = 1\).

La probabilidad de cualquier región \(A\) del plano es el volumen bajo la superficie \(f_{X,Y}\) sobre \(A\).

PDF conjunta de una normal bivariante con correlación 0,8: las elipses de nivel muestran regiones de igual densidad

Figure 1: PDF conjunta de una normal bivariante con correlación 0,8: las elipses de nivel muestran regiones de igual densidad

Las elipses más interiores corresponden a las regiones de mayor densidad. La orientación diagonal refleja la correlación positiva entre \(X\) e \(Y\): cuando \(X\) es grande, \(Y\) tiende a serlo también.

Relación con la función de distribución conjunta

La PDF conjunta y la CDF conjunta \(F_{X,Y}(x,y)\) se relacionan por:

\[F_{X,Y}(x,y) = \int_{-\infty}^{x} \int_{-\infty}^{y} f_{X,Y}(x', y')\, dy'\, dx'\]

La PDF conjunta se obtiene diferenciando la CDF conjunta:

\[f_{X,Y}(x,y) = \frac{\partial^2 F_{X,Y}(x,y)}{\partial x\, \partial y}\]

Densidades marginales

La densidad marginal de cada variable se obtiene integrando la PDF conjunta respecto a la otra variable:

\[f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\, dy \qquad f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\, dx\]

Las densidades marginales describen el comportamiento de cada variable por separado, sin tener en cuenta la otra.

Densidades marginales de una normal bivariante

Si ((X, Y)) sigue una distribución normal bivariante con medias (\mu_X), (\mu_Y), varianzas (\sigma_X^2), (\sigma_Y^2) y correlación (\rho), las densidades marginales son:

\[f_X(x) = \frac{1}{\sigma_X\sqrt{2\pi}} e^{-\frac{(x-\mu_X)^2}{2\sigma_X^2}}, \qquad f_Y(y) = \frac{1}{\sigma_Y\sqrt{2\pi}} e^{-\frac{(y-\mu_Y)^2}{2\sigma_Y^2}}\]

Cada variable por separado sigue una distribución normal, independientemente del valor de \(\rho\). Esta es una propiedad especial de la distribución normal bivariante.

Example icon

Independencia

\(X\) e \(Y\) son independientes si y solo si su PDF conjunta se factoriza:

\[f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y)\]

En este caso, el comportamiento de una variable no aporta ninguna información sobre la otra.

⚠️ Correlación cero no implica independencia en general

Para la distribución normal bivariante, (\rho = 0) sí implica independencia. Pero esto es una excepción, no la regla. Para la mayoría de distribuciones conjuntas, covarianza cero no implica independencia: la dependencia puede ser no lineal y la covarianza no la captura. Verifica siempre la factorización de la PDF conjunta, no solo la correlación.

Densidad condicionada

La densidad condicionada de \(Y\) dado \(X = x\) es:

\[f_{Y|X}(y \mid x) = \frac{f_{X,Y}(x,y)}{f_X(x)}\]

Describe la distribución de \(Y\) cuando se fija el valor de \(X\). Para la normal bivariante, la distribución condicionada de \(Y\) dado \(X = x\) es también normal:

\[Y \mid X = x \sim \mathcal{N}\!\left(\mu_Y + \rho\frac{\sigma_Y}{\sigma_X}(x - \mu_X),\ \sigma_Y^2(1-\rho^2)\right)\]

La media condicionada es lineal en \(x\) y la varianza condicionada es menor que la marginal cuando \(|\rho| > 0\).

💡 PDF conjunta vs PDF marginal: qué usar en cada caso

Usa la PDF conjunta cuando necesites calcular la probabilidad de un evento que involucra las dos variables simultáneamente, como \(P(X > 1 \text{ y } Y > 1)\). Usa las densidades marginales cuando te interese el comportamiento de una sola variable sin importar el valor de la otra. Usa las densidades condicionadas cuando quieras estudiar el comportamiento de una variable sabiendo el valor de la otra.