Función de densidad de probabilidad marginal
La distribución marginal de una variable es lo que se obtiene al observar esa variable sola, ignorando toda la información sobre la otra. Se calcula sumando (discreta) o integrando (continua) la distribución conjunta sobre todos los valores posibles de la otra variable.
Definición
Dada la distribución conjunta de dos variables aleatorias \((X, Y)\), las distribuciones marginales son las distribuciones individuales de \(X\) e \(Y\) obtenidas al colapsar la distribución conjunta a lo largo de un eje.
Para variables continuas, las PDF marginales son:
\[ f_X(x) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\, dy \qquad f_Y(y) = \int_{-\infty}^{\infty} f_{X,Y}(x,y)\, dx \]
Para variables discretas, las PMF marginales se obtienen sumando las filas o columnas de la tabla conjunta:
\[p_X(x) = \sum_{y} p_{X,Y}(x,y) \qquad p_Y(y) = \sum_{x} p_{X,Y}(x,y)\]
El término “marginal” viene de la práctica de escribir estas sumas en los márgenes de una tabla de probabilidad conjunta.
Caso discreto: marginales a partir de una tabla conjunta
Usando el ejemplo de ejercicio y puntuación de salud de las secciones anteriores:
| \(Y=1\) | \(Y=2\) | \(Y=3\) | \(p_X(x)\) | |
|---|---|---|---|---|
| \(X=0\) | 0,15 | 0,10 | 0,05 | 0,30 |
| \(X=1\) | 0,05 | 0,20 | 0,15 | 0,40 |
| \(X=2\) | 0,02 | 0,08 | 0,20 | 0,30 |
| \(p_Y(y)\) | 0,22 | 0,38 | 0,40 | 1,00 |
La marginal de \(X\) son los totales de filas: \(P(X=0) = 0{,}30\), \(P(X=1) = 0{,}40\), \(P(X=2) = 0{,}30\).
La marginal de \(Y\) son los totales de columnas: \(P(Y=1) = 0{,}22\), \(P(Y=2) = 0{,}38\), \(P(Y=3) = 0{,}40\).
Cada marginal es una PMF válida por sí sola: no negativa y suma 1.
⚠️ Marginal vs condicionada: una diferencia crítica
Estos dos conceptos se confunden con frecuencia:
- La marginal \(p_X(x)\) ignora \(Y\) por completo. Es la distribución de \(X\) en la población completa.
- La condicionada \(P(X = x \mid Y = y)\) fija \(Y\) en un valor concreto y estudia \(X\) dentro de ese subgrupo.
De la tabla: \(P(X = 0) = 0{,}30\) (marginal), pero \(P(X = 0 \mid Y = 1) = 0{,}15/0{,}22 \approx 0{,}68\) (condicionada a mala salud). Responden a preguntas muy diferentes.
Caso continuo: calcular la PDF marginal
Supón que la PDF conjunta de \(X\) e \(Y\) es:
\[f_{X,Y}(x,y) = e^{-(x+y)}, \quad x \geq 0,\ y \geq 0\]
Primero, verifica que es una PDF conjunta válida:
\[\int_0^\infty \int_0^\infty e^{-(x+y)}\, dy\, dx = \int_0^\infty e^{-x}\left[\int_0^\infty e^{-y}\, dy\right] dx = \int_0^\infty e^{-x} \cdot 1\, dx = 1 \checkmark\]
La PDF marginal de \(X\) se obtiene integrando respecto a \(Y\):
\[f_X(x) = \int_0^\infty e^{-(x+y)}\, dy = e^{-x} \int_0^\infty e^{-y}\, dy = e^{-x} \cdot 1 = e^{-x}, \quad x \geq 0\]
Por tanto \(X \sim \text{Exponencial}(1)\), con media 1. Por simetría, \(Y\) tiene la misma distribución marginal.
Obsérvese también que \(f_{X,Y}(x,y) = e^{-x} \cdot e^{-y} = f_X(x) \cdot f_Y(y)\), lo que confirma que \(X\) e \(Y\) son independientes.
Figure 1: Distribución conjunta de dos variables correlacionadas (centro) con sus PDF marginales proyectadas en cada eje (arriba y derecha)
Propiedades clave
- Cada marginal es una PDF (o PMF) válida: no negativa e integra (o suma) a 1.
- Las marginales no determinan unívocamente la distribución conjunta: muchas distribuciones conjuntas distintas pueden tener las mismas marginales.
- Si \(X\) e \(Y\) son independientes, la distribución conjunta es igual al producto de las marginales: \(f_{X,Y}(x,y) = f_X(x) \cdot f_Y(y)\). El recíproco también es cierto.
Dos distribuciones conjuntas muy distintas pueden compartir las mismas marginales. Supón que \((X, Y)\) tiene marginales \(X \sim \text{Uniforme}(0,1)\) e \(Y \sim \text{Uniforme}(0,1)\). Una conjunta posible es el producto independiente (uniforme en el cuadrado unidad), y otra puede concentrar la probabilidad a lo largo de la diagonal \(Y = X\). Ambas tienen marginales idénticas pero estructuras de dependencia completamente distintas. Las marginales por sí solas nunca dicen cómo covarian las variables.
💡 Cómo se relacionan las marginales con todo lo demás
- PDF condicionada: divide la conjunta por la marginal de la variable condicionante.
- Independencia: comprueba si la conjunta es igual al producto de las marginales.
- Covarianza: se calcula a partir de la distribución conjunta, pero las marginales dan las medias y varianzas individuales necesarias en la fórmula.