Función de densidad de probabilidad

La función de densidad de probabilidad (PDF) describe cómo se distribuye la probabilidad entre los posibles valores de una variable aleatoria continua. La PDF en sí no es una probabilidad, pero su integral sobre cualquier intervalo da la probabilidad de que la variable caiga en ese intervalo.

Definición

Una función \(f(x)\) es la función de densidad de probabilidad de una variable aleatoria continua \(X\) si:

\[ P(a \leq X \leq b) = \int_{a}^{b} f(x)\, dx \quad \text{para cualquier } a \leq b \]

En términos simples: la probabilidad de que \(X\) caiga entre \(a\) y \(b\) es el área bajo la curva de \(f(x)\) desde \(a\) hasta \(b\).

Probabilidad como área bajo la curva: P(-1 ≤ X ≤ 1) ≈ 0,683 para una distribución normal estándar

Figure 1: Probabilidad como área bajo la curva: P(-1 ≤ X ≤ 1) ≈ 0,683 para una distribución normal estándar

⚠️ f(x) no es una probabilidad: puede ser mayor que 1

Esta es la confusión más frecuente sobre las PDF. El valor (f(x)) es una densidad, no una probabilidad. Las probabilidades se obtienen integrando, no evaluando (f(x)) directamente.

Como consecuencia, no hay límite superior para \(f(x)\): una distribución uniforme en \([0; 0{,}1]\) tiene \(f(x) = 10\) en todo ese intervalo, y es perfectamente válido. La integral sigue siendo 1:

\[\int_0^{0{,}1} 10\, dx = 10 \times 0{,}1 = 1\]

La única restricción es \(f(x) \geq 0\) y \(\int_{-\infty}^{\infty} f(x)\, dx = 1\).

Propiedades de la PDF

Una función \(f(x)\) es una PDF válida si y solo si:

  • \(f(x) \geq 0\) para todo \(x\).
  • \(\int_{-\infty}^{\infty} f(x)\, dx = 1\).

De la definición se derivan propiedades adicionales:

  • \(P(X = x) = 0\) para cualquier punto individual (la integral sobre un solo punto es cero).
  • \(P(a \leq X \leq b) = P(a < X \leq b) = P(a \leq X < b) = P(a < X < b)\): las desigualdades estrictas y no estrictas son equivalentes para variables continuas.

💡 Cómo comprobar si una función es una PDF válida

Para verificar que \(f(x)\) es una PDF: (1) confirma que \(f(x) \geq 0\) en todo su dominio, y (2) intégrala sobre su dominio completo y comprueba que el resultado es 1. Si alguna condición falla, no es una PDF válida. Es una pregunta habitual en exámenes.

PDF más habituales

Distribución normal

La distribución más importante en estadística. Su PDF es:

\[f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}\]

La curva en forma de campana es simétrica alrededor de \(\mu\). No existe una expresión cerrada para su integral, por lo que las probabilidades se calculan numéricamente o mediante tablas.

Distribución exponencial

Modela tiempos de espera y vidas útiles de sistemas con tasa de fallo constante:

\[f(x) = \lambda e^{-\lambda x} \quad \text{para } x \geq 0\]

El parámetro \(\lambda > 0\) es la tasa. La media es \(1/\lambda\).

Distribución uniforme

Todos los valores en \([a, b]\) son igualmente probables:

\[f(x) = \frac{1}{b-a} \quad \text{para } a \leq x \leq b\]

La distribución continua más sencilla. Su integral de \(a\) a \(b\) da \((b-a) \cdot \frac{1}{b-a} = 1\).

Tres funciones de densidad de probabilidad habituales: normal (izquierda), exponencial (centro) y uniforme (derecha)

Figure 2: Tres funciones de densidad de probabilidad habituales: normal (izquierda), exponencial (centro) y uniforme (derecha)

Calcular probabilidades a partir de la PDF

Ejemplo 1: distribución uniforme

Un autobús llega a una parada con un tiempo de espera distribuido uniformemente entre 0 y 10 minutos. ¿Cuál es la probabilidad de esperar entre 2 y 6 minutos?

La PDF es \(f(x) = 1/10\) para \(0 \leq x \leq 10\).

\[P(2 \leq X \leq 6) = \int_2^6 \frac{1}{10}\, dx = \frac{1}{10} \times (6-2) = 0{,}4\]

Hay un 40% de probabilidad de esperar entre 2 y 6 minutos.

Ejemplo 2: distribución exponencial

Una llamada de atención al cliente dura un tiempo exponencialmente distribuido con media 5 minutos (\(\lambda = 0{,}2\)). ¿Cuál es la probabilidad de que la llamada dure menos de 3 minutos?

\[P(X \leq 3) = \int_0^3 0{,}2\, e^{-0{,}2x}\, dx = \left[-e^{-0{,}2x}\right]_0^3 = 1 - e^{-0{,}6} \approx 0{,}451\]

Aproximadamente el 45% de las llamadas terminan en los primeros 3 minutos.

Verificar una PDF: ¿es válida esta función?

¿Es (f(x) = 2x) para (0 \leq x \leq 1) (y cero en otro caso) una PDF válida?

Comprueba la no negatividad: \(2x \geq 0\) para \(x \in [0,1]\). ✓

Comprueba la normalización: \[\int_0^1 2x\, dx = \left[x^2\right]_0^1 = 1 - 0 = 1 \checkmark\]

Sí, es una PDF válida. Asigna más probabilidad a los valores cercanos a 1 que a los cercanos a 0.

¿Cuánto vale \(P(0{,}5 \leq X \leq 1)\)?

\[P(0{,}5 \leq X \leq 1) = \int_{0{,}5}^1 2x\, dx = \left[x^2\right]_{0{,}5}^1 = 1 - 0{,}25 = 0{,}75\]

Example icon

Relación con la CDF

La PDF y la CDF son dos caras de la misma moneda:

\[F(x) = \int_{-\infty}^x f(t)\, dt \qquad \text{y} \qquad f(x) = \frac{d}{dx}F(x)\]

La CDF es la integral de la PDF; la PDF es la derivada de la CDF. Dada una de las dos, siempre se puede obtener la otra (siempre que \(F\) sea diferenciable).