Distribución de Bernoulli

La distribución de Bernoulli modela un único ensayo con exactamente dos resultados posibles: éxito (1) con probabilidad \(p\), y fracaso (0) con probabilidad \(1-p\). Es la distribución discreta más sencilla y el bloque fundamental de la distribución binomial.

Definición

Una variable aleatoria \(X\) sigue una distribución de Bernoulli con parámetro \(p \in [0, 1]\), escrita \(X \sim \text{Bernoulli}(p)\), si:

\[P(X = x) = p^x (1-p)^{1-x} \quad \text{para } x \in \{0, 1\}\]

Lo que es equivalente a:

\[P(X = 1) = p \quad \text{(éxito)}, \qquad P(X = 0) = 1 - p \quad \text{(fracaso)}\]

El parámetro \(p\) es la probabilidad de éxito. Todo lo demás sobre la distribución se deriva de este único número.

Función de masa de probabilidad y CDF

La PMF asigna probabilidad \(p\) al resultado 1 y \(1-p\) al resultado 0. La CDF es:

\[F(x) = \begin{cases} 0 & \text{si } x < 0 \\ 1-p & \text{si } 0 \leq x < 1 \\ 1 & \text{si } x \geq 1 \end{cases}\]

PMF y CDF de la distribución de Bernoulli con p=0,3

Propiedades

Para \(X \sim \text{Bernoulli}(p)\):

  1. Valor esperado (media)

\[E(X) = p\]

  1. Varianza

\[\text{Var}(X) = p(1-p)\]

La varianza se maximiza en \(p = 0{,}5\) (valor de \(0{,}25\)) y es cero cuando \(p = 0\) o \(p = 1\) (casos degenerados sin aleatoriedad).

  1. Asimetría

\[\text{Asimetría} = \frac{1 - 2p}{\sqrt{p(1-p)}}\]

La distribución es simétrica solo cuando \(p = 0{,}5\). Para \(p < 0{,}5\) está sesgada a la derecha; para \(p > 0{,}5\) está sesgada a la izquierda.

  1. Curtosis

\[g_2 = \frac{1 - 6p(1-p)}{p(1-p)}\]

Para \(p = 0{,}5\): \(g_2 = (1 - 1{,}5)/0{,}25 = -2\), fuertemente platicúrtica.

  1. Función cuantil

\[Q(u) = \begin{cases} 0 & \text{si } u \leq 1 - p \\ 1 & \text{si } u > 1 - p \end{cases}\]

Ejemplo: control de calidad en producción

Una fábrica produce placas de circuito con una tasa de defectos del 15%. Cada placa es defectuosa (éxito = 1, \(p = 0{,}15\)) o no defectuosa (fracaso = 0, \(1-p = 0{,}85\)). Sea \(X \sim \text{Bernoulli}(0{,}15)\).

  • \(P(X = 1) = 0{,}15\): probabilidad de que una placa seleccionada aleatoriamente sea defectuosa.
  • \(P(X = 0) = 0{,}85\): probabilidad de que supere la inspección.
  • \(E(X) = 0{,}15\): de media, el 15% de las placas son defectuosas.
  • \(\text{Var}(X) = 0{,}15 \times 0{,}85 = 0{,}1275\).

Si se inspeccionan 200 placas de forma independiente, el número total de placas defectuosas sigue una distribución \(\text{Binomial}(200;\, 0{,}15)\), que es la suma de 200 variables Bernoulli(0,15) independientes.

Otros ejemplos de la distribución de Bernoulli

  • Filtro de spam: cada correo entrante es spam (1) o no (0). Si el 30% de los correos son spam, \(X \sim \text{Bernoulli}(0{,}3)\).
  • Ensayo clínico: un paciente responde al tratamiento (1) o no (0). Si la tasa de respuesta es del 60%, \(X \sim \text{Bernoulli}(0{,}6)\).
  • Tiro libre: un jugador de baloncesto anota (1) o falla (0) un tiro con una probabilidad igual a su media de carrera.

Example icon

⚠️ No confundas el parámetro p con un p-valor

En la distribución de Bernoulli, (p) es la probabilidad de éxito, una característica fija del proceso que se modela. Un p-valor en los contrastes de hipótesis es un concepto completamente distinto: es la probabilidad de observar resultados al menos tan extremos como los datos, asumiendo que la hipótesis nula es cierta. La notación compartida genera confusión, especialmente en cursos introductorios.

Relación con la distribución binomial

La distribución de Bernoulli es el caso particular de la distribución binomial con \(n = 1\):

\[\text{Binomial}(1, p) = \text{Bernoulli}(p)\]

Más importante aún, si \(X_1, X_2, \ldots, X_n\) son variables \(\text{Bernoulli}(p)\) independientes, su suma:

\[S = X_1 + X_2 + \cdots + X_n \sim \text{Binomial}(n, p)\]

Por eso se dice que la distribución de Bernoulli es el bloque fundamental de la binomial: todo recuento binomial es una suma de ensayos de Bernoulli independientes.

💡 Cuándo usar la distribución de Bernoulli

Usa Bernoulli cuando tengas un único ensayo con dos resultados posibles y una probabilidad de éxito fija. Si repites el ensayo \(n\) veces de forma independiente, usa la Binomial. Si cuentas el número de ensayos hasta el primer éxito, usa la Geométrica. Si la probabilidad de éxito varía entre ensayos, ninguna de estas aplica directamente.