Distribución de Weibull

La distribución de Weibull es el modelo estándar para datos de tiempo hasta el fallo en ingeniería de fiabilidad y análisis de supervivencia. Su característica principal es el parámetro de forma \(k\), que determina si la tasa de fallo aumenta, permanece constante o disminuye con el tiempo.

Definición

Una variable aleatoria \(X\) sigue una distribución de Weibull con parámetro de forma \(k > 0\) y parámetro de escala \(\lambda > 0\), escrita \(X \sim \text{Weibull}(k, \lambda)\), si:

\[f(x) = \frac{k}{\lambda}\left(\frac{x}{\lambda}\right)^{k-1} e^{-(x/\lambda)^k}, \quad x \geq 0\]

La CDF tiene una forma cerrada sencilla:

\[F(x) = 1 - e^{-(x/\lambda)^k}, \quad x \geq 0\]

⚠️ La notación de los parámetros varía según la fuente y el software

Distintas fuentes usan símbolos diferentes para los mismos parámetros:

  • R usa shape (\(k\)) y scale (\(\lambda\)): dweibull(x, shape = k, scale = lambda).
  • Algunos libros de ingeniería escriben la PDF como \(f(x) = \frac{\beta}{\eta}(x/\eta)^{\beta-1}e^{-(x/\eta)^\beta}\), donde \(\beta = k\) (forma) y \(\eta = \lambda\) (vida característica).
  • Algunas fuentes usan la tasa \(\lambda' = 1/\lambda\) en lugar de la escala \(\lambda\).

Comprueba siempre qué convención usa tu fuente antes de sustituir números en una fórmula.

El parámetro de forma: tres regímenes de fallo

El parámetro de forma \(k\) determina cómo evoluciona la tasa de fallo a lo largo del tiempo, que es la pregunta central en el análisis de fiabilidad:

  • \(k < 1\): la tasa de fallo disminuye con el tiempo. Los fallos se concentran en las primeras etapas de la vida del componente (mortalidad infantil, defectos iniciales). Los elementos que superan el período inicial se vuelven progresivamente más fiables.
  • \(k = 1\): la tasa de fallo es constante. La distribución de Weibull se reduce a la distribución exponencial. Los fallos ocurren de forma aleatoria, independientemente de la edad.
  • \(k > 1\): la tasa de fallo aumenta con el tiempo. Los componentes se desgastan y tienen mayor probabilidad de fallar a medida que envejecen. La mayoría de los componentes mecánicos entran en esta categoría.

PDF y CDF de la distribución de Weibull para distintos parámetros de forma

Función de riesgo

La función de riesgo (también llamada tasa de fallo o función de intensidad) es la tasa instantánea de fallo en el tiempo \(x\), dado que se ha sobrevivido hasta \(x\):

\[h(x) = \frac{f(x)}{1 - F(x)} = \frac{k}{\lambda}\left(\frac{x}{\lambda}\right)^{k-1}\]

Para la distribución de Weibull, la función de riesgo es una potencia de \(x\):

  • \(k < 1\): \(h(x)\) decrece (dominan los fallos tempranos).
  • \(k = 1\): \(h(x) = 1/\lambda\) es constante (sin memoria, exponencial).
  • \(k > 1\): \(h(x)\) crece (envejecimiento y desgaste).
Función de riesgo: k<1 da tasa de fallo decreciente (mortalidad infantil), k=1 constante (exponencial), k>1 creciente (desgaste)

Figure 1: Función de riesgo: k<1 da tasa de fallo decreciente (mortalidad infantil), k=1 constante (exponencial), k>1 creciente (desgaste)

💡 La curva de bañera

En ingeniería de fiabilidad, la vida útil de una población de componentes suele seguir la “curva de bañera”: tasa de fallo alta al principio (mortalidad infantil, \(k < 1\)), luego una tasa estable y baja durante la vida útil (\(k \approx 1\)), y por último tasa creciente a medida que los componentes envejecen (\(k > 1\)). La distribución de Weibull modela cada fase por separado. En la práctica, la curva de bañera completa requiere una mezcla de distribuciones de Weibull con distintos parámetros de forma.

Propiedades

Para \(X \sim \text{Weibull}(k, \lambda)\):

  1. Valor esperado (media)

\[E(X) = \lambda\,\Gamma\!\left(1 + \frac{1}{k}\right)\]

donde \(\Gamma\) es la función gamma. Para \(k = 2\), \(\lambda = 5\): \(E(X) = 5\,\Gamma(1{,}5) = 5 \times 0{,}886 \approx 4{,}43\).

  1. Varianza

\[\text{Var}(X) = \lambda^2\left[\Gamma\!\left(1 + \frac{2}{k}\right) - \left(\Gamma\!\left(1 + \frac{1}{k}\right)\right)^2\right]\]

  1. Asimetría

\[\text{Asimetría} = \frac{\Gamma(1 + 3/k)\lambda^3 - 3E(X)\text{Var}(X) - E(X)^3}{\text{Var}(X)^{3/2}}\]

Positiva para \(k < 3{,}6\), aproximadamente cero para \(k \approx 3{,}6\) y ligeramente negativa para valores mayores de \(k\).

  1. Mediana

\[\text{Mediana} = \lambda(\ln 2)^{1/k}\]

  1. Moda

\[\text{Moda} = \lambda\left(\frac{k-1}{k}\right)^{1/k}, \quad \text{para } k > 1\]

Para \(k \leq 1\), la moda es 0.

  1. Función cuantil

\[Q(p) = \lambda\left(-\ln(1-p)\right)^{1/k}\]

Ejemplo paso a paso

Una pala de turbina tiene una vida útil que sigue \(\text{Weibull}(k=2{,}5,\, \lambda=1000)\) horas.

Probabilidad de fallo en las primeras 500 horas:

\[F(500) = 1 - e^{-(500/1000)^{2{,}5}} = 1 - e^{-0{,}177} \approx 0{,}162\]

Aproximadamente el 16,2% de las palas fallan en las primeras 500 horas.

Vida útil esperada:

\[E(X) = 1000\,\Gamma(1 + 1/2{,}5) = 1000\,\Gamma(1{,}4) \approx 1000 \times 0{,}887 = 887 \text{ horas}\]

Vida útil mediana:

\[Q(0{,}5) = 1000(\ln 2)^{1/2{,}5} = 1000 \times 0{,}693^{0{,}4} \approx 1000 \times 0{,}860 = 860 \text{ horas}\]

Percentil 90 (vida útil que alcanza el 90% de las palas):

\[Q(0{,}90) = 1000(-\ln 0{,}10)^{1/2{,}5} = 1000 \times 2{,}303^{0{,}4} \approx 1000 \times 1{,}406 = 1{.}406 \text{ horas}\]

Análisis de supervivencia: estudio clínico

En un ensayo clínico, el tiempo hasta la recaída sigue \(\text{Weibull}(k=2,\, \lambda=5)\) años (\(k>1\) porque el riesgo de recaída aumenta con el tiempo transcurrido desde el tratamiento).

  • Tiempo mediano hasta la recaída: \(5(\ln 2)^{1/2} \approx 5 \times 0{,}833 = 4{,}16\) años.
  • Probabilidad de supervivencia sin recaída más allá de 3 años: \(P(X > 3) = e^{-(3/5)^2} = e^{-0{,}36} \approx 0{,}698\) (aproximadamente el 70%).
  • Probabilidad de supervivencia sin recaída más allá de 7 años: \(e^{-(7/5)^2} = e^{-1{,}96} \approx 0{,}141\) (aproximadamente el 14%).

Example icon

💡 Relación con otras distribuciones

  • Exponencial: \(\text{Weibull}(1, \lambda) = \text{Exp}(1/\lambda)\). Tasa de riesgo constante.
  • Rayleigh: \(\text{Weibull}(2, \lambda)\). Usada para modelar la velocidad del viento.
  • Gamma: ambas generalizan la exponencial, pero de forma distinta. La gamma modela la suma de tiempos de espera exponenciales; la Weibull modela un único tiempo de espera con tasa no constante.
  • Valor extremo: si \(X \sim \text{Weibull}(k, \lambda)\), entonces \(\ln(X)\) sigue una distribución de Gumbel (valor extremo).