¿Qué es una serie de tiempo?

Una serie de tiempo es una secuencia de observaciones indexadas por el tiempo. A diferencia de los datos de corte transversal, las observaciones consecutivas en una serie de tiempo suelen estar correlacionadas: el valor de hoy depende del de ayer. Esta estructura de dependencia es lo que hace que las series de tiempo sean a la vez más informativas y más difíciles de analizar que los datos independientes.

Definición

Una serie de tiempo es un conjunto de observaciones \(\{y_t\}\) donde \(t\) indexa el tiempo: \(t = 1, 2, \ldots, T\). Las observaciones pueden registrarse a cualquier frecuencia regular: anual, trimestral, mensual, semanal, diaria o intradía.

Ejemplos en distintos ámbitos:

  • Economía: PIB mensual, inflación trimestral, precios de acciones diarios.
  • Meteorología: temperatura diaria, velocidad del viento horaria, precipitación anual.
  • Negocio: ventas semanales, tráfico web mensual, consumo energético diario.
  • Medicina: frecuencia cardíaca a lo largo del tiempo, ingresos diarios de pacientes, incidencia semanal de enfermedades.

El reto fundamental es que las observaciones no son independientes. Los métodos estadísticos estándar (regresión, contrastes de hipótesis, intervalos de confianza) asumen datos i.i.d. Aplicarlos directamente a series de tiempo produce errores estándar incorrectos e inferencias engañosas.

Datos mensuales de pasajeros aéreos de 1949 a 1960 con una clara tendencia ascendente y patrón estacional

La serie de pasajeros aéreos muestra tres características simultáneamente: una tendencia ascendente (línea roja discontinua), un patrón estacional claro (picos en verano) y una amplitud creciente (las oscilaciones estacionales aumentan con el nivel). Estas tres características definen los componentes principales de una serie de tiempo.

Componentes de una serie de tiempo

Cualquier serie de tiempo puede entenderse como la combinación de cuatro componentes:

  1. Tendencia (\(T_t\))

La dirección a largo plazo de la serie: ascendente, descendente o plana. Refleja fuerzas de evolución lenta: crecimiento demográfico, cambio tecnológico, ciclos económicos a largo plazo. La tendencia suele ser suave y persistente.

  1. Estacionalidad (\(S_t\))

Patrones regulares y repetitivos a una frecuencia fija y conocida: diaria (más tráfico en horas punta), semanal (menos ingresos hospitalarios los fines de semana), mensual (más ventas minoristas en diciembre), trimestral. La estacionalidad tiene un periodo fijo y es predecible.

  1. Ciclo (\(C_t\))

Oscilaciones a largo plazo sin periodo fijo: ciclos económicos de varios años, ciclos de precios de materias primas. A diferencia de la estacionalidad, los ciclos son irregulares en frecuencia y amplitud y más difíciles de predecir.

  1. Componente irregular / ruido (\(\varepsilon_t\))

La variación residual que no puede atribuirse a la tendencia, la estacionalidad ni el ciclo. Idealmente es ruido blanco: media cero, varianza constante, sin autocorrelación.

Descomposición aditiva vs multiplicativa

Los cuatro componentes se combinan de forma aditiva o multiplicativa:

\[y_t = T_t + S_t + C_t + \varepsilon_t \quad \text{(aditiva)}\]

\[y_t = T_t \times S_t \times C_t \times \varepsilon_t \quad \text{(multiplicativa)}\]

Aditiva: las fluctuaciones estacionales son constantes en términos absolutos independientemente del nivel. Se usa cuando la amplitud de las oscilaciones estacionales no varía con el tiempo.

Multiplicativa: las fluctuaciones estacionales crecen proporcionalmente con el nivel. Se usa cuando la amplitud aumenta a medida que crece la serie (como en los datos de pasajeros aéreos). Equivale a aplicar un modelo aditivo a \(\log(y_t)\).

Descomposición clásica de la serie de pasajeros aéreos en tendencia, componente estacional y residuos

La descomposición multiplicativa separa la serie de pasajeros aéreos en sus tres componentes. La tendencia (verde) muestra un crecimiento sostenido. El componente estacional (naranja) es estable en términos relativos. El residuo (gris) es aproximadamente ruido blanco, lo que confirma que la descomposición ha capturado la estructura principal.

Estacionariedad

Una serie de tiempo es estacionaria si sus propiedades estadísticas no cambian con el tiempo:

\[E[y_t] = \mu \quad \forall t \qquad \text{(media constante)}\] \[\text{Var}(y_t) = \sigma^2 \quad \forall t \qquad \text{(varianza constante)}\] \[\text{Cov}(y_t, y_{t+k}) \text{ depende solo de } k, \text{ no de } t \qquad \text{(autocovarianza constante)}\]

La mayoría de los modelos de series de tiempo (AR, MA, ARMA, ARIMA) requieren o asumen estacionariedad. Una serie con tendencia o varianza creciente es no estacionaria y debe transformarse antes de modelarla.

Transformaciones habituales para lograr estacionariedad:

  • Diferenciación: \(\Delta y_t = y_t - y_{t-1}\) elimina una tendencia lineal.
  • Transformación logarítmica: \(\log(y_t)\) estabiliza la varianza que crece con el nivel.
  • Diferenciación estacional: \(y_t - y_{t-s}\) elimina los patrones estacionales.

Tres paneles que muestran una serie no estacionaria, su primera diferencia y la autocorrelación de la serie diferenciada

Tras aplicar la transformación logarítmica y la diferenciación estacional, la serie se vuelve estacionaria: media constante en torno a cero, sin tendencia visible y una ACF con pocos picos significativos.

⚠️ Aplicar regresión estándar a series no estacionarias produce resultados espurios

Regresar una serie no estacionaria sobre otra puede arrojar un \(R^2\) elevado y coeficientes significativos aunque las series no guarden ninguna relación. Esto se conoce como regresión espuria, un problema clásico descrito por Granger y Newbold (1974).

Dos series no estacionarias que coincidan en su tendencia parecerán correlacionadas aunque no tengan nada en común. Comprueba siempre la estacionariedad antes de modelar, y diferencia o transforma la serie si es necesario.

Notación y operador de retardo

El operador de retardo \(L\) (o de diferencia hacia atrás \(B\)) es la notación estándar en series de tiempo:

\[Ly_t = y_{t-1}, \qquad L^k y_t = y_{t-k}\]

\[\Delta y_t = y_t - y_{t-1} = (1-L)y_t\]

\[\Delta^d y_t = (1-L)^d y_t \quad \text{(diferenciación de orden $d$)}\]

Esta notación compacta simplifica la escritura de modelos AR, MA, ARIMA y estacionales.

Resumen de modelos de series de tiempo

Los siguientes artículos cubren los principales enfoques de modelización:

Modelo Idea clave Más adecuado para
AR(\(p\)) El valor actual depende de \(p\) valores pasados Series con memoria corta y reversión a la media
MA(\(q\)) El valor actual depende de \(q\) errores pasados Series con perturbaciones que se disipan
ARMA(\(p,q\)) Combina AR y MA Series estacionarias
ARIMA(\(p,d,q\)) ARMA tras \(d\) diferenciaciones Series no estacionarias con tendencia
SARIMA ARIMA con términos estacionales Series estacionales
Suavizado exponencial Media ponderada de valores pasados Predicción a corto plazo
Holt-Winters Suavizado exponencial con tendencia y estacionalidad Series con tendencia y estacionalidad
ARIMAX ARIMA con regresores externos Series influidas por factores externos
Filtro de Kalman Representación en espacio de estados Observaciones ruidosas, sistemas dinámicos

💡 El flujo de trabajo habitual para modelar una serie de tiempo

Un procedimiento estándar:

  1. Representar gráficamente la serie: identificar tendencia, estacionalidad y valores atípicos.
  2. Transformar si es necesario: logaritmo para estabilizar la varianza, diferenciación para la tendencia.
  3. Comprobar la estacionariedad: test ADF o KPSS.
  4. Examinar la ACF y la PACF: identificar candidatos para los órdenes AR y MA.
  5. Ajustar modelos candidatos: comparar por AIC y BIC.
  6. Verificar los residuos: deben ser ruido blanco (test de Ljung-Box, ACF de los residuos).
  7. Predecir y evaluar: usar datos retenidos o validación cruzada.