ACF y PACF

La ACF mide la correlación entre \(y_t\) e \(y_{t-k}\) en cada retardo \(k\). La PACF mide esa misma correlación una vez eliminado el efecto de todos los retardos intermedios. Juntas son las herramientas diagnósticas principales para identificar los órdenes AR y MA antes de ajustar un modelo.

Función de autocorrelación (ACF)

La autocorrelación en el retardo \(k\) es la correlación entre \(y_t\) e \(y_{t-k}\):

\[\rho_k = \frac{\text{Cov}(y_t, y_{t-k})}{\text{Var}(y_t)} = \frac{\gamma_k}{\gamma_0}\]

donde \(\gamma_k = \text{Cov}(y_t, y_{t-k})\) es la autocovarianza en el retardo \(k\) y \(\gamma_0 = \text{Var}(y_t)\). Por definición, \(\rho_0 = 1\).

La ACF muestral estima \(\rho_k\) a partir de los datos:

\[\hat{\rho}_k = \frac{\sum_{t=k+1}^T (y_t - \bar{y})(y_{t-k} - \bar{y})}{\sum_{t=1}^T (y_t - \bar{y})^2}\]

Bajo la hipótesis nula de ausencia de autocorrelación, \(\hat{\rho}_k \approx N(0, 1/T)\) para \(T\) grande. Las bandas de confianza al 95% en los gráficos de ACF son \(\pm 1{,}96/\sqrt{T}\): los picos que superan estas bandas indican autocorrelación significativa.

Función de autocorrelación parcial (PACF)

La autocorrelación parcial en el retardo \(k\) es la correlación entre \(y_t\) e \(y_{t-k}\) tras eliminar los efectos lineales de \(y_{t-1}, y_{t-2}, \ldots, y_{t-k+1}\):

\[\phi_{kk} = \text{Corr}(y_t - \hat{y}_t,\; y_{t-k} - \hat{y}_{t-k})\]

donde \(\hat{y}_t\) es la proyección de \(y_t\) sobre \(\{y_{t-1}, \ldots, y_{t-k+1}\}\). Responde a la pregunta: “¿existe una relación directa entre \(y_t\) e \(y_{t-k}\), más allá de lo que explican los valores intermedios?”

La PACF se estima ajustando sucesivos modelos AR y registrando el último coeficiente:

\[\phi_{kk} = \text{coeficiente de } y_{t-k} \text{ en el ajuste AR}(k)\]

Patrones de ACF y PACF para identificar modelos

La ACF y la PACF teóricas de los procesos AR y MA tienen patrones característicos que guían la selección del modelo:

Proceso ACF PACF
AR(\(p\)) Decrece geométricamente (se atenúa) Se corta tras el retardo \(p\)
MA(\(q\)) Se corta tras el retardo \(q\) Decrece geométricamente (se atenúa)
ARMA(\(p,q\)) Se atenúa tras el retardo \(q-p\) Se atenúa tras el retardo \(p-q\)
Ruido blanco Sin picos significativos Sin picos significativos
Paseo aleatorio Decaimiento lento, todos elevados Solo el primer pico es significativo

“Se corta” significa que la función cae bruscamente a cero a partir de un cierto retardo. “Se atenúa” significa que decrece gradualmente (de forma geométrica u oscilatoria).

Gráficos de ACF y PACF para procesos AR(2), MA(1) y ARMA(1,1) que muestran los patrones característicos

Los patrones son claros: el AR(2) tiene la PACF que se corta en el retardo 2; el MA(1) tiene la ACF que se corta en el retardo 1; el ARMA(1,1) muestra tanto la ACF como la PACF atenuándose gradualmente.

Uso de la ACF y la PACF para identificar el orden del modelo

El procedimiento habitual:

  1. Asegurarse de que la serie es estacionaria (diferenciar si es necesario).
  2. Representar la ACF y la PACF.
  3. Aplicar las reglas de identificación de la tabla anterior.
  4. Ajustar modelos candidatos y comparar por AIC y BIC.
Ejemplo de identificación: AR(1)

Una serie muestra:

  • ACF: picos en los retardos 1, 2, 3 con decaimiento exponencial (alternando signos si \(\phi < 0\), mismo signo si \(\phi > 0\)).
  • PACF: un único pico en el retardo 1, nada significativo después.

Este patrón es compatible con AR(1). Ajusta arima(y, order = c(1,0,0)) y comprueba los residuos.

Example icon
Ejemplo de identificación: MA(2)

Una serie muestra:

  • ACF: picos significativos en los retardos 1 y 2, luego nada.
  • PACF: decaimiento gradual con patrón alternante.

Este patrón es compatible con MA(2). Ajusta arima(y, order = c(0,0,2)) y comprueba los residuos.

Example icon

Ejemplo con datos reales: pasajeros aéreos

ACF y PACF de la serie de pasajeros aéreos diferenciada en logaritmo mostrando la estructura de autocorrelación estacional y no estacional

Tras diferenciar estacional y regularmente, la ACF muestra picos significativos en los retardos 1 y 12 (estacional), lo que sugiere componentes MA(1) y SMA(1). La PACF tiene un pico en el retardo 12, compatible con SAR(1). Esto llevó al modelo clásico SARIMA(0,1,1)(0,1,1)[12] para los datos de pasajeros aéreos.

⚠️ Los patrones de ACF y PACF son orientativos, no reglas definitivas

Los datos reales raramente muestran patrones de libro de texto perfectos. La ACF y la PACF sugieren modelos candidatos, no respuestas definitivas. Siempre:

  • Ajusta varios modelos candidatos.
  • Compara por AIC y BIC.
  • Comprueba que los residuos son ruido blanco (ACF de residuos, test de Ljung-Box).
  • Prefiere modelos más simples cuando las diferencias en AIC y BIC son pequeñas.

La combinación de la inspección ACF/PACF con los criterios de información es más fiable que cualquiera de los dos enfoques por separado.

💡 ACF y PACF en R

# Representar la ACF y la PACF
acf(y, lag.max = 30)
pacf(y, lag.max = 30)

# Valores numéricos
acf_vals  <- acf(y, lag.max = 30, plot = FALSE)$acf
pacf_vals <- pacf(y, lag.max = 30, plot = FALSE)$acf

# Amplitud de las bandas de confianza
ci <- qnorm(0.975) / sqrt(length(y))

# Gráfico combinado con el paquete forecast
library(forecast)
tsdisplay(y)   # muestra la serie + ACF + PACF en una sola figura