APRENDIZAJE AUTOMÁTICO

El machine learning es un campo de la inteligencia artificial centrado en desarrollar algoritmos que permitan a los sistemas aprender de los datos y mejorar su rendimiento con el tiempo sin programación explícita

Introducción

Regresión

Regresión lineal simple

La regresión lineal simple ajusta una recta a dos variables continuas usando mínimos cuadrados, cuantifica la relación con el R² y contrasta si la pendiente es significativamente distinta de cero.

Regresión lineal múltiple

La regresión lineal múltiple modela una variable respuesta como combinación lineal de varios predictores estimada por MCO. Aprende el R² ajustado, la multicolinealidad, el VIF y el contraste F.

Diagnósticos de regresión lineal

Los diagnósticos de regresión comprueban si los supuestos LINE se cumplen, identifican valores atípicos y observaciones influyentes, y detectan multicolinealidad antes de confiar en los resultados del modelo.

Regresión no lineal

La regresión no lineal ajusta modelos donde los parámetros aparecen de forma no lineal en la función de media. Los algoritmos de Gauss-Newton y Levenberg-Marquardt encuentran la solución de forma iterativa.

Regresión logística

La regresión logística modela la probabilidad de un evento binario con la función sigmoide. Los coeficientes se interpretan como odds ratios; la curva ROC y el AUC evalúan el poder discriminante del modelo.

Splines de regresión

Los splines de regresión ajustan curvas flexibles usando polinomios a trozos continuos unidos en los nodos. Los splines de suavizado seleccionan el parámetro de suavizado mediante validación cruzada generalizada (GCV).

Modelos aditivos generalizados

Los GAM combinan la interpretabilidad de la regresión con la flexibilidad de los splines: modelan cada predictor con una función suave y suman los efectos. El parámetro de suavizado se selecciona automáticamente con REML.

ANCOVA

El ANCOVA combina ANOVA y regresión: compara medias de grupos ajustando por variables continuas (covariables). El supuesto clave es la homogeneidad de pendientes: las rectas deben ser paralelas entre grupos.

Regularización

Clasificación

Métodos basados en árboles

Clustering

Reducción de dimensionalidad

Evaluación de modelos