Esos modelos de predicción analógicos digitales
01. Regresión lineal
La regresión lineal es uno de los modelos más clásicos que el científico británico Francis Galton utilizó en el siglo XIX y todavía se utiliza. de los modelos más eficientes para la representación de datos de relaciones lineales. La regresión lineal es un elemento básico de muchos cursos de econometría en todo el mundo. Aprender este modelo lineal le brindará orientación para resolver problemas de regresión y comprenderá cómo utilizar el conocimiento matemático para predecir fenómenos.
02. Regresión logística
Aunque se llama regresión, la regresión logística es el mejor modelo para dominar los problemas de clasificación. Aprender la regresión logística tiene las siguientes ventajas:
Comprensión inicial de los problemas de clasificación y multiclasificación, que es una parte importante de las tareas de aprendizaje automático.
Comprensión de la transformación de funciones, como la transformación de funciones sigmoideas.
p>Comprenda el uso de otras funciones de descenso de gradiente y cómo optimizar la función.
03. Árbol de decisión
El primer algoritmo no lineal a estudiar debe ser el árbol de decisión. Los árboles de decisión son un algoritmo relativamente simple e interpretable basado en reglas if-else que le brindarán una buena comprensión de los algoritmos no lineales y sus ventajas y desventajas. Los árboles de decisión son la base de todos los modelos basados en árboles y, al aprenderlos, también estará preparado para aprender otras tecnologías como XGBoost o LightGBM. Además, los árboles de decisión son adecuados tanto para problemas de regresión como de clasificación. La diferencia entre los dos es mínima. Los principios básicos para seleccionar las mejores variables que afectan los resultados son aproximadamente los mismos.
04. Random Forest
Debido a la sensibilidad de los árboles de decisión a los hiperparámetros y a las suposiciones simples, los resultados de los árboles de decisión son bastante limitados. Cuando profundices, comprenderás que los árboles de decisión pueden sobreajustarse fácilmente, lo que da como resultado un modelo que carece de generalización hacia el futuro. El concepto de bosque aleatorio es muy simple. Ayuda a lograr la diversificación entre diferentes árboles de decisión, mejorando así la robustez del algoritmo. Al igual que los árboles de decisión, puede configurar una gran cantidad de hiperparámetros para mejorar el rendimiento de este modelo de conjunto.