Red de conocimiento informático - Consumibles informáticos - ¿Para qué se utiliza Random Forest?

¿Para qué se utiliza Random Forest?

El bosque aleatorio es esencialmente una rama del aprendizaje automático: el aprendizaje conjunto, que es un método para integrar muchos árboles de decisión en un bosque y usarlo para predecir el resultado final.

Random forest, como su nombre indica, consiste en construir un bosque de forma aleatoria. Hay muchos árboles de decisión en el bosque y no existe correlación entre cada árbol de decisión en el bosque aleatorio. Después de obtener el bosque, cuando ingresa una nueva muestra de entrada, deje que cada árbol de decisión en el bosque haga un juicio para ver a qué categoría debe pertenecer la muestra (para el algoritmo de clasificación), luego vea qué categoría se selecciona más y luego prediga la muestra Qué categoría.

El origen del bosque aleatorio

En la década de 1980, Breiman et al inventaron el algoritmo de árbol de clasificación (Breiman et al. 1984 Al repetir la clasificación o regresión de datos binarios, la cantidad). de cálculo se reduce considerablemente. En 2001, Breiman combinó árboles de clasificación en un bosque aleatorio (Breiman 2001a), es decir, utilizó aleatoriamente variables (columnas) y datos (filas) para generar muchos árboles de clasificación y luego resumir los resultados de los árboles de clasificación.

Los bosques aleatorios mejoran la precisión de la predicción sin aumentar significativamente la complejidad computacional. El bosque aleatorio es insensible a la multicolinealidad, los resultados son sólidos ante datos faltantes y datos desequilibrados, y puede predecir bien los efectos de miles de variables explicativas (Breiman 2001b), y se considera uno de los mejores algoritmos actualmente (Iverson et al. 2008). .