Algoritmo RAINFOREST de minería de datos
El algoritmo anterior es muy claro, déjame darte un ejemplo:
Datos de entrenamiento:
Id Categoría de ingresos de edad
1 joven 65 G
2 jóvenes 15 B
3 jóvenes 75 G
4 mayores 40 B <
5 mayores 100 G
6 mayores 60 G
AVC establece ?edad" para N1:
recuento de clases de valor
joven B 1
joven G 2
senior B 1
senior G 2
Conjunto AVC "Ingresos" de N1:
Recuento del nivel de valor
15 B 1
40 B 1
60 G 1
65 G 1
75 G 1
100 G 1
¿Configuración AVC? "Ingresos" para N2:
Recuento del nivel de valor
15 B 1
65 G 1 p>
75 G 1
¿Configuración de AVC? "Edad" de N2:
Recuento del nivel de valor
Joven B 1
Joven G 2
Finalmente comenzó la selva tropical: N1
edad=joven / / edad=senior
/ /
N2 N3
Finalmente, para el algoritmo de la selva tropical, el conjunto de muestras de entrenamiento no debe ser mayor a 3 millones. De lo contrario, utilice SPRINT en su lugar.