¿Cuáles son los algoritmos para la minería de big data?
1. Bayes ordinario, súper simple, como contar. Si se cumple el supuesto de independencia condicional, NB convergerá más rápido que el modelo discriminativo, por lo que solo necesitará una pequeña cantidad de datos de entrenamiento. Incluso si el supuesto de independencia condicional no se cumple, NB todavía se desempeña sorprendentemente bien en la práctica.
2. Regresión logística, LR Hay muchas formas de regularizar el modelo. En comparación con el supuesto de independencia condicional de NB, LR no necesita considerar si las muestras están relacionadas. A diferencia de los árboles de decisión y las máquinas de vectores de soporte, NB tiene una buena interpretación probabilística y es fácil actualizar el modelo con nuevos datos de entrenamiento. Vale la pena usar LR si necesita información probabilística o si desea actualizar y mejorar fácilmente su modelo a medida que haya más datos disponibles en el futuro.
3. Árbol de decisión, DT es fácil de entender y explicar. DT no es paramétrico, por lo que no necesita preocuparse por los puntos salvajes (o valores atípicos) y si los datos son linealmente separables.
4. Support Vector Machine (SVM), la precisión de clasificación es muy alta y tiene una buena garantía teórica de sobreajuste. Elegir la función del núcleo adecuada también puede resolver el problema de las características lineales inseparables. una buena actuación. SVM es muy popular en la clasificación de textos donde la dimensionalidad suele ser muy alta.
Para obtener información más detallada, recomendamos realizar el curso de Análisis de Datos CDA. Los analistas de Big Data ahora cuentan con certificaciones internacionales profesionales CDA, o "CDA Data Analyst", es una certificación de calificación internacional profesional y autorizada para la industria bajo la tendencia general de la era de la economía digital y la inteligencia artificial, cuyo objetivo es mejorar la digitalización de todas las personas. .Habilidades, ayudar a las empresas en la transformación digital y promover el desarrollo digital de las industrias. Los "analistas de datos CDA" se refieren específicamente a nuevos talentos de análisis de datos que se especializan en la recopilación, limpieza, procesamiento, análisis, producción de informes comerciales y toma de decisiones de datos en Internet, finanzas, comercio minorista, consultoría, telecomunicaciones, medicina, turismo y otros. industrias. ¡Reserva una clase de prueba gratuita ahora! ¿Qué estás esperando?