¿Qué se aprende generalmente en el aprendizaje de big data?
2. Big Data Hadoop System
Hadoop es una plataforma informática distribuida de código abierto desarrollada en lenguaje Java y es adecuada para plataformas informáticas y de almacenamiento distribuido de big data. Hadoop es una plataforma de big data ampliamente utilizada en la actualidad. Es el resultado del trabajo de los desarrolladores de plataformas de big data. Hadoop es una plataforma de soporte de big data relativamente común en la actualidad.
3. Scala golden language y Spark
Scala y Java son muy similares. Ambos son lenguajes que se ejecutan bajo jvm y pueden llamarse entre sí sin problemas durante el proceso de desarrollo.
Spark es un rápido motor informático de uso general diseñado para el procesamiento de datos a gran escala. Spark es un reemplazo de MapReduce y es compatible con HDFS y Hive. Puede integrarse en el ecosistema Hadoop para compensar las deficiencias de MapReduce.
4. Práctica de proyectos de big data
Recopilación de datos, procesamiento de datos, análisis de datos, presentación de datos, aplicación de datos