¿Cuáles son los principales cursos que se estudiarán en la especialidad de big data?
La ciencia de datos y la tecnología de big data enfatizan las características interdisciplinarias, toman el análisis de big data como núcleo y utilizan la estadística, la informática y las matemáticas como las tres disciplinas básicas de apoyo para cultivar estudiantes compuestos que enfrentan necesidades de aplicaciones de múltiples niveles. Tipo talentos.
Cursos de big data
Análisis matemático, álgebra avanzada, introducción a la física general, matemáticas y ciencias de la información, estructura de datos, introducción a la ciencia de datos, introducción a la programación, práctica de programación, matemáticas discretas, Probabilidad y estadística, análisis y diseño de algoritmos, inteligencia informática de datos, introducción a sistemas de bases de datos, fundamentos de sistemas informáticos, arquitectura y programación paralela, análisis de big data no estructurados, etc. La etapa de aprendizaje de big data
La primera etapa: conocimiento de vanguardia de big data e introducción a hadoop, introducción al prefacio del conocimiento de big data, introducción al curso, conceptos básicos de los sistemas Linux y unbuntu, instalación de modos autónomos y de pseudodistribución de configuración de hadoop.
La segunda etapa: implementación avanzada de hadoop. Construcción del modo de clúster Hadoop y análisis en profundidad del sistema de archivos distribuido Hadoop HDFS. Utilice la API proporcionada por HDFS para realizar operaciones con archivos HDFS. Mapreducir conceptos e ideas.
La tercera etapa: importación y almacenamiento de big data. Conocimientos básicos de base de datos mysql, sintaxis básica de hive. Principios de arquitectura y diseño de hive. Instalación y casos de implementación de Hive. Instalación y uso de sqoop. Importe el componente sqoop a Hive.
La cuarta etapa: teoría y práctica de Hbase. Introducción a Hbase. Instalación y configuración. almacenamiento de datos hbase. Práctica de proyectos.
La quinta etapa: configuración de Spaer y escenarios de uso. Sintaxis básica de Scala. Introducción de Spark e historial de desarrollo, Spark stan es una implementación en modo solitario. Explicación detallada de sparkRDD.
La sexta etapa: principios de análisis de big data de Spark. Spark Kernel, definición básica, programación de tareas Spark. Sparkstreaming computación de flujo en tiempo real. Aprendizaje automático Sparkmllib. consulta SparkSQL.