Red de conocimiento informático - Material del sitio web - ¿Qué base se necesita para el aprendizaje de big data? No tengo la base, ¿puedo aprenderla?

¿Qué base se necesita para el aprendizaje de big data? No tengo la base, ¿puedo aprenderla?

Los principiantes deben tener conocimientos matemáticos básicos para aprender big data.

El conocimiento matemático es el conocimiento básico de los analistas de datos.

Para los analistas de datos junior, es suficiente comprender algunos contenidos básicos relacionados con las estadísticas descriptivas y tener cierta capacidad para calcular fórmulas. Comprender los algoritmos de modelos estadísticos comunes es una ventaja.

Para los analistas de datos senior, el conocimiento relacionado con los modelos estadísticos es una habilidad necesaria, y es mejor tener cierta comprensión del álgebra lineal (principalmente conocimientos relacionados con los cálculos matriciales).

Para los ingenieros de minería de datos, además de las estadísticas, también deben dominar el uso de varios algoritmos, y los requisitos para las matemáticas son los más altos.

Los principiantes que aprenden big data deben tener herramientas de análisis básicas.

Para los analistas de datos junior, es necesario estar familiarizado con Excel y deben dominar el uso de tablas dinámicas y fórmulas. VBA es una ventaja. Además, también es necesario aprender una herramienta de análisis estadístico. SPSS es una buena introducción.

Para los analistas de datos senior, el uso de herramientas de análisis es una competencia básica. VBA es una necesidad básica. SPSS/SAS/R debe dominar al menos una de ellas. Matlab) dependen de la situación.

Para los ingenieros de minería de datos... bueno, solo poder usar Excel es suficiente. El trabajo principal debe resolverse escribiendo código.

Los principiantes que aprenden big data deben tener tres lenguajes de programación básicos.

Para los analistas de datos junior, si pueden escribir consultas SQL y, si es necesario, escribir consultas Hadoop y Hive, son básicamente DE ACUERDO.

Para los analistas de datos senior, además de SQL, es necesario aprender Python, que puede utilizarse para obtener y procesar datos con el doble de resultado con la mitad de esfuerzo. Por supuesto, también son posibles otros lenguajes de programación.

Los ingenieros de minería de datos deben estar familiarizados con Hadoop, al menos uno de Python/Java/C++, y deben poder usar Shell... En resumen, el lenguaje de programación es definitivamente la competencia central. de ingenieros de minería de datos.

Los principiantes que aprenden big data deben tener cuatro conocimientos empresariales básicos.

No es exagerado decir que el conocimiento empresarial es la base de todo el trabajo de los analistas de datos, incluidos los planes de adquisición de datos. , la selección de indicadores e incluso la información sobre la conclusión final dependen de la comprensión del negocio en sí por parte del analista de datos.

Para los analistas de datos junior, el trabajo principal es extraer datos y hacer algunos gráficos simples, así como una pequeña cantidad de conocimientos y conclusiones. Es suficiente tener una comprensión básica del negocio.

Los analistas de datos senior deben tener una comprensión más profunda del negocio y ser capaces de extraer opiniones efectivas basadas en datos, lo que puede ser útil para el negocio real.

Para los ingenieros de minería de datos, es suficiente tener una comprensión básica del negocio, pero aún así es necesario centrarse en ejercer las capacidades técnicas.

Los principiantes que aprenden big data deben tener los cinco pensamientos lógicos básicos.

Esta capacidad rara vez se menciona en mis artículos anteriores, por lo que esta vez hablaré de ella por separado.

Para los analistas de datos junior, el pensamiento lógico se refleja principalmente en el propósito de cada paso del proceso de análisis de datos y en saber qué medios deben utilizar para lograr qué objetivos.

Para los analistas de datos senior, el pensamiento lógico se refleja principalmente en la construcción de un marco de análisis completo y eficaz, la comprensión de la correlación entre los objetos de análisis y el conocimiento de las causas y consecuencias de cada cambio de indicador y el impacto que tendrá en el negocio.

Para los ingenieros de minería de datos, el pensamiento lógico no solo se refleja en el trabajo de análisis relacionado con el negocio, sino que también incluye lógica algorítmica, lógica de programa, etc., por lo que los requisitos para el pensamiento lógico también son los más altos.

Los principiantes que aprenden big data deben tener las seis visualizaciones de datos básicas.

La visualización de datos parece de muy alto nivel, pero en realidad cubre una amplia gama. Crear un PPT y colocar gráficos de datos. También se puede considerar visualización de datos, por lo que creo que es una habilidad universalmente necesaria.

Los analistas de datos junior, si pueden usar Excel y PPT para crear gráficos e informes básicos y pueden mostrar los datos con claridad, lograrán sus objetivos.

Los analistas de datos senior deben explorar mejores métodos de visualización de datos, utilizar herramientas de visualización de datos más efectivas y crear contenido de visualización de datos que pueda ser simple o complejo según las necesidades reales, pero adecuado para la audiencia. mirar.

Para los ingenieros de minería de datos, es necesario comprender algunas herramientas de visualización de datos y crear algunos gráficos visuales complejos según las necesidades, pero generalmente no es necesario considerar demasiados problemas de embellecimiento.