Red de conocimiento informático - Material del sitio web - ¿La especialización en big data requiere habilidades matemáticas?

¿La especialización en big data requiere habilidades matemáticas?

La tecnología de big data, como tecnología de TI que involucra conocimiento de múltiples disciplinas, tiene diferentes direcciones de investigación y la cantidad de conocimiento matemático involucrado en diferentes direcciones también es diferente. Sin embargo, en muchos casos, el aprendizaje de big data. El procesamiento no requiere directamente conocimientos básicos de matemáticas, pero tener una cierta base matemática involucrada en big data puede facilitar la comprensión del conocimiento que se puede aprender de big data. El conocimiento matemático involucrado en el aprendizaje de big data generalmente incluye teoría de probabilidad, estadística matemática, álgebra lineal, teoría de optimización y matemáticas discretas. 1. Teoría de la probabilidad

1. Por qué estudiar la teoría de la probabilidad

La teoría de la probabilidad es una rama que estudia las leyes cuantitativas de los fenómenos aleatorios. El propósito del análisis de datos en la tecnología de procesamiento de big data es inseparable del análisis de la situación actual o de la predicción del futuro. Sin embargo, ninguno de estos dos aspectos del análisis puede sacar conclusiones absolutas, solo puede sacar varias posibilidades y las consecuencias de estas posibilidades. sucede requiere probabilidad para explicarse.

2. Contenidos de aprendizaje de la teoría de la probabilidad

Definición: probabilidad tradicional, probabilidad condicional.

Teorema: La ley de complementariedad, la probabilidad de eventos imposibles es cero, la ley de exclusión mutua, la relación de conjuntos de diferencias, la regla de multiplicación, la regla de multiplicación de eventos irrelevantes, probabilidad completa, teorema de Bayes .

2. Estadística matemática

1. Por qué estudiar estadística matemática

La estadística matemática es una rama de las matemáticas que se divide en estadística descriptiva y estadística inferencial. Sobre la base de la teoría de la probabilidad, estudiamos una gran cantidad de fenómenos aleatorios y regularidades estadísticas. El análisis de big data a menudo implica la descripción del tamaño, la discreción y las características de distribución de variables aleatorias y la descripción de la relación entre dos o más variables aleatorias. La herramienta matemática para describir cuantitativamente variables aleatorias y la relación entre variables aleatorias es la estadística matemática.

2. Contenido de aprendizaje de estadística de datos

Estimación de parámetros, prueba de hipótesis, análisis de correlación, participación en pruebas, estadística no paramétrica, estadística de procesos, etc.

3. Álgebra lineal

1. Por qué aprender álgebra lineal

El álgebra lineal es una rama de las matemáticas. Sus objetos de investigación son los vectores y los espacios vectoriales (espacios lineales). ). ), transformaciones lineales y ecuaciones lineales de dimensión finita. En big data, los objetos de análisis en muchos escenarios de aplicación pueden representar de forma abstracta matrices dimensionales. Por ejemplo, una gran cantidad de páginas web y sus relaciones, usuarios de Weibo y sus relaciones, etc., pueden representarse mediante matrices.

2. Contenidos de aprendizaje de álgebra lineal

Valores propios y vectores propios, determinantes, matrices y ecuaciones lineales.

IV.Método de optimización

1. Por qué aprender el método de optimización

El método de optimización se refiere al método para resolver problemas de optimización. El llamado problema de optimización se refiere al problema de determinar los valores de algunas variables opcionales bajo ciertas restricciones para optimizar la función objetivo seleccionada. Es decir, se utilizan los últimos medios y métodos de procesamiento científicos y tecnológicos para conseguir la optimización global del sistema, proponiendo así planes de optimización para el diseño, construcción, gestión y operación del sistema. El aprendizaje y el entrenamiento de modelos es una forma para que muchos modelos de análisis y minería resuelvan parámetros. En el aprendizaje y el entrenamiento de modelos, las funciones se utilizan para encontrar métodos de optimización.

2. Contenido de aprendizaje de la teoría de la optimización

Encontrar valores extremos en cálculo diferencial, problemas de optimización sin restricciones, fórmulas diferenciales de uso común, conjuntos convexos y funciones convexas, problemas de optimización con restricciones de ecuaciones, Problemas de optimización con restricción de desigualdad, búsqueda de valores extremos en cálculo variacional