Red de conocimiento informático - Conocimiento del nombre de dominio - Método de búsqueda binaria en programación metafísica

Método de búsqueda binaria en programación metafísica

Las matemáticas son la piedra angular de cualquier disciplina científica contemporánea. Casi todas las técnicas modernas de ciencia de datos, incluido el aprendizaje automático, tienen una base matemática profunda.

No hay duda de que si quieres ser un científico de datos de primer nivel, necesitas tener ventajas en varios aspectos, como capacidad de programación, cierta visión para los negocios y habilidades analíticas únicas. Pero siempre es bueno entender la "mecánica oculta". Una comprensión profunda del mecanismo matemático detrás del algoritmo le dará una ventaja entre sus pares.

Para los recién llegados que ingresan al campo de la ciencia de datos de otras industrias (ingeniería de hardware, comercio minorista, industria de procesamiento químico, medicina y salud, gestión empresarial, etc.), estos conocimientos matemáticos básicos son particularmente importantes. ).Si bien estos campos pueden requerir experiencia con hojas de cálculo, cálculos numéricos y proyecciones, las habilidades matemáticas requeridas para la ciencia de datos pueden variar significativamente.

Piense en un desarrollador web o un analista de negocios. Es posible que tengan que lidiar con grandes cantidades de datos e información todos los días. La ciencia de datos debería tratarse de ciencia, no de datos. Siguiendo esta idea, algunas herramientas y técnicas se vuelven indispensables.

Simular procesos detectando dinámicas subyacentes.

Formulación de hipótesis

Evaluar críticamente la calidad de las fuentes de datos

Datos cuantitativos e incertidumbre en el pronóstico

Identificar contenido oculto de los patrones de flujos de información

Comprender las limitaciones de los modelos

Comprender las pruebas matemáticas y la lógica abstracta detrás de ellas.

La ciencia de datos, por su propia naturaleza, no se limita a un área temática específica y puede abordar una variedad de fenómenos, como el diagnóstico de cáncer y el análisis del comportamiento social. Esto conduce a la posibilidad de deslumbrantes matrices N-dimensionales de objetos matemáticos, distribuciones estadísticas, funciones objetivo de optimización, etc.

Funciones, variables, ecuaciones y gráficas

Esta área de las matemáticas cubre los conceptos básicos, desde el teorema del binomio para ecuaciones hasta todo lo intermedio:

Logaritmos, exponenciales, funciones polinómicas, números racionales

Geometría básica y teoremas, identidades trigonométricas

Números reales y complejos, propiedades básicas

Series, cantidades, desigualdades

Gráficas y gráficos, coordenadas cartesianas y polares, secciones cónicas

Dónde se puede utilizar

Si desea conocer millones de entradas Al observar cómo se realizan las búsquedas puede ejecutarse más rápido después de ordenar su base de datos, se encontrará con el concepto de "búsqueda binaria". Para comprender su mecanismo, es necesario comprender los logaritmos y las ecuaciones recursivas. O, si desea analizar una serie de tiempo, puede encontrar conceptos como "función periódica" y "decaimiento exponencial".

Estadística

No se puede subestimar la importancia de dominar los conceptos básicos de estadística y probabilidad. Muchos profesionales en este campo realmente creen que el aprendizaje automático clásico (sin redes neuronales) es solo aprendizaje estadístico. La planificación enfocada es fundamental para cubrir los conceptos más básicos:

Resumen de datos y estadística descriptiva, tendencia central, varianza, covarianza, correlación

Probabilidad básica: expectativas, cálculo de probabilidades, teorema de Bayes, probabilidad condicional

Funciones de distribución de probabilidad: uniforme, normal, binomial, chi-cuadrado, teorema del límite central

Muestreo, medición, error, generación de números aleatorios

Hipótesis test, test A/B, intervalo de confianza, valor P

Análisis de varianza, test t

Regresión lineal, estandarización

Si dominas estos conceptos, podrás Estarás causando una impresión duradera en poco tiempo. Como científico de datos, los utiliza casi todos los días.

Álgebra lineal

Esta es una rama fundamental de las matemáticas para comprender cómo actúan los algoritmos de aprendizaje automático sobre los flujos de datos. Desde la recomendación de un amigo en QQ, la recomendación de una canción en Kugou, hasta el aprendizaje por transferencia profunda para convertir tu selfie en un retrato de Salvador Dalí, todos estos involucran matrices y álgebra matricial. Las siguientes son las matemáticas básicas que necesitas aprender:

Propiedades básicas de matrices y vectores: multiplicación escalar, transformación lineal, transposición, * * * yugo, rango, determinante.

Producto interior y producto exterior, reglas de multiplicación de matrices y varios algoritmos, inversión de matrices

Matrices especiales: matriz cuadrada, matriz unitaria, matriz triangular, vector unitario, matriz simétrica, matriz de Angstrom Hermitian , sesgar la matriz hermitiana y la matriz unitaria.

Concepto de descomposición matricial/descomposición LU, eliminación Gaussiana/Gaussiano-Jordan, resolución de la ecuación Ax=b sistema de ecuaciones lineales.

Espacio vectorial, base, espacio, ortogonalidad, ortogonalidad, mínimos cuadrados lineales

Valor propio, vector propio, diagonalización, descomposición de valores singulares

Si ha utilizado reducción de dimensionalidad técnicas (análisis de componentes principales), es posible que haya utilizado la descomposición de valores singulares para lograr una representación dimensional compacta de un conjunto de datos con menos parámetros. Todos los algoritmos de redes neuronales utilizan técnicas de álgebra lineal para representar y procesar la estructura de la red y las operaciones de aprendizaje.

Cálculo

Tanto si lo amaste como si lo odiaste en la universidad, el cálculo tiene muchas aplicaciones en la ciencia de datos y el aprendizaje automático. Esta es una habilidad valiosa:

Unidad, límites, continuidad y diferenciabilidad de funciones

Teorema del valor medio, infinitivos, ley de L'Hôpital

Valores máximos y mínimos

Regla de la cadena de suma del producto

Serie de Taylor, el concepto de suma/integración de series infinitas

Teorema básico de integración y teorema del valor medio, cálculo de integrales definidas y integrales generalizadas.

Función

Múltiples funciones, límites, continuidad, derivadas parciales

Conceptos básicos de ecuaciones diferenciales ordinarias y ecuaciones diferenciales parciales

Quieres saber logístico ¿Cómo se implementa el algoritmo de regresión? Es posible utilizar un método llamado "descenso de gradiente" para encontrar la función de pérdida mínima. Para entender cómo funciona, es necesario utilizar los conceptos del cálculo: gradientes, derivadas, límites y la regla de la cadena.

Matemáticas Discretas

Este campo no es común en la ciencia de datos, pero toda la ciencia de datos moderna se realiza con la ayuda de sistemas computacionales, y las matemáticas discretas son el núcleo de estos sistemas.

Conjuntos, subconjuntos

Funciones de conteo, combinatoria, contabilidad

Técnicas básicas de demostración: inducción y reducción al absurdo.

Conceptos básicos de inducción, deducción y lógica proposicional

Estructuras de datos básicas: pila, cola, gráfico, matriz, tabla hash, árbol.

Propiedades de gráficas: componentes conexos, grado, conceptos de caudal máximo/corte mínimo, coloración de gráficas.

Relaciones y ecuaciones de recurrencia

En cualquier análisis de redes sociales, es necesario conocer las propiedades de un gráfico, así como algoritmos rápidos para buscar y recorrer la red. Al elegir cualquier algoritmo, es necesario comprender las complejidades del tiempo y el espacio.

Temas de investigación en optimización y operaciones

Estos temas son más relevantes para la informática teórica, la teoría del control o la investigación de operaciones. Pero la comprensión de estas poderosas técnicas también puede producir resultados fructíferos en la práctica del aprendizaje automático. De hecho, el objetivo de todo algoritmo de aprendizaje automático es minimizar algún tipo de error de estimación bajo diversas restricciones, lo cual es un problema de optimización. Las siguientes son las matemáticas que necesitas aprender:

Conceptos básicos de optimización, cómo formular problemas

Valor máximo, valor mínimo, función convexa, solución global

Programación lineal, algoritmo simplex

Programación entera

Programación restringida, problema de mochila

Los problemas de regresión lineal simples que utilizan funciones de pérdida de mínimos cuadrados suelen tener soluciones analíticas exactas. el problema de regresión no. Para entender por qué, es necesario estar familiarizado con el concepto de convexidad en la optimización. Esta serie de estudios también ilustrará por qué debemos conformarnos con soluciones "aproximadas" para la mayoría de los problemas de aprendizaje automático.

Aunque hay mucho que aprender, existen buenos recursos en línea. Después de revisar estas preguntas y aprender nuevos conceptos, podrá escuchar la "música" oculta en sus proyectos diarios de análisis de datos y aprendizaje automático. Este es un gran salto para convertirse en un gran científico de datos.

Si quieres conocer más contenido interesante, ven y sigue Bullshit Science.