Red de conocimiento informático - Aprendizaje de código fuente - ¿Cuáles son las aplicaciones de la minería de datos?

¿Cuáles son las aplicaciones de la minería de datos?

La minería de datos aún no se ha vuelto popular en China, al igual que la habilidad de matar un dragón; la minería de datos en sí integra estadísticas, bases de datos, aprendizaje automático, reconocimiento de patrones, descubrimiento de conocimientos y otras disciplinas, y no es una nueva tecnología.

La razón por la que se puede aplicar la minería de datos no es por el algoritmo. El algoritmo ha existido antes. Las razones de las aplicaciones de minería de datos son el big data y la computación en la nube. Por ejemplo, el backend de AlphaGo tiene miles de computadoras ejecutando algoritmos de redes neuronales al mismo tiempo;

La preparación inicial de los datos también se denomina almacenamiento de datos. Por lo general, representa alrededor del 70% de toda la carga de trabajo del proyecto de minería de datos. Es necesario realizar una gran cantidad de trabajo de limpieza de datos y expansión de campo en la etapa inicial. La minería de datos y la presentación de informes solo representan alrededor del 30%;

La tecnología de minería de datos es más adecuada para que el personal empresarial aprenda (en comparación con el personal técnico que aprende negocios de manera más eficiente).

Los campos de trabajo actuales del personal de minería de datos nacional se pueden dividir aproximadamente en tres categorías

1) Analistas de datos: en comercio electrónico, finanzas, telecomunicaciones, consultoría y otras industrias que tienen datos de la industria Realizan consultoría empresarial, inteligencia empresarial y producen informes de análisis;

2) Ingenieros de minería de datos: implementan y analizan algoritmos de aprendizaje automático en industrias relacionadas con big data, como multimedia, comercio electrónico, búsqueda, y redes sociales;

3) Dirección de la investigación científica: Investigación sobre mejoras de eficiencia y aplicaciones futuras de nuevos algoritmos en instituciones de investigación científica de alto nivel, como universidades, unidades de investigación científica e institutos de investigación corporativa.

Tu propio posicionamiento y aprendizaje

Basándote en la introducción anterior, probablemente puedas descubrir en qué dirección necesitas trabajar duro. Si no está comprometido con la investigación científica, debe dominar las siguientes habilidades:

1. Debe comprender los principios y aplicaciones de los algoritmos de aprendizaje automático convencionales. Según los problemas a resolver, se dividen principalmente en tres categorías, como se muestra en la siguiente figura:

2. Es necesario estar familiarizado con al menos un lenguaje de programación. Como R, Python, SPSS Modeler, SAS, WEKA, etc.

Con respecto al software, existen tres principios: siempre que pueda lograr el objetivo, es un buen software; utilice cualquier software que sea fácil de usar en el campo de su investigación; para resolver todos los problemas.

3. Debe comprender los principios básicos de las bases de datos y poder operar con habilidad al menos una base de datos, como MySQL, OracelDB2, etc.

4. Familiarizarse con escenarios de aplicación comunes de minería de datos. Como la gestión del ciclo de vida del cliente, la elaboración de perfiles y la segmentación de clientes, la construcción de modelos de predicción del valor del cliente, el diseño de sistemas de recomendación, etc., deben depender de diferentes industrias.

5. Libros clásicos recomendados: "Minería de datos: conceptos y tecnología", "Introducción a la minería de datos", "Aprendizaje automático en la práctica", "Introducción a los sistemas de bases de datos", "Lenguaje R en la práctica".