Red de conocimiento informático - Conocimiento informático - ¿Qué tipo de trabajos puedes hacer después de aprender big data?

¿Qué tipo de trabajos puedes hacer después de aprender big data?

1. Analista de datos.

Los analistas de datos son un tipo de científico de datos, refiriéndose a profesionales que se especializan en recopilar, organizar y analizar datos de la industria para diferentes industrias, y realizar investigaciones, evaluaciones y predicciones de la industria basadas en datos. En el trabajo, utilizan herramientas para extraer, analizar y mostrar datos para darse cuenta de la importancia comercial de los datos.

Como analista de datos, debe dominar al menos SPSS, STATISTIC, Eviews, SAS, Big Data Magic Mirror y otros programas de análisis de datos, poder utilizar al menos Acess y otros desarrollos de bases de datos. y dominar al menos un software matemático, como matalab, para construir nuevos modelos matemáticos, y dominio de al menos un lenguaje de programación. En resumen, un excelente analista de datos no debe quedarse atrás en negocios, gestión, análisis, herramientas y diseño.

2. Arquitecto de datos.

El arquitecto de datos es responsable del diseño general de la arquitectura de datos de la plataforma, completa el trabajo de diseño desde el modelo de negocio hasta el modelo de datos, realiza el modelado y el diseño basado en funciones comerciales, modelos comerciales y bases de datos, y completa Varios análisis de datos orientados a negocios Definición de modelos y desarrollo de aplicaciones, extracción de datos de plataformas, minería de datos y análisis de datos.

Para trabajar como arquitecto de datos, debe tener una sólida comprensión empresarial y capacidades de abstracción empresarial, capacidades de diseño y modelado de bases de datos de plataformas de Internet de transacciones y transacciones de gran capacidad, y una comprensión muy profunda de los sistemas de programación y metadatos. Conocimiento y comprensión de sistemas, familiarizado con análisis, estadísticas y metodologías de modelado de uso común, familiarizado con tecnologías relacionadas con el almacenamiento de datos, como ETL, desarrollo de informes, familiarizado con HADOOP, Hive y otros sistemas y con experiencia práctica.

3. Ingeniero de minería de datos.

Generalmente se refiere a profesionales de la ingeniería que utilizan algoritmos para buscar conocimiento oculto en grandes cantidades de datos. Este conocimiento se puede utilizar para lograr inteligencia y automatización de decisiones comerciales, lo que permite a las empresas mejorar la eficiencia y reducir la posibilidad de tomar decisiones equivocadas para seguir siendo invencibles en una competencia feroz.

Convertirse en ingeniero de minería de datos requiere una sólida base teórica en estadística, matemáticas y minería de datos, así como experiencia relevante en proyectos. Debe estar familiarizado con software de análisis estadístico como R, SAS y SPSS, y. participar en uno de los proyectos completos de recopilación de datos. Organizar. Analizar y modelar el trabajo. Tener experiencia en aprendizaje automático e implementación de algoritmos bajo datos masivos, y estar familiarizado con hadoop, hive, map-reduce, etc.

4. Ingeniero de algoritmos de datos.

Responsable del diseño de algoritmos de minería de datos y partes de modelos en productos de big data empresarial, combinando escenarios comerciales con algoritmos de modelos, etc., investigación en profundidad sobre modelos de minería de datos y participación en la construcción y mantenimiento; , implementación y evaluación de modelos de minería de datos, apoyar al equipo de desarrollo de productos en la construcción e integración de algoritmos de modelos, formular e implementar especificaciones arquitectónicas para modelado de datos, procesamiento de datos, seguridad de datos, etc.

El conocimiento necesario incluye: conocimiento básico sólido de minería de datos, dominio de algoritmos comúnmente utilizados para aprendizaje automático y estadística matemática, familiaridad con el ecosistema de big data, dominio de los marcos informáticos distribuidos y principios técnicos de uso común, como Hadoop; , MapReduce, Yarn, Storm, Spark, etc. Familiarizado con el sistema operativo Linux y la programación de shell, al menos familiarizado con uno de los lenguajes de programación como Scala/Java/Python/C++/R y con los principios básicos de la computación paralela a gran escala; Capacidad básica para implementar algoritmos de computación paralela.

5. Responsable de productos de datos.

Construcción y mantenimiento de plataformas de datos, análisis de datos de clientes, asistencia en estadísticas de datos, operación digital, clasificación y refinamiento de informes de datos existentes, descubrimiento de cambios en los datos, realización de análisis temáticos en profundidad, formación de conclusiones y redacción de informes responsables; para los productos de datos de la empresa Diseño, desarrollo e implementación para garantizar la realización de los objetivos comerciales del desarrollo de productos de datos;

Requisitos de habilidades: experiencia práctica en proyectos de análisis de datos/minería de datos/comportamiento del usuario, base sólida en teoría del análisis, dominio de más de una herramienta de análisis estadístico, como SPSS, SAS, dominio del uso de Excel. , SQL, etc. Se prefieren las herramientas familiarizadas con declaraciones SQL/HQL y aquellas con experiencia laboral en SQL Server/My SQl.

Se preferirá el uso de software de oficina como Excel y PPT, y uno de los software de análisis estadístico como SPSS y SAS; y aquellos que estén familiarizados con la arquitectura de clúster Hadoop y que tengan experiencia práctica en BI y experiencia relacionada con la computación en streaming; y desarrollo del proceso de productos del cliente.