Red de conocimiento informático - Aprendizaje de código fuente - ¿Cuál es la relación entre analistas de datos, ingenieros de datos y científicos de datos?

¿Cuál es la relación entre analistas de datos, ingenieros de datos y científicos de datos?

¿Cómo se posicionan estas tres profesiones? ?

–¿Qué tipo de existencia es un científico de datos?

Un científico de datos se refiere a alguien que puede utilizar métodos científicos y herramientas de minería de datos para analizar cantidades grandes y complejas de números y símbolos. , texto, URL y audio Ingenieros o expertos (diferentes de estadísticos o analistas) que pueden reproducir y comprender digitalmente información como videos o videos, y pueden encontrar nuevos conocimientos sobre datos. ?

–¿Cómo se define un ingeniero de datos?

Un ingeniero de datos generalmente se define como un "ingeniero de software estrella con un profundo conocimiento del tema de la estadística". Si tiene un problema empresarial, necesita un ingeniero de datos. Su valor fundamental radica en su capacidad para crear canales de datos a partir de datos limpios. Comprender plenamente los sistemas de archivos, la informática distribuida y las bases de datos son habilidades necesarias para convertirse en un excelente ingeniero de datos. ?

Los ingenieros de datos tienen un conocimiento bastante bueno de los algoritmos. Por lo tanto, los ingenieros de datos deberían poder ejecutar modelos de datos básicos. Las necesidades empresariales de alto nivel han dado lugar a la necesidad de realizar cálculos muy complejos. Muchas veces, estas necesidades exceden el alcance del conocimiento del ingeniero de datos. En este momento, es necesario llamar a un científico de datos para obtener ayuda. ?

¿Cómo debemos entender a los analistas de datos?

Los analistas de datos se refieren a personas de diferentes industrias que se especializan en recopilar, organizar y analizar datos de la industria y realizar investigaciones de la industria basadas en los datos. , profesionales de evaluación y previsión. Saben cómo hacer las preguntas correctas y son muy buenos en el análisis, visualización y presentación de datos.

¿Cuáles son las responsabilidades específicas de estas tres profesiones?

–¿Cuáles son las responsabilidades laborales de un científico de datos?

Los científicos de datos tienden a mirar el entorno mundo de una manera que explora el mundo de los datos. Para convertir una gran cantidad de datos dispersos en datos estructurados que puedan analizarse, también es necesario encontrar fuentes de datos ricas, integrar otras fuentes de datos posiblemente incompletas y limpiar el conjunto de datos resultante. En el nuevo entorno competitivo, los desafíos cambian constantemente y constantemente fluyen nuevos datos. Los científicos de datos necesitan ayudar a los tomadores de decisiones a través de varios análisis, desde análisis de datos temporales hasta análisis continuos de interacción de datos. Cuando hacen descubrimientos, comunican sus hallazgos y sugieren nuevas direcciones comerciales. Presentan información visual de forma creativa y hacen que los patrones que encuentran sean claros y convincentes. Sugerir al Jefe los patrones contenidos en los datos para influir en productos, procesos y decisiones. ?

–¿Cuáles son las responsabilidades laborales de los ingenieros de datos?

Analizar el historial, predecir el futuro y optimizar las opciones son las tres tareas más importantes de los ingenieros de big data cuando “juegan con datos”. ”. A través de estas tres líneas de trabajo ayudan a las empresas a tomar mejores decisiones comerciales. ?

Un trabajo muy importante de los ingenieros de big data es descubrir las características de eventos pasados ​​mediante el análisis de datos. Por ejemplo, el equipo de datos de Tencent está construyendo un almacén de datos para clasificar la información de datos grande e irregular en todas las plataformas de red de la empresa y resumir las características que se pueden consultar para satisfacer las necesidades de datos de los diversos negocios de la empresa, incluida la publicidad. desarrollo de juegos, redes sociales, etc. ?

La función más importante de descubrir las características de eventos pasados ​​es ayudar a las empresas a comprender mejor a los consumidores. Al analizar la trayectoria de comportamiento pasada del usuario, se puede comprender a esta persona y predecir su comportamiento. ?

Al introducir factores clave, los ingenieros de big data pueden predecir las tendencias futuras de los consumidores. En la plataforma de marketing de Alimama, los ingenieros están intentando ayudar a los vendedores de Taobao a hacer negocios introduciendo datos meteorológicos. Por ejemplo, si este verano no hace calor, es muy probable que ciertos productos no se vendan tan bien como el año pasado. Además de los aires acondicionados y ventiladores, también pueden verse afectados chalecos, bañadores, etc. Luego estableceremos la relación entre los datos meteorológicos y los datos de ventas, buscaremos categorías relacionadas y alertaremos a los vendedores con antelación para que entreguen el inventario. ?

Dependiendo de la naturaleza comercial de las diferentes empresas, los ingenieros de big data pueden lograr diferentes propósitos a través del análisis de datos. Para Tencent, el ejemplo más simple y directo que refleja el trabajo de los ingenieros de big data es la prueba de opciones (AB Test), que ayuda a los gerentes de producto a elegir entre las alternativas A y B.

En el pasado, los tomadores de decisiones solo podían emitir juicios basados ​​en la experiencia, pero ahora los ingenieros de big data pueden realizar pruebas en tiempo real a gran escala; por ejemplo, en el ejemplo de los productos de redes sociales, deje que la mitad de los usuarios vean la interfaz A y la otra mitad usa la interfaz B y observa las estadísticas de tasas de clics y tasas de conversión durante un período de tiempo que ayudarán al departamento de marketing a tomar la decisión final. ?

–¿Cuáles son las responsabilidades laborales de un analista de datos?

Internet en sí tiene características digitales e interactivas. Este atributo aporta beneficios revolucionarios a la recopilación, organización e investigación de datos. . En el pasado, los analistas de datos en el "mundo atómico" tenían que gastar mayores costos (fondos, recursos y tiempo) para obtener datos que respaldaran la investigación y el análisis. La riqueza, exhaustividad, continuidad y puntualidad de los datos eran mucho peores que en Internet. era. ?

En comparación con los analistas de datos tradicionales, lo que enfrentan los analistas de datos en la era de Internet no es una falta de datos, sino un excedente de datos. Por lo tanto, los analistas de datos en la era de Internet deben aprender a utilizar medios técnicos para realizar un procesamiento de datos eficiente. Más importante aún, los analistas de datos en la era de Internet deben continuar innovando y logrando avances en las metodologías de investigación de datos. ?

En lo que respecta a la industria, el valor de los analistas de datos es similar a este. En lo que respecta a la industria editorial de noticias, sin importar la época, si los operadores de medios pueden comprender de manera precisa, detallada y oportuna la situación de la audiencia y las tendencias cambiantes es la clave del éxito o el fracaso de los medios. ?

Además, para las industrias de contenidos como las noticias y las publicaciones, es aún más crítico que los analistas de datos puedan realizar la función de análisis de datos de los consumidores de contenidos, que es una función clave que respalda a las organizaciones de noticias y publicaciones en mejorando el servicio al cliente.

¿Qué habilidades necesitas dominar para ejercer estas tres profesiones? ?

–¿Qué habilidades deben dominar los científicos de datos?

1. ¿Informática?

En términos generales, la mayoría de los científicos de datos requieren programación e informática. Habilidades. Antecedentes profesionales. En pocas palabras, son las habilidades relacionadas con tecnologías de procesamiento paralelo a gran escala como Hadoop y Mahout y el aprendizaje automático las que son necesarias para procesar big data. ?

2. ¿Matemáticas, estadística, minería de datos, etc.?

Además de los conocimientos de matemáticas y estadística, también es necesario tener las habilidades para utilizar el software de análisis estadístico convencional. como SPSS y SAS. Entre ellos, el lenguaje de programación de código abierto y su entorno operativo "R" para análisis estadístico han atraído mucha atención recientemente. La fortaleza de R no es solo que contiene una rica biblioteca de análisis estadístico, sino que también tiene capacidades de generación de gráficos de alta calidad para visualizar resultados, que se pueden ejecutar mediante comandos simples. Además, también tiene un mecanismo de extensión de paquete llamado CRAN (The Comprehensive R Archive Network). Al importar el paquete de extensión, puede utilizar funciones y conjuntos de datos que no son compatibles con el estado estándar. ?

3. Visualización de datos (Visualización)?

La calidad de la información depende en gran medida de su expresión. Es muy importante que los científicos de datos analicen el significado contenido en los datos compuestos por listas numéricas, desarrollen prototipos web y utilicen API externas para unificar gráficos, mapas, paneles y otros servicios para visualizar los resultados del análisis. ?

–¿Qué habilidades deben dominar los ingenieros de datos?

1. ¿Antecedentes relacionados con las matemáticas y la estadística?

Se espera que todos los requisitos para los ingenieros de big data sean Ser Magíster o Doctorado en Estadística y Matemáticas. Los trabajadores de datos que carecen de conocimientos teóricos tienen más probabilidades de ingresar a una zona de peligro técnico (Zona de peligro): un montón de números siempre pueden producir algunos resultados de acuerdo con diferentes modelos de datos y algoritmos, pero si no sabe lo que significan, es No es un resultado verdaderamente significativo y dicho resultado puede engañarlo fácilmente. Sólo con ciertos conocimientos teóricos podemos comprender modelos, reutilizar modelos e incluso innovar modelos para resolver problemas prácticos. ?

2. ¿Capacidad de codificación informática?

Las capacidades de desarrollo reales y las capacidades de procesamiento de datos a gran escala son algunos de los elementos necesarios para un ingeniero de big data. Debido a que el valor de muchos datos proviene del proceso de minería, debes hacerlo tú mismo para descubrir el valor del oro. Por ejemplo, muchos registros generados por personas en las redes sociales ahora son datos no estructurados. Cómo extraer información significativa de estos textos, voces, imágenes e incluso videos desorientados requiere que los ingenieros de big data los desenterren ellos mismos.

Incluso en algunos equipos, las responsabilidades de los ingenieros de big data son principalmente el análisis empresarial, pero también deben estar familiarizados con la forma en que las computadoras procesan big data. ?

3. ¿Conocimiento de campos de aplicación o industrias específicas?

Un punto muy importante en el rol del ingeniero de big data es que no se puede separar del mercado, porque el big data puede sólo se puede utilizar en campos específicos. Sólo cuando se combinan se puede producir valor. Por lo tanto, la experiencia en una o más industrias verticales puede ayudar a los candidatos a acumular conocimientos de la industria, lo que será de gran ayuda para convertirse en un ingeniero de big data en el futuro. Por lo tanto, esta también es una ventaja más convincente al postularse para este puesto. ?

–¿Habilidades que los analistas de datos deben dominar?

1. El requisito previo para participar en el trabajo de análisis de datos es comprender el negocio, es decir, estar familiarizado con el conocimiento de la industria, los negocios y los procesos de la empresa, y es mejor tener sus propios conocimientos únicos si está divorciado del conocimiento de la industria y de la experiencia comercial de la empresa. , los resultados del análisis solo estarán fuera de línea. Las cometas no tienen mucho valor de uso. ?

2.Entender la gestión. Por un lado, es el requisito de construir un marco de análisis de datos. Por ejemplo, para determinar las ideas de análisis, debe utilizar conocimientos teóricos de marketing, gestión y otros como guía. Será difícil construir un marco de análisis de datos y el análisis de datos posterior también será difícil de realizar. Por otro lado, la función es proporcionar sugerencias de análisis instructivas basadas en las conclusiones del análisis de datos. ?

3. Entender el análisis. Se refiere a dominar los principios básicos del análisis de datos y algunos métodos efectivos de análisis de datos, y ser capaz de aplicarlos de manera flexible al trabajo práctico para llevar a cabo el análisis de datos de manera efectiva. Los métodos de análisis básicos incluyen: análisis comparativo, análisis de grupo, análisis cruzado, análisis estructural, análisis de gráfico de embudo, análisis de evaluación integral, análisis factorial, análisis de correlación matricial, etc. Los métodos de análisis avanzados incluyen: análisis de correlación, análisis de regresión, análisis de conglomerados, análisis discriminante, análisis de componentes principales, análisis factorial, análisis de correspondencia, series de tiempo, etc. ?

4. Entender las herramientas. Se refiere al dominio de herramientas comunes relacionadas con el análisis de datos. Los métodos de análisis de datos son teorías, y las herramientas de análisis de datos son herramientas para implementar la teoría de los métodos de análisis de datos. Al enfrentarnos a cantidades cada vez mayores de datos, no podemos confiar en calculadoras para el análisis. Debemos confiar en potentes herramientas de análisis de datos que nos ayuden a completar el análisis de datos. trabajar. ?

5. Entender el diseño. Comprender el diseño significa utilizar gráficos para expresar eficazmente las opiniones analíticas del analista de datos, de modo que los resultados del análisis sean claros de un vistazo. El diseño de gráficos es un tema importante, como la selección de gráficos, el diseño, la combinación de colores, etc., todo lo cual requiere dominar ciertos principios de diseño.

Espero que esto ayude.

Si necesita saber más sobre la opinión pública y los datos, inicie sesión en el sitio web: enlace web