Red de conocimiento informático - Consumibles informáticos - ¿Puedo convertirme en analista de datos sin conocimientos básicos?

¿Puedo convertirme en analista de datos sin conocimientos básicos?

Muchas personas me preguntaron en segundo plano cómo cambiar de carrera como analista de datos o cómo los graduados pueden ingresar a la industria. Mis artículos anteriores trataban sobre habilidades duras. Esta vez hablaré sobre habilidades blandas basándome en una respuesta que di sobre Zhihu. Trátelo como una charla aleatoria.

Entré a la industria de Internet con una base cero, no una base cero en el análisis de datos, sino una base cero en todas las habilidades.

¿Cómo se ve tener base cero? Pasé de tres a cuatro meses buscando trabajo y terminé uniéndome en calidad de operativa.

Nunca he sido una persona fuerte en matemáticas y ciencias. Aunque estudié matemáticas avanzadas, estadística, SQL y lenguaje C en la universidad, me los salté todos y tomé el examen con la ayuda de mis amigos. Mirando ahora hacia atrás, debería haber aprendido más en ese momento.

Al principio no sabía cómo realizar búsquedas virtuales y nadie me enseñó que solo podía realizar operaciones básicas en Excel. En ese momento, tenía que correlacionar varios informes. Confiaba en mis manos rápidas para buscarlos, copiarlos y pegarlos uno por uno... Definitivamente lloraría cuando la cantidad de datos fuera demasiado grande. Después pensé que esta no era la solución. Así que utilicé el todopoderoso Baidu:

"Cómo unir datos de varias tablas en Excel".

Entonces vi la función vlookup por primera vez. No lo aprendí todo de una vez. Cada vez que lo usaba, primero tenía que leer los ejemplos en línea. Cuando más tarde enseñé a los miembros del grupo, aprendieron mucho más rápido que yo.

Excel va paso a paso y el aprendizaje se basa en buscar y reflexionar. Tómese el tiempo para practicar el análisis de contenido en el trabajo: por ejemplo, qué tipo de usuarios están dispuestos a utilizar nuestra aplicación y cuáles. Los indicadores de los usuarios son particularmente buenos.

Incluso mientras tanto, no sé cómo pivotar tablas.

Recuerdo que a principios de 2015, mi jefe me dio una tarea: recolectar datos en línea. Me resultaría imposible copiarlos y pegarlos todos. Seguí con la consulta:

¿Cómo? Descargar datos rápidamente de páginas web.

Conozco los rastreadores y Python, pero no sé cómo hacerlo. Por último, confíe en herramientas de rastreo de terceros y siga los tutoriales. Ya aprendí HTML + CSS en los primeros días, y luego aprendí sobre la estructura de las páginas web, aprendí Obtener / Publicar y aprendí las reglas regulares. Me tomó una semana de trabajo extra para descargarlo.

Aún no ha terminado. Los datos están sucios y todavía necesito limpiarlos. Dedique otra semana a aprender a buscar, derecha, mitad, reemplazar, recortar y otras funciones de procesamiento de texto de Excel. En ese momento no sabía que se llamaba limpieza de datos, pero aprendí muchas técnicas. Incluso si intento hacerlo de forma rápida y sin esfuerzo, todavía me lleva varios días.

Cuando escribo un rastreador de Python ahora, la eficiencia es mucho más rápida. Incluyendo limpieza de texto, usando la palanca de velocidad Levenshtein. Todo sumado y hecho en una noche.

Ningún aprendizaje es inútil, y hay mucho conocimiento común. Aprendí HTML + CSS gracias al rastreador y luego entendí la estructura y el análisis del sitio web de una manera lógica.

En el futuro, sabré cómo organizar las estadísticas de Baidu, conoceré JS, aprenderé varios indicadores en la página web y comprenderé las rutas de acceso, las conversiones de embudo, las tasas de rebote, las tasas de salida, etc. Este conocimiento se puede utilizar para algo más que sitios web. También se puede utilizar en análisis de aplicaciones y comportamiento del usuario.

Consideramos el aprendizaje como un punto y leemos el siguiente libro después de terminar este. De hecho, esto no puede resaltar la eficiencia del aprendizaje. Cualquier conocimiento es relevante. El conocimiento A se puede aplicar al conocimiento B. El árbol de conocimientos y habilidades debe ser divergente en una red.

La cadena anterior es el espectro de relaciones para que yo domine nuevos conocimientos basados ​​en conocimientos previos. El análisis de datos cubre una amplia gama de campos, además de una sólida experiencia empresarial, también requiere un árbol de habilidades similar a la navaja suiza, que es una habilidad en forma de T (una especialidad, múltiples talentos).

Por ejemplo, ves una página con una alta tasa de rebote. Además del análisis regular, también debemos verificar la velocidad de la red, el entorno de red débil del usuario, si la página HTML está demasiado cargada, si se usa el caché, cómo es el DNS de la red, etc. Nadie le enseñará este conocimiento, pero afecta los resultados comerciales.

No tengas miedo cuando veas esto. Aunque tienes que aprender mucho, a medida que tu aprendizaje se profundice, muchos conocimientos serán fáciles de entender. Al igual que la tasa de conversión proviene del análisis del sitio web, se puede utilizar en las rutas de productos. Se puede sublimar en un diagrama de Sankey y utilizar para estratificar a los usuarios. Cuanto más aprenda, más fácil será dominar un método y dominar todos los métodos.

Fuerza impulsora

De hecho, el umbral más difícil para aprender a analizar datos desde cero no son las habilidades, sino la motivación para aprender.

He formado analistas de datos desde cero, enseñé Excel desde cero, SQL desde cero, pensamiento analítico desde cero y Python desde cero. La dificultad nunca es el conocimiento, sino si realmente quieres aprenderlo.

No significa que descargues más de diez gigabytes de información, significa que estudies, no significa que sigas muchas cuentas públicas, significa que estudies. Debido a que al final no se abrirán más de diez gigabytes de información, muchas cuentas oficiales terminarán sin leerse. ¿Esto significa que quieres aprender? Es demasiado fácil comenzar sin base y es difícil persistir, y dejarás de hacerlo después de una breve prueba.

No sé por dónde empezar porque no sé qué aprender. Dije que el análisis de datos es un tema relativamente amplio. Cuenta tanto con la metodología de análisis empresarial tradicional como con la estadística y programación en la era de los datos. Pero resulta que es una habilidad que se puede utilizar en cualquier puesto o profesión y que no se puede pasar por alto.

El aprendizaje es una cuestión muy subjetiva. Desde la escuela primaria hasta la universidad, durante nuestras décadas de vida estudiantil, la capacidad que más se echa en falta es el aprendizaje activo. Después de tantos años de estudiar para el examen de ingreso a la escuela secundaria y el examen de ingreso a la universidad, a menudo ocurre que los factores ambientales obligan a las personas a estudiar y no tienen ninguna motivación o hábito para estudiar. Después de cuatro años de universidad, el potencial de aprendizaje puede haberse agotado.

La razón por la que estamos acostumbrados al aprendizaje pasivo es que todo el mundo tiene un problema que resolver y sólo conoce la aplicación de la fórmula, sin conocer el principio. El libro de texto proporciona orientación sobre tácticas y tácticas, y el contenido no excederá el esquema. Todo el gran entorno de aprendizaje está diseñado para la pasividad.

Aprenda a analizar datos ahora, elija libros, abra materiales en PDF y siga cuentas públicas. No habrá profesores que os corrijan y os entrenen, y no habrá tareas que os impulsen y os capaciten. No sé cuál se utilizará con frecuencia en mi trabajo. No hay preguntas de datos para practicar e incluso es difícil distinguir la calidad del conocimiento en Internet.

No hay forma de empezar, verdad, pero esto es aprendizaje activo.

Es necesario cambiar la mentalidad.

Para aprender a analizar datos desde cero, el mejor maestro sólo puede ser usted mismo. No habrá ningún artículo que enseñe a las personas a convertirse en analistas de datos de la noche a la mañana. He entrenado a pasantes que estaban dispuestos a aprender y crecieron rápidamente, y también he entrenado a colegas que estaban interesados ​​pero aún no podían conseguir el ritmo. El primero es aprendizaje activo, mientras que el segundo es aprendizaje pasivo basado en el interés.

Al tratarse de una fundación de base cero, se necesita más iniciativa. La tecnología de análisis de datos es una industria en rápido desarrollo. Hace unos años, bastaba con saber SQL. Ahora necesita saber algo de MR y HIVE. En unos años, SparkSQL puede ser necesario si desea mejorar en esta industria. El aprendizaje continuo es una habilidad necesaria. O la base no es tan buena como la de otros, al menos aprende género y pierde.

También doy mis sugerencias. El aprendizaje debe consistir en establecer objetivos específicos para resolver un problema determinado. Sea minucioso y la práctica es la clave. No importa el tipo de profesión que ejerzas, debes tener más o menos acceso a los datos. No lo analices todavía, pero piensa en lo que puedes hacer con los datos y formula una hipótesis sencilla.

Soy RR.HH. y mi hipótesis es que últimamente se ha vuelto cada vez más difícil contratar personas.

Soy especialista en marketing y mi hipótesis es que los costos de marketing son demasiado altos ahora. no hay ningún efecto.

Estoy en operaciones o productos, es más fácil de manejar, supongamos que los datos de un determinado indicador no se pueden mejorar debido a ABC y otras razones.

Incluso los estudiantes pueden asumir si es fácil o difícil ganar dinero en el distrito comercial escolar.

Los datos se recopilan, generan, combinan, utilizan, demuestran y analizan en torno a hipótesis. Este es un método de pensamiento al estilo McKinsey, que también se puede utilizar como método para aprender datos. Los recién llegados pueden perderse fácilmente en los datos: no tengo datos, no sé qué hacer con los datos, sé qué hacer pero no sé cómo hacerlo. Pensar demasiado no es tan útil como tener una dirección.

La ventaja de basarme en suposiciones es que primero tengo una dirección, independientemente de si es correcta o no, al menos puedo hacer un análisis de acuerdo con la dirección.

RR.HH. cree que cada vez es más difícil reclutar personas, por lo que puede generar datos históricos. En el pasado, cuando reclutaba personas, necesitaba descargar algunos currículums y hacer algunas llamadas telefónicas. , envía algunas ofertas y finalmente consigue que te contraten. ¿Y ahora qué? También puedo observar los datos de cada enlace. ¿No es esta la tasa de conversión? Amplíe la dimensión temporal y vea si fue difícil reclutar personas en esta época el año pasado o si sería difícil reclutar personas al final del año. De esta manera podrá comprender el concepto de gráfico de líneas.

Los especialistas en marketing pueden utilizar más datos como referencia para el análisis. Suponiendo que los costos de marketing son demasiado altos, ¿cuán altos son ahora? ¿Cuándo comenzaron a ser altos? Descubra el momento y analícelos. Si el efecto no es bueno, ¿cuándo no funcionó? ¿Cambió el entorno del mercado en ese momento? Supongo que el entorno del mercado ha cambiado. Esta es otra hipótesis nueva y puedo seguir realizando muchas investigaciones en profundidad.

Aunque la eficiencia del análisis y los resultados de cada uno son definitivamente diferentes, todas las ideas se pueden entrenar de esta manera. No es que los datos puedan analizarse, sino que sólo pueden recopilarse y analizarse con la dirección del análisis. Mis estudios siempre se han centrado en la resolución de problemas, no solo en un repentino destello de inspiración.

Si piensa que el viaje de aprendizaje del análisis de datos es un camino largo, no llegamos hasta el final. Nadie puede hacer esto. En cambio, esta carretera se divide en secciones y se coloca una bandera en cada sección como objetivo. La bandera se utiliza como dirección de viaje, en lugar de la estación terminal a decenas de kilómetros de distancia como objetivo.

Curiosidad

Además del deseo de aprender, querer convertirse en analista de datos también requiere curiosidad.

Curiosidad significa hacer preguntas, pensar en problemas, reflexionar sobre problemas y resolver problemas. Si eres una persona chismosa por naturaleza, usarlo en el análisis de datos definitivamente te convertirá en un analista elegido naturalmente con buenos talentos y un hermoso jade.

A muchas personas les gusta aprovechar las herramientas, el conocimiento, los puntos clave y los consejos del análisis de datos. Pero rara vez se menciona la curiosidad.

La curiosidad es la capacidad central para resolver problemas. La programación se puede ejercitar y las estadísticas se pueden aprender al final. Has aprendido las dieciocho artes marciales y, cuando te enfrentas a una batalla enemiga, ¿qué necesitas al final? Es el deseo de ganar. El deseo de ganar en datos es curiosidad.

El conocimiento determina el límite inferior de resolución de problemas y la curiosidad determina el límite superior de resolución de problemas. Un buen analista de datos debe ser curioso, capaz de hacer preguntas, pensar en problemas y resolverlos.

Todas las actividades que lanzamos inicialmente no tenían un sistema de seguimiento y toda la operación carecía de orientación de datos. Para mí en aquel momento, muchas operaciones eran una caja negra. No sé qué se está publicando y cómo sucedió. Solo hay un resultado.

Si alguien me pregunta qué estoy preguntando, sólo puedo hacer suposiciones, tal vez una, dos o tres. Si ese es el caso, no lo sé.

¿A qué se debe el aumento de la actividad operativa? no tengo idea.

¿Cuál es el efecto después del envío de SMS? no tengo idea.

¿Cuáles son las fuentes de nuevos usuarios registrados? no tengo idea.

En aquel momento, con la ampliación de las líneas de negocio de la empresa, el número de usuarios aumentó. Cada vez me resulta más difícil hacer correlaciones en Excel. Cuando volví a pedir datos a I + D, el CTO me dijo: ¿Por qué no le doy permiso de base de datos y puede comprobarlo usted mismo?

Me despedí de Excel y comencé a aprender y comprender las bases de datos. Amplíe la exposición de unas pocas mesas a cientos de mesas.

Conozca la diferencia entre unión izquierda y unión interna. Conozca agrupar por, conozca la estructura de datos y conozca el índice.

En ese momento, era necesario establecer un sistema de datos de los usuarios, que incluyera retención, actividad, retorno, estratificación y otros indicadores. Busqué en línea la aplicación y explicación de indicadores operativos, así como la implementación de SQL.

Explicar y comunicarse con I+D. Debido a la comprensión de la base de datos, muchas necesidades se pueden satisfacer con requisitos más razonables. Esta es la primera vez que comienzo a contactar, comprender y construir un sistema de datos centrado en el negocio.

Para dar un ejemplo: un usuario ha usado la APP durante mucho tiempo, lo llamamos usuario leal, y de repente no la usa durante varias semanas, entonces usaremos SQL para encontrar esto tipo de usuario y analizar su comportamiento. ¿Por qué no hacer una entrevista telefónica e intentar devolverle la llamada? Lo mismo se aplica a otras operaciones.

En este momento puedo decir que entiendo el número activo, por qué sube y por qué baja.

Enviamos mensajes de texto a diferentes usuarios. Con la ayuda de SQL, puedo consultar la calidad de los datos, pero ¿hay algún indicador más claro? Por ejemplo, ¿cuántos usuarios abren la aplicación gracias a los mensajes de texto y cuál es la tasa de apertura de mensajes de texto?

En ese momento, el enlace corto usaba un esquema de URL, que podía saltar automáticamente a la aplicación para monitorear, también ocultamos parámetros en el enlace corto. Utilice datos push para observar cuántas personas abren este mensaje de texto.

Este es el estándar para medir una copia. Una buena copia seguramente hará que los usuarios la abran. A menudo utilizamos la redacción publicitaria como prueba AB. Por ejemplo, usaremos marketing por SMS y la operación está vinculada a obsequios. En ese momento, muchos usuarios no descargaron la aplicación después de registrarse en línea. Tenemos una copia de mensaje de texto para este tipo:

丨. Hemos preparado pensamientos exclusivos para ti, XXXXX, abre la APLICACIÓN para recibirlos.

La tasa de apertura de este mensaje de texto es aproximadamente del 10%.

Pero todavía hay espacio para la optimización, así que continué modificando la redacción y las modificaciones posteriores son las siguientes:

丨Ya que te registraste, ¿por qué no vienes y recibes tus deseos exclusivos? XXXXX, abre la APP para recibirlo (el contenido del medio no está incluido) Cambiar).

La tasa de apertura está optimizada al 18%. Debido a que utiliza la psicología del marketing y ya se ha registrado, se ajusta a la implicación del costo silencioso: he hecho todo, por qué no continuar, de lo contrario el registro será en vano. Este tipo de mentalidad es común en las atracciones turísticas. Las atracciones turísticas son muy engañosas, pero la mayoría de la gente todavía dirá: Desde que llegaron, es una mentalidad común.

Los mensajes de texto de seguimiento adoptaron una solución personalizada y finalmente se optimizaron al 25%. El efecto es aproximadamente tres veces mejor que el de la redacción anterior. Si no tiene curiosidad sobre el efecto de los mensajes de texto y no recopila indicadores de seguimiento de datos, entonces no hay forma de optimizarlos. Es posible que escribamos un buen texto basado en nuestros sentimientos, pero usted no conoce el efecto específico, pero los datos sí.

Para dar otro ejemplo, inicialmente utilizamos WeChat Moments para atraer nuevos usuarios. Al principio, había varios canales, pero no sabía cuál era más efectivo. Entonces volvió mi curiosidad. ¿Qué canal es más efectivo? ¿Se puede optimizar la tasa de conversión de invitaciones? ¿Cuál es el costo de atraer nuevos clientes al canal?

Sigue siendo la promoción e implementación del análisis de datos, porque el intercambio de páginas web de WeChat incluirá automáticamente desde = línea de tiempo y otros parámetros. A través de los parámetros, puedo filtrar los datos navegados y a los que se accede en WeChat. Más tarde, le pedí a I+D que estableciera parámetros para diferentes canales. Utilice parámetros para contar las tasas de conversión y etiquetar a los nuevos usuarios con las fuentes del canal.

Durante este período, se descubrió que la tasa de conversión de un canal era demasiado baja. Lo dividimos aproximadamente en dos tipos de canales. Uno es la página de inicio que invita directamente a los usuarios a registrarse, con información sobre el regalo adjunta. Una es permitir que los usuarios seleccionen primero el estilo de regalo y luego pasar al registro en el paso final de recepción. A través del análisis de la tasa de conversión, la pérdida de este último es más grave. Debido a que los pasos son demasiado redundantes y todavía hay una dirección de mensajería que completar, el atractivo de seleccionar regalos no es suficiente para ayudar a los usuarios a completar el proceso.

Entonces se cambió el proceso del segundo canal. Debido a que las fuentes de usuarios de diferentes canales de registro están etiquetadas, se pueden tomar medidas específicas en las operaciones posteriores de nuevos usuarios. Esta es una de las razones por las que los mensajes de texto pueden lograr una tasa de apertura del 25% mediante la personalización.

La curiosidad sirve para resolver problemas. Al pensar y resolver problemas constantemente, sus habilidades relacionadas con el análisis de datos mejorarán naturalmente.

Afortunadamente la curiosidad se puede entrenar día a día, es decir, haciendo más preguntas y pensando más en ellas, el entrenamiento no es difícil.

Sin datos

Otro problema del aprendizaje de base cero es que subestima la importancia de los negocios.

De hecho, la dificultad para convertirse en analista de datos no es la falta de conocimientos en Excel, SQL, estadística, etc. Es una falta de conocimiento empresarial.

Una persona entiende los negocios pero no los datos, y la otra entiende los datos pero no los negocios. Es más probable que la primera resuelva problemas prácticos. Porque los analistas de datos siempre están al servicio del negocio.

Una vez le propuse al producto (sin invitarme a cenar) organizar aplicaciones y oficinas web para comprender a los usuarios a través de sus caminos y compensar las deficiencias de las estadísticas de Baidu.

En ese momento, Hadoop se usaba para almacenar datos y Hive se usaba para crear limpieza, partición y procesamiento de scripts sin conexión. Las páginas que los usuarios navegan a través del producto, las funciones que utilizan y el tiempo que permanecen allí forman la base de los retratos de los usuarios.

Una vez sentí mucha curiosidad por saber qué es un perfil de usuario, porque en Internet se dice que el género, la región, la edad, el matrimonio, las finanzas, los intereses y las preferencias del usuario son la base del perfil de usuario. . Pero nuestro negocio no recibe tantos datos. Y creo que los retratos de usuarios son para servicios empresariales y no deberían tener estándares estrictos y unificados. Siempre que sea fácil de usar en los negocios, es un buen retrato de usuario.

Al igual que los retratos de usuarios de vídeos online, se recopilarán los actores, la hora de estreno, el lugar de origen, el idioma y el género de la película. También se dividirá en si el usuario avanza rápidamente o arrastra. Estos están orientados a los negocios. Incluso los analistas de sitios web de vídeos tienen que leer innumerables vídeos para poder analizar el negocio. De lo contrario, ¿cómo podemos desglosar varios indicadores con tantas categorías y tipos de películas? Puede juzgar si el usuario está interesado arrastrándolo hacia adentro. Debe utilizar un comportamiento similar para comprenderlo.

¿Cómo aprender conocimientos industriales y empresariales sin base alguna? Si estás en contacto con el negocio y solo quieres hacer análisis de datos, será mucho más fácil. Si, como yo, no tienes conocimientos obligatorios ni comprensión de datos, está bien.

Si los datos se aprenden a través del pensamiento hipotético, entonces los negocios deberían aprenderse a través del pensamiento sistemático. El conocimiento empresarial también necesita un propósito y una dirección, pero es diferente del análisis de datos. Los negocios se centran en la sistematicidad. La sistematicidad no es un conocimiento grande y completo, sino un conocimiento estructural de arriba hacia abajo. Comience perforando en una dirección para obtener la profundidad y la amplitud se expandirá gradualmente a medida que profundice.

Por ejemplo, si no es un experto y desea aprender a analizar el sistema operativo del usuario, no considere primero qué es el funcionamiento del usuario. En lugar de ello, apunte en una dirección, como la actividad, comprenda su definición y significado y luego piense en cómo aplicarla. ¿Cómo definir la actividad de los centros comerciales fuera de línea, cómo definir la actividad de los pacientes del hospital y qué tan activo es un determinado club escolar? Piense en la actividad con ejemplos a su alrededor. La actividad del centro comercial puede ser el flujo de personas que caminan, el flujo de clientes comprando o los ricos cargando bolsas grandes y pequeñas. ¿Qué factores afectan la actividad? Promoción o descuento, días festivos o geografía. Una vez que se resuelvan estos problemas, será rápido comenzar con las operaciones del usuario.

Piensa en retener y atraer nuevos clientes a través del mismo pensamiento. Sabrás que si el flujo de personas en el centro comercial continúa viniendo a consumir la próxima vez, es retención, y si vienen nuevos clientes, es atracción de nuevos clientes. ¿Qué factores influyen entre sí? El pensamiento del conocimiento final debe tener una estructura piramidal. El nivel superior son las operaciones del usuario y el nivel medio es la adquisición, activación y retención de nuevas. El nivel inferior son los distintos puntos y elementos.

El aprendizaje del análisis de datos se centra en la deducción y el razonamiento, mientras que el aprendizaje de los negocios se centra en la correlación y la aplicación. Este es el caso de aplicar lo que se aprende. Durante este período también se utilizarán la curiosidad y las suposiciones, las cuales son una de las formas de acelerar el aprendizaje.

De hecho, habiendo dicho todo esto, para los estudiantes que quieran ser analistas de datos sin base, todavía puede haber algunas nubes y niebla. Estas habilidades sociales no ayudarán a las personas a llegar a la cima de una sola vez. De hecho, las siete semanas para convertirse en analista de datos son, como dije desde el principio, un esquema para comenzar. Lo que importa es si realmente quieres aprender y aprender bien. El maestro te guiará. La cultivación depende del individuo. Todo lo demás está vacío.

Me viene a la memoria un dicho que leí hace mucho tiempo: cuando quieras avanzar, todo te abrirá paso. Creo que eso es más poderoso que cualquier cosa que haya dicho.

Entonces me preguntas, ¿puedo convertirme en analista de datos sin conocimientos? Mi respuesta es sí.

La verdad es que el artículo es un poco apresurado. Finalmente, les deseo a todos una Feliz Navidad.