Cómo empezar como ingeniero de datos
Es necesario entenderse a sí mismo y a la industria claramente desde el principio. Muchas personas no pueden distinguir entre big data y minería de datos. Es muy injusto decir que quieren cambiar. Responsable de carreras en la información de reclutamiento. No siempre te concentres en lo que es popular. De todos modos, a menudo desprecio cualquier desarrollo de big data que sea demasiado bajo. Para generar datos, debes realizar minería de datos; de lo contrario, siempre será inútil.
2. Elige una ruta de aprendizaje
Si realmente sabes que quieres pasarte al desarrollo de datos, debes considerar tu tiempo y energía y cuánto tiempo puedes dedicar. Es mejor hacerlo mientras estudia. Alguien necesita más orientación, de lo contrario será demasiado fácil tomar desvíos.
Tenga cuidado al elegir una ruta de aprendizaje específica. Hay varias opciones:
Autoestudio
Registrarse en una clase
Buscar. Orientación personal
Además, también puedes considerar inscribirte en una clase de tutoría. No esperes que inscribirte en una clase de tutoría te lleve al cielo y a la tierra, pero puedes confiar en él para que te ayude a clasificar. tus ideas. Sería mejor si hubiera personas especializadas en este campo para ayudar. La tecnología no es necesariamente buena, lo principal es poder comunicarse.
3. Ruta de aprendizaje
La ruta de aprendizaje generalmente se recomienda de la siguiente manera:
La primera etapa
Primero tener una cierta base en Linux y Java, no es necesario que sea muy profundo, simplemente comience a jugar. Si usa Linux, puede realizar varias operaciones usted mismo y si usa Java, puede escribir algunos programas. Todas estas cosas están preparadas para construir un entorno Hadoop.
Primero aprenda Hadoop, aprenda a crear una versión independiente de Hadoop, luego distribuya Hadoop y escriba algunos programas de MR.
Luego, aprenda otros componentes de big data en el ecosistema de Hadoop, como Spark, Hive y Hbase, e intente crear y ejecutar algunas demostraciones oficiales.
Después de tener una cierta base en varios componentes como Linux y Java, necesita tener algo de práctica en proyectos. En este momento, necesita encontrar algunos casos exitosos, como buscar varios tutoriales en video sobre cómo hacerlo. para construir un sistema de recomendaciones y aplicar lo que ha aprendido.
La segunda etapa
Esta es la etapa básica, con una comprensión general del desarrollo de datos. Entonces debería haber algún contenido interesante para elegir.
Sistema de almacenamiento de datos: puede tener una comprensión general de cómo implementar la estratificación de datos y cómo construir un sistema de almacenamiento de datos.
Análisis de usuario e ingeniería de funciones: Cuanto antes comprendas esta parte, mejor.
Algunas ideas de implementación de sistemas: cómo se implementan sistemas como los sistemas de programación, los sistemas de metadatos y los sistemas de recomendación.
La tercera etapa
Hay algunas áreas subdivididas que es necesario realizar en profundidad. Seleccione algunas según el contenido del trabajo y los intereses a realizar en profundidad
<. p> Teoría distribuida: como Gossip, DHT, Paxo, estos protocolos y algoritmos subyacentes que constituyen varios sistemas distribuidos aún deben aprenderse.Algoritmos de minería de datos: Es necesario aprender los algoritmos, pero no son necesariamente teoría pura. Implementar algoritmos en un entorno distribuido es un desafío en sí mismo.
Aprender el código fuente de varios sistemas: como el código fuente de Hadoop, Spark y Kafka. Si desea profundizar en big data, no se puede escapar del código fuente.