¿Cómo aprender la tecnología de rastreo web paso a paso?
Como principiante, creo que es posible que quieras resolver un problema práctico en el trabajo o simplemente quieras aprender tecnología de rastreo y adquirir habilidades adicionales. De hecho, fue lo mismo cuando estaba a punto de comenzar a aprender los rastreadores de Python. Mi jefe me asignó una tarea. Nadie sabía cómo rastrear, así que tuve que estudiar mucho por mi cuenta. Por lo tanto, puedo utilizar un mapa mental para aclararte lo que debes hacer.
No tengo ninguna base pero quiero aprender a rastrear web:
Ruta 1: No quiero escribir código, Excel/Octopus, la ventaja de usar estas herramientas es que puede comenzar rápidamente, pero solo puede rastrear algunos sitios web simples una vez que el sitio web está restringido, estos métodos son solo un juguete. Entonces, si quieres jugar con algunos datos, simplemente juega con estos juguetes.
Ruta 2: Puedo aprender a escribir código, pero ¿será difícil? Déjame decirte desde mi experiencia que es mucho mejor encontrar un buen profesor que pensar al azar y ponerte límites. Escribir código no es difícil de aprender, razón por la cual existen tantos tutoriales de codificación rápida en el mercado. Por eso algunos de mis compañeros cambiaron de especialidad y se unieron a Google en un año.
Aquí tienes una descripción de tu ruta de aprendizaje:
Aprende el código básico de Python: si no tienes ninguna base de programación, puede llevarte de 1 a 2 semanas, 3 horas. un día. Suponiendo que tenga conceptos básicos de programación (VBA cuenta), 1 hora.
Comprender los principios de los rastreadores: 5 minutos. ¿Por qué es tan importante? Creo que aprender algo es como construir un edificio. Primero, descubre la estructura grande y luego comienza desde los cimientos. Muchas veces nuestro aprendizaje es que antes de comprender el gran marco, simplemente miramos la enseñanza fragmentada en Internet o seguimos la enseñanza en línea para aprender capítulo por capítulo. Es fácil aprender semillas de sésamo y perder la sandía. Mi autoestudio ha tomado muchos desvíos al respecto.
Utilice los principios del rastreador para crear un rastreador simple: 30 minutos.
Primero obtenga una comprensión profunda de la página web: envíe una solicitud a una URL, luego la URL devolverá los datos de toda la página web. Similar: escribe la URL en el navegador, presiona Enter y luego ve la página completa del sitio web.
Un análisis exhaustivo de la página web: Extrayendo los datos que desees de los datos de toda la página web. Similar: ves la página completa del sitio web en tu navegador, pero quieres encontrar el precio del producto, y el precio son los datos que deseas.
Aprende a almacenar datos nuevamente: El almacenamiento es muy simple, simplemente guarda los datos.
Después de aprender esto, puedes salir y decirle a los demás que sé cómo rastrear Python y no creo que nadie te cuestione. Entonces, después de aprender este conjunto, ¿cuánto tiempo te costará? Si tienes conocimientos básicos de programación, 1 semana es suficiente.
Entonces, ¿quieres ser un reptil y un juguete para divertirte, o quieres dominar un arma práctica? Creo que puedes medirlo tú mismo.