¿Qué herramienta debo utilizar para capturar divs de páginas web en mi sitio web? La URL termina igual. Los nombres de los div también son los mismos. ¿Hay coleccionistas de arañas?
Si este es el caso, la recopilación no es complicada. Te doy dos soluciones:
1. Recolección automática de escritura a mano:
Las tecnologías más utilizadas son http. comunicación y sincronización. Sin embargo, hay demasiado contenido que necesita escribir y debe manejarlo usted mismo. Si solo recopila un sitio web, puede simplificar parte del contenido y los datos recopilados serán más precisos o más adecuados para su propia aplicación. porque puedes controlarlo. La comunicación HTTP se utiliza para obtener el código fuente de las páginas web. El uso de expresiones regulares requiere hacer coincidir los datos recopilados.
2. Usar herramientas
Actualmente no se ha encontrado ningún software spider con configuración de reglas de recopilación. Generalmente, el software spider recupera páginas web y el software de recopilación recopila datos de acuerdo con reglas específicas. Es posible que esté más preparado para utilizar software de captura.
Recomendación: recopilación y edición de soukey, software de recopilación de código abierto, que puede controlarse y modificarse según sus propias necesidades. Existen máquinas mineras de red pagas que deberían cumplir con sus requisitos.