Red de conocimiento informático - Conocimiento informático - Cómo obtener las reglas del sitio web de vídeos

Cómo obtener las reglas del sitio web de vídeos

Los pasos para obtener las reglas del sitio web de videos son los siguientes.

El primer paso es identificar el sitio web que deseas adquirir.

El segundo paso es determinar la codificación del sitio web capturado. Después de abrir la página web raspada, verifique el código fuente (IE: Ver - Código fuente) para encontrar el juego de caracteres en el medio y se mostrará la codificación de la página web.

El tercer paso es escribir las reglas de adquisición de la lista de colección. Al escribir la URL de origen, es obvio que pageno representa el número de página de paginación, por lo que una lista de colección con varias páginas debe usar "[var: paginación]" en lugar del número de página de paginación. Las URL de los artículos deben contener y las URL no deben contener estos dos, por lo general no es necesario escribirlas. Hay muchas conexiones innecesarias en el rango de la lista de recopilación y solo se pueden usar para filtrar. Si solo hay una lista de páginas, entonces está bien escribir la URL directamente en la URL de origen. Presta atención aquí, lo más importante está aquí. Lo siguiente es "Cómo escribir las reglas para recopilar artículos para obtener una lista", que consiste en abrir el archivo de código fuente de la página de recopilación anterior y averiguar si hay algún otro código que sea igual a esta página antes del artículo. lista.

El cuarto paso es obtener el título del artículo, el contenido del artículo, el autor del artículo, la fuente del artículo y otros métodos de escritura habituales, y recopilarlos en páginas. Para conocer los métodos de escritura de "Iniciar HTML" y "Finalizar HTML", consulte "Obtener la lista de escritura de reglas" en el tercer paso. Después de completar las operaciones anteriores, guarde y haga clic en "Probar", luego haga clic en "Recopilar". Una vez completada la colección, expórtela a su columna y estará bien. completo.