Red de conocimiento informático - Problemas con los teléfonos móviles - Cómo lidiar con la redirección cuando Python rastrea páginas web

Cómo lidiar con la redirección cuando Python rastrea páginas web

1. La redirección del lado del servidor se completa en el lado del servidor. En general, los rastreadores pueden adaptarse y no requieren procesamiento especial, como los códigos de respuesta 301 (redirección permanente) y 302 (redirección temporal). esperar. Específicamente, se puede juzgar por los dos atributos URL y status_code en la respuesta obtenida al solicitar el objeto. Cuando status_code es 301, 302 u otros códigos que representan la redirección, significa que la solicitud original ha sido redirigida; cuando el atributo de URL del objeto de respuesta no coincide con el enlace utilizado para enviar la solicitud, también significa que la solicitud original ha sido redirigida; Redirigido y ha sido procesado automáticamente.

2.meta actualización, es decir, declara un enlace de redirección de página web en la etiqueta de la página web. Esta redirección la completa el navegador y es necesario escribir código para manejarla. Por ejemplo, para una redirección como el código html que se muestra en la tercera línea de los comentarios a continuación, el navegador puede saltar automáticamente, pero el rastreador solo puede obtener la página antes del salto y no puede saltar automáticamente. ?

?