Cómo lidiar con la redirección cuando Python rastrea páginas web
1. La redirección del lado del servidor se completa en el lado del servidor. En general, los rastreadores pueden adaptarse y no requieren procesamiento especial, como los códigos de respuesta 301 (redirección permanente) y 302 (redirección temporal). esperar. Específicamente, se puede juzgar por los dos atributos URL y status_code en la respuesta obtenida al solicitar el objeto. Cuando status_code es 301, 302 u otros códigos que representan la redirección, significa que la solicitud original ha sido redirigida; cuando el atributo de URL del objeto de respuesta no coincide con el enlace utilizado para enviar la solicitud, también significa que la solicitud original ha sido redirigida; Redirigido y ha sido procesado automáticamente.
2.meta actualización, es decir, declara un enlace de redirección de página web en la etiqueta de la página web. Esta redirección la completa el navegador y es necesario escribir código para manejarla. Por ejemplo, para una redirección como el código html que se muestra en la tercera línea de los comentarios a continuación, el navegador puede saltar automáticamente, pero el rastreador solo puede obtener la página antes del salto y no puede saltar automáticamente. ?
?