HTTPError: Error HTTP 250: Problema prohibido con python urllib2 para extraer el código fuente de la página web
El encabezado de la solicitud HTTP contiene información como el navegador, idioma utilizado, host solicitado, COOKIE, etc.
Los dos datos más importantes son la información del Agente de usuario del navegador. Si no hay ningún Agente de usuario en la solicitud, el sitio web pensará que no hay nadie en la solicitud del navegador, lo cual es un. ataque malicioso
Para los sitios web que requieren inicio de sesión, a menudo se requiere una COOKIE en la solicitud para verificar la identidad del usuario y obtener permiso para abrir ciertos sitios web.
Utilizando las opciones de red del kit de herramientas para desarrolladores del navegador Firefox, puede obtener fácilmente encabezados como user-agent
¿Un ejemplo simple de cómo agregar encabezados a una solicitud =?{" User-Agent":?"Mozilla/5.0?Firefox/35.0",
"Cookie":?""(solicitud)