Notas del rastreador de Python (2) módulo de solicitudes para obtener, publicar y proxy
? base_url = ''
? respuesta = request.get(base_url)
url=solicitud de URL,
encabezados =Diccionario de encabezados de solicitudes,
params = Diccionario de parámetros de solicitudes.
tiempo de espera = duración del tiempo de espera,
)----gt; objeto de respuesta
¿La respuesta del servidor incluye: línea de estado (protocolo, código de estado), respuesta? Encabezado, línea en blanco, texto de respuesta
Formato de cadena: respuesta.text
Tipo de bytes: respuesta.content
respuesta.headers['cookie']< / p>
El texto de respuesta de tipo cadena obtenido por respuesta.text,
en realidad se obtiene mediante los siguientes pasos:
respuesta.text = respuesta.contenido(respuesta. codificación)
Causa: El formato de codificación de codificación y decodificación es inconsistente.
str.encode('encoding')---Decodifica la cadena en bytes de acuerdo con la codificación especificada
bytes.decode('encoding')---Decodifica los bytes escriba en Codificar la codificación especificada en una cadena.
a.response.content.decode('Formato de codificación correcto de la página')
lt; metaproxy: se utiliza principalmente para control remoto a través de telnet, el puerto generalmente es 23
Proxy altamente anónimo: el paquete de datos se convertirá intacto. Desde la perspectiva del segmento de servicio, parecerá como si un usuario normal estuviera accediendo, ocultando completamente la dirección IP.
Proxy anónimo ordinario: el paquete de datos sufrirá algunos cambios y el servidor puede encontrar la IP original.
Proxy transparente: no sólo cambia los datos, sino que también indica al servicio quién accedió a ellos.
Agente espía: se refiere a un agente utilizado por organizaciones o individuos para registrar datos de transmisión de usuarios y luego realizar investigaciones, monitoreo y otros fines.
? proxies = {
'Tipo de servidor proxy': 'ip de proxy'
}
? (proxies = proxies)
? Tipo de servidor proxy: http, https, ftp
IP del proxy: http://ip:port