Rastreador de Python, error de codificación HTML local al leer: UnicodeDecodeError: el códec 'ascii' no se puede decodificar
Beautiful Soup convierte automáticamente los documentos de entrada a Unicode y los documentos de salida a UTF-8. No es necesario pensar en la codificación a menos que el documento no especifique una codificación, en cuyo caso Meilitang no reconocerá automáticamente la codificación. En este caso, sólo necesita especificar el estilo de codificación original.
Python3 distingue entre cadena Unicode y matriz de bytes, y la codificación predeterminada ya no es ascii
La solución final al problema de codificación:
En Lib\ de Python sitio -Cree un nuevo sitiocustomize.py en la carpeta -paquetes.
Entrada:
import sys
sys.setdefaultencoding('gb2312')
Una cosa a tener en cuenta aquí es que puede configurar GBK o utf8 o cualquier otro tipo de codificación, no necesariamente gb2312, depende del formato de codificación que requiera su entorno. Depende del formato de codificación que requiera su entorno operativo