Red de conocimiento informático - Problemas con los teléfonos móviles - Código fuente de detección de cabezas de Python

Código fuente de detección de cabezas de Python

Beautiful Soup convierte automáticamente los documentos de entrada a codificación Unicode y los documentos de salida a codificación UTF-8. No es necesario considerar el método de codificación, a menos que el documento no especifique el método de codificación, en cuyo caso Meitang no puede identificar automáticamente el método de codificación. Luego, solo necesitas explicar el método de codificación original.

Python3 distingue entre Unicode str y ByteArray, y la codificación predeterminada ya no es ascii.

La solución final al problema de codificación;

Cree un nuevo sitecustomize.py en la carpeta Lib\site-packages en Python.

Archivo, entrada:

Importar sistema

sys .setdefaultencoding(' GB 2312 ')

Una cosa a tener en cuenta aquí es que. Puede configurar GBK o utf8 u otros tipos de formatos de codificación, no necesariamente gb2312. Depende principalmente del formato de codificación que requiera su entorno operativo.