Red de conocimiento informático - Conocimientos de programación - Código fuente de almacenamiento de páginas web

Código fuente de almacenamiento de páginas web

Primero lea el encabezado y luego conviértalo usando UTF8. Si la codificación de la página HTML es gbk o gb2312, los caracteres chinos convertidos están confusos, pero los caracteres en inglés se muestran normalmente. Luego, la página de códigos de la codificación de la página HTML se determina buscando en inglés.

En términos generales, hay "charset=gbk" en la página web para representar diferentes páginas de códigos.

Luego vuelva a leer la página web completa y luego use la página de códigos obtenida para convertirla en el código del sistema informático local para evitar caracteres confusos. Por supuesto, también se puede convertir directamente a código UTF-8 o Unicode y almacenarlo como un archivo TXT con el encabezado de archivo correspondiente.

La API utilizada es principalmente MultiByteToWideChar y otras funciones.