Red de conocimiento informático - Conocimiento informático - Cómo identificar la codificación de caracteres chinos en el código fuente

Cómo identificar la codificación de caracteres chinos en el código fuente

Las codificaciones más comunes son GB2312-1980 y BIG5. La primera es la codificación estándar nacional y la segunda es la codificación Big5.

Los caracteres chinos están codificados en dos bytes y el bit más alto no es 0.

El valor del código estándar nacional es mayor que 0xA0A0.

Si desea conocer la codificación de los caracteres chinos, puede escribir un programa simple, abrir el archivo de codificación de caracteres chinos,

leer un byte y multiplicarlo por x hexadecimal. o cuadrado decimal Dos salidas.

gb1 = fgetc(fin); gb2 = fgetc(fin);

fprintf(stdout, "02x02x ", gb1, gb2); p> p>

Decimal: gb1 se desplaza 8 bits hacia la izquierda, suma gb2 y genera d.