Cómo identificar la codificación de caracteres chinos en el código fuente
Las codificaciones más comunes son GB2312-1980 y BIG5. La primera es la codificación estándar nacional y la segunda es la codificación Big5.
Los caracteres chinos están codificados en dos bytes y el bit más alto no es 0.
El valor del código estándar nacional es mayor que 0xA0A0.
Si desea conocer la codificación de los caracteres chinos, puede escribir un programa simple, abrir el archivo de codificación de caracteres chinos,
leer un byte y multiplicarlo por x hexadecimal. o cuadrado decimal Dos salidas.
gb1 = fgetc(fin); gb2 = fgetc(fin);
fprintf(stdout, "02x02x ", gb1, gb2); p> p>
Decimal: gb1 se desplaza 8 bits hacia la izquierda, suma gb2 y genera d.