Red de conocimiento informático - Conocimiento del nombre de dominio - ¿Cómo escribir caracteres chinos en una computadora?

¿Cómo escribir caracteres chinos en una computadora?

1. Conocimiento de codificación de información de caracteres chinos

⑴Código estándar nacional: se refiere al "Código de caracteres chinos de intercambio de información estándar nacional de la República Popular China" anunciado por nuestro país en 1981, cuyo nombre en código es "GB2312-80". . Consta de dos bytes consecutivos.

2. Código interno: el código que representa los caracteres chinos en la computadora es el código interno chino. El código interno chino evolucionó a partir del código estándar nacional. son respectivamente Agregue "1" para convertirse en el código interno de caracteres chinos

3 Código de entrada: el código de entrada de caracteres chinos se refiere al código de varios métodos de entrada de caracteres chinos ingresados ​​directamente desde el teclado, que pertenece al. código externo.

4. Código de matriz de puntos de fuente: utilice el método de matriz de puntos para construir fuentes de caracteres chinos y luego guárdelas en la computadora para formar una biblioteca de modelos de caracteres chinos. El propósito es poder mostrar e imprimir caracteres chinos.

Ejemplos de conversión de codificación

Código de ubicación de caracteres chinos Código de máquina de código estándar nacional de 16 dígitos

Texto 4636 2E24H 4E44H CEC4H

" Texto "El código de área es 4636. El código de área y el código de bits se expresan en hexadecimal respectivamente como "2E24H", 0010 1110 0010 0100

Convertido al código estándar nacional "4E44H", 0100 1110 0100 0100

El código interno es "CEC4H", 1100 1110 1100 0100

Hora de respuesta: 2006-09-12 11:50:48

El ordenador sólo reconoce 0 y 1 El código compuesto por código ASCII es el código estándar para el procesamiento de información en inglés, y el procesamiento de información en caracteres chinos también debe tener un código estándar unificado. La Oficina Nacional de Normas de mi país promulgó el "Conjunto de caracteres codificados en caracteres chinos para el intercambio de información - Conjunto básico" en mayo de 1981, cuyo nombre en código es GB2312-80, que codifica 6763 caracteres chinos y 682 caracteres gráficos. Sus principios de codificación son: caracteres chinos. están representados por dos bytes, cada byte está representado por un código de siete bits (el bit alto es 0; el estándar nacional organiza los caracteres chinos y los símbolos gráficos en una tabla de códigos bidimensional con 94 filas y 94 columnas cada una); Los bytes están codificados con dos dígitos decimales respectivamente. La codificación del primer byte se llama código de área y la codificación del último byte se llama código de área. Por ejemplo, la palabra "Bao" está en. área 17 en la tabla de códigos bidimensionales de 3 dígitos, el código de área es "1703".

El código estándar nacional no es igual al código de ubicación. Se obtiene convirtiendo ligeramente el código de ubicación. El método de conversión es: primero convierta el código de área decimal y el código de bits en código de área hexadecimal y código de bits. ,;De esta manera, se obtiene un código con una diferencia de posición relativa con respecto al código estándar nacional.;Luego agregue 20H al primer byte y al segundo byte de este código respectivamente, y se obtiene el código estándar nacional. Por ejemplo: el código estándar nacional de la palabra "宝" es 3123H, que se obtiene mediante la siguiente conversión: 1703D->1103H->+20H->3123H.

El código estándar nacional es la codificación estándar para el intercambio de información de caracteres chinos, pero debido a que el bit más alto de los bytes anteriores y siguientes es 0, entra en conflicto con el código ASCII, por ejemplo, para la palabra "宝. "?, el código estándar nacional es 31H y 23H, y el SCII de los caracteres occidentales "1" y "#" también son 31H y 23H. Ahora, si hay dos bytes en la memoria, que son 31H y 23H, ¿es ¿Este carácter chino? ¿O dos caracteres occidentales "1" y "#"? Entonces hay ambigüedad. Obviamente, el código estándar nacional no se puede utilizar directamente en la computadora, por lo que el código interno de caracteres chinos adopta el estándar nacional deformado. El método de transformación es: convertir cada carácter del código estándar nacional. Agregue 128 a cada byte, es decir, el bit más alto de los dos bytes se cambia de 0 a 1 y los 7 bits restantes permanecen sin cambios. De lo anterior sabemos que el código estándar nacional de la palabra "宝" es 3123H, y el byte anterior es 00110001B. El último byte es 00100011B y el bit alto se cambia a 10110001B y 10100011B, que es B1A3H. El código interno de ? es B1A3H;.