Red de conocimiento informático - Conocimiento informático - Codificación de caracteres Big5

Codificación de caracteres Big5

En Taiwán, Hong Kong y Macao, se utiliza el juego de caracteres del chino tradicional. El GB2312 lanzado en 1980 es para el juego de caracteres chinos simplificados y no admite caracteres chinos tradicionales. En estas áreas donde se utilizan juegos de caracteres chinos tradicionales, alguna vez hubo muchas codificaciones de juegos de caracteres propuestas por diferentes fabricantes. Estas codificaciones eran incompatibles entre sí, lo que causaba dificultades en el intercambio de información. Para unificar la codificación del conjunto de caracteres chinos tradicionales, en 1984, los cinco principales fabricantes de Taiwán, Acer, Shentong, Allison, Zero-One y Volkswagen formularon conjuntamente un esquema de codificación chino tradicional. Debido a su origen, se lo llamó los Cinco Grandes. El código, escrito en inglés como Big5, y luego traducido del inglés a caracteres chinos, generalmente se conoce como los Cinco Grandes.

Big Five es un conjunto de caracteres chinos tradicionales, que incluye 13.053 caracteres chinos tradicionales, 808 signos de puntuación, letras griegas y símbolos especiales. La tabla de codificación del código de los Cinco Grandes está diseñada directamente para el almacenamiento y cada carácter utiliza dos bytes para almacenar y representar. El primer rango de bytes es 81H-FEH, lo que evita conflictos con el código ASCII. El segundo rango de bytes es 40H-7EH y A1H-FEH. Debido a que el rango de codificación de caracteres de Big5 entra en conflicto con el rango de código de almacenamiento de caracteres GB2312, los caracteres de ambos conjuntos de caracteres no se pueden admitir simultáneamente en el mismo texto.

La distribución de los códigos Big5 se muestra en la Tabla 1-5. Las partes principales de los caracteres Big5 se concentran en tres segmentos: signos de puntuación, letras griegas y caracteres chinos de uso común; . El resto está reservado para que lo apoyen otros proveedores.

Tabla 1-5 Tabla de distribución de codificación de caracteres Big5 rango de codificación categoría de símbolo 8140H-A0FEH reservado (utilizado como área de creación de caracteres) A140H-A3BFH signos de puntuación, letras griegas y símbolos especiales A3C0H-A3FEH reservado (no abierto para uso) en el área de creación de caracteres) A440H-C67EH Caracteres chinos de uso común (ordenar primero por trazo, luego por radical) C6A1H-C8FEH Reservado (usado como área de creación de caracteres) C940H-F9D5H Caracteres chinos de uso muy común (ordenar primero por trazo) , luego por radical) F9D6H - FEFEH Reservado (utilizado como área de creación de caracteres) Después del lanzamiento de la codificación Big5, ha recibido un amplio apoyo de los fabricantes de software del chino tradicional y se ha popularizado rápidamente en áreas donde se utilizan los caracteres del chino tradicional. Actualmente, la codificación Big5 se usa comúnmente entre Taiwán, Hong Kong, Macao y otros chinos de ultramar, y se ha convertido en el estándar de facto para la codificación del chino tradicional. Al buscar sitios web de chino tradicional en Internet, la mayoría de las páginas web abiertas son documentos generados por la codificación Big5.