Red de conocimiento informático - Conocimiento sistemático - Codificación Unicode de caracteres chinos

Codificación Unicode de caracteres chinos

El juego de caracteres Unicode se utiliza en Java. Cada carácter ocupa 2 bytes. El juego de caracteres Unicode puede contener entre 65 y 535 caracteres.

65?535 es un número grande, que incluye letras inglesas, letras rusas, letras griegas, letras japonesas, números arábigos, signos de puntuación y caracteres chinos. , etc., son todos caracteres del conjunto de caracteres Unicode.

Específicamente, el rango Unicode correspondiente a los caracteres chinos es \u4E00~\u9FA5, 9FA5-4E00=30101, es decir, hay 30101 caracteres chinos en Shusen y hay 7000 caracteres chinos de uso común.