Codificación Unicode de caracteres chinos
El juego de caracteres Unicode se utiliza en Java. Cada carácter ocupa 2 bytes. El juego de caracteres Unicode puede contener entre 65 y 535 caracteres.
65?535 es un número grande, que incluye letras inglesas, letras rusas, letras griegas, letras japonesas, números arábigos, signos de puntuación y caracteres chinos. , etc., son todos caracteres del conjunto de caracteres Unicode.
Específicamente, el rango Unicode correspondiente a los caracteres chinos es \u4E00~\u9FA5, 9FA5-4E00=30101, es decir, hay 30101 caracteres chinos en Shusen y hay 7000 caracteres chinos de uso común.