Hola, leí un artículo sobre caracteres confusos chinos de Java en la Biblioteca Baidu. Tengo una confusión, espero que puedan darme algún consejo.
La codificación del texto durante la entrada es la codificación del sistema.
Si no es UTF-8, aparecerán caracteres confusos después de ingresar
(los caracteres confusos ya aparecerán al leer directamente de una codificación a otra codificación, porque el conjunto de caracteres no puede ser encontrado).
Si el sistema es GB, en realidad no necesitas especificar el formato de codificación, solo necesitas usar la codificación predeterminada del sistema, por lo que no habrá ningún problema.
Sin embargo, si la entrada y la salida están en diferentes formatos de codificación de archivos (diferentes computadoras), entonces deberá especificarlos y normalizarlos.
Si necesita la unificación UTF-8, debe leer la codificación predeterminada y convertirla a UTF-8, luego enviarla como UTF-8 a un sistema UTF-8.
La unificación de entrada y salida solo garantiza que el código binario antes de la entrada y después de la salida sea el mismo.