¿Cómo convertir entre chino tradicional y chino simplificado?
1. Las palabras con diferentes significados en chino simplificado se fusionan en la misma palabra, como "bonus de cabello, cabello". , "pelo" ", "Pasado mañana, Reina", "Reina", "Reina".
1. En chino simplificado, palabras con diferentes significados se combinan en una sola palabra, como "fa bonus, fa" en "fa bonus, fa" y "fa" en "pasado mañana, reina". " .
2. Las palabras extranjeras tienen diferentes traducciones, especialmente en el campo de la informática. Por ejemplo, "red, servidor, mouse" en chino simplificado es "red, servidor, mouse" en chino tradicional.
Para una conversión más precisa entre chino simplificado y chino tradicional, puede utilizar cconv, un programa de conversión con capacidades de reconocimiento de palabras. cconv está incluido en los repositorios de software oficiales de algunas distribuciones de Linux; de lo contrario, puede descargar el código fuente y obtener un archivo tar, como "cconv-0.6.2.tar.gz". Luego podrás comenzar la compilación e instalación:
$ tar -xzvf cconv-0.6.2.tar.gz
$ cd cconv-0.6.2
$ ./configure --prefix=/usr/local
$ make
$ sudo make install
Prueba:
$ echo " U.S.S. Discovery, sobre el bono de cabello, el cabello debe cortarse pasado mañana, Reina"|cconv -f utf-8 -t utf8-tw
No hay problema, deberías poder escribir: "Space Shuttle Discovery, sobre la bonificación de cabello; el cabello debe cortarse, pasado mañana, Queen"
cconv puede usar el parámetro -f para especificar el nombre de codificación que se convertirá y el parámetro -t para especificar el nombre de codificación. que se generará. También puede utilizar el parámetro -l para ver una lista de nombres de codificación admitidos por el programa.
cconv también puede convertir archivos individuales, por ejemplo:
$ cconv -f utf-8 -t utf8-tw SOURCE.htm -o TARGET.htm
Si hay muchos documentos que deben convertirse, es mejor escribir un script para lograr la conversión por lotes. El siguiente ejemplo es para documentos "htm" y "xml" en el directorio actual. /bin/bash
find .-type f ( -name "*.htm" -o -name "*.txt" )|mientras lee la línea
echo $line
cconv -f utf-8 -t utf8-tw $línea -o ${line}.zh_TW
mv $línea ${line}.{line}.zh_CN p> p>
mv ${line}.zh_TW $line
hecho
buscar .-tipo f -name "*.zh_CN" -exec rm -f {} ;