Red de conocimiento informático - Conocimiento del nombre de dominio - ¿Cómo convertir entre chino tradicional y chino simplificado?

¿Cómo convertir entre chino tradicional y chino simplificado?

Al escribir documentos, a veces es necesario convertir entre chino simplificado (zh-CN) y chino tradicional (zh-TW, zh-HK). iconv solo puede realizar la conversión de codificación, pero no puede convertir palabras en chino simplificado y tradicional, por ejemplo:

1. Las palabras con diferentes significados en chino simplificado se fusionan en la misma palabra, como "bonus de cabello, cabello". , "pelo" ", "Pasado mañana, Reina", "Reina", "Reina".

1. En chino simplificado, palabras con diferentes significados se combinan en una sola palabra, como "fa bonus, fa" en "fa bonus, fa" y "fa" en "pasado mañana, reina". " .

2. Las palabras extranjeras tienen diferentes traducciones, especialmente en el campo de la informática. Por ejemplo, "red, servidor, mouse" en chino simplificado es "red, servidor, mouse" en chino tradicional.

Para una conversión más precisa entre chino simplificado y chino tradicional, puede utilizar cconv, un programa de conversión con capacidades de reconocimiento de palabras. cconv está incluido en los repositorios de software oficiales de algunas distribuciones de Linux; de lo contrario, puede descargar el código fuente y obtener un archivo tar, como "cconv-0.6.2.tar.gz". Luego podrás comenzar la compilación e instalación:

$ tar -xzvf cconv-0.6.2.tar.gz

$ cd cconv-0.6.2

$ ./configure --prefix=/usr/local

$ make

$ sudo make install

Prueba:

$ echo " U.S.S. Discovery, sobre el bono de cabello, el cabello debe cortarse pasado mañana, Reina"|cconv -f utf-8 -t utf8-tw

No hay problema, deberías poder escribir: "Space Shuttle Discovery, sobre la bonificación de cabello; el cabello debe cortarse, pasado mañana, Queen"

cconv puede usar el parámetro -f para especificar el nombre de codificación que se convertirá y el parámetro -t para especificar el nombre de codificación. que se generará. También puede utilizar el parámetro -l para ver una lista de nombres de codificación admitidos por el programa.

cconv también puede convertir archivos individuales, por ejemplo:

$ cconv -f utf-8 -t utf8-tw SOURCE.htm -o TARGET.htm

Si hay muchos documentos que deben convertirse, es mejor escribir un script para lograr la conversión por lotes. El siguiente ejemplo es para documentos "htm" y "xml" en el directorio actual. /bin/bash

find .-type f ( -name "*.htm" -o -name "*.txt" )|mientras lee la línea

echo $line

cconv -f utf-8 -t utf8-tw $línea -o ${line}.zh_TW

mv $línea ${line}.{line}.zh_CN p>

mv ${line}.zh_TW $line

hecho

buscar .-tipo f -name "*.zh_CN" -exec rm -f {} ;