Red de conocimiento informático - Aprendizaje de código fuente - Zhaotong Java Training School le dice qué reglas de desarrollo de programación se aplican al desarrollo de servidores.

Zhaotong Java Training School le dice qué reglas de desarrollo de programación se aplican al desarrollo de servidores.

En general, la programación del código de nuestra página web se basa en ciertas reglas, y en la mayoría de los casos utilizamos reglas de edición UTF. A continuación, Zhaotong Computer Training utilizará un análisis de casos para comprender qué reglas de codificación se pueden utilizar en el desarrollo de servidores.

¿Qué reglas de desarrollo de programación se aplican al desarrollo de servidores?

Entonces, ¿qué es la codificación? ¿Qué es UTF-8?

Todos sabemos que las computadoras usan 0 y 1 para almacenar texto. Por ejemplo, el carácter "C" está almacenado como "01000011", entonces la computadora debe seguir dos pasos al mostrar este carácter:

La computadora lee "01000011" y obtiene el número 67, porque 67 está codificado como "01000011" ".

La computadora buscó 67 en el juego de caracteres Unicode y encontró "C".

De manera similar:

Mi computadora asigna "C" a 67 en el juego de caracteres Unicode.

Mi computadora codifica 67 como "01000011" y lo envía al servidor web.

Casi todas las aplicaciones web utilizan el juego de caracteres Unicode porque no hay motivo para utilizar otro juego de caracteres.

El conjunto de caracteres Unicode contiene millones de caracteres. La codificación simple es UTF-32, que utiliza 32 bits por carácter. Esto es fácil porque las computadoras siempre han tratado los 32 bits como números, y lo que hacen bien es procesar números. Pero el problema es que esto es una pérdida de espacio.

UTF-8 puede ahorrar espacio. En UTF-8, el carácter "C" sólo requiere 8 bits, y algunos caracteres poco comunes, como "", requieren 32 bits. Otros caracteres pueden utilizar 16 o 24 bits. Un artículo como este, si se codifica con UTF-8, ocupa sólo aproximadamente una cuarta parte del espacio de UTF-32.

El conjunto de caracteres "utf8" de MySQL es incompatible con otros programas. Lo que llama "utf8" puede ser realmente un desastre.

Una breve historia de MySQL

Por qué. ¿Los desarrolladores de MySQL invalidarán "utf8"? Es posible que podamos encontrar la respuesta en el registro de confirmación.

MySQL ha soportado UTF-8 desde la versión 4.1, que fue en 2003, y el estándar UTF-8 (RFC3629) utilizado hoy en día sólo apareció más tarde.

La versión antigua del estándar UTF-8 (RFC2279) admite hasta 6 bytes por carácter. El 28 de marzo de 2002, los desarrolladores de MySQL utilizaron RFC2279 en una versión preliminar de MySQL 4.1.

En septiembre del mismo año, hicieron un ajuste en el código fuente de MySQL: "UTF8 ahora sólo admite secuencias de 3 bytes como máximo".

¿Quién envió estos códigos? ¿Por qué hizo esto? Se desconoce esta pregunta. Después de migrar a Git (MySQL comenzó a usar BitKeeper), se perdieron muchos nombres de confirmadores en el código base de MySQL. La lista de correo de septiembre de 2003 tampoco contenía pistas que explicaran este cambio.