¿Cuáles son los conceptos y diferencias de caracteres, bytes y códigos ASCII?
zìjié
Byte: un byte es una unidad de medida utilizada para transmitir información a través de una red (o almacenarla en un disco duro). o en información de memoria).
El byte es una unidad de medida utilizada por la tecnología de la información informática para medir la capacidad de almacenamiento y la capacidad de transmisión. Un byte equivale a 8 bits binarios.
Una letra inglesa (independientemente de mayúsculas y minúsculas) ocupa un byte de espacio y un carácter chino ocupa dos bytes de espacio.
Símbolos: los signos de puntuación en inglés ocupan un byte y los signos de puntuación en chino ocupan dos bytes.
La secuencia numérica binaria, como unidad digital en las computadoras, es generalmente un número binario de 8 bits. Por ejemplo, un código ASCII es un byte. La conversión de esta unidad:
. 1 gigabit Bytes (TB, KiloGigaByte) = 1024 gigabytes (2 elevado a 40 bytes de potencia)
(1 TB=1024 GB)
(1 TB=1024 GB)
(1 TB=1024 GB) 1024 GB)
1 gigabyte (GB, 1 GB=1024 MB)
(1 GB=1024 MB)
1 megabyte (MB, MegaByte) = 1024 kilobytes (bytes elevados a la potencia de 2 a 20)
(1MB=1024KB)
1 kilobyte Sección (KB, KiloByte) = 1024 bytes ( 2 a 10 potencias de bytes)
1 byte = 8 bits
1.2 Caracteres, bytes y cadenas
p>
La clave para entender la codificación es comprender correctamente los conceptos de caracteres y bytes. Es fácil confundir estos dos conceptos, por eso los distinguiremos aquí:
Ejemplos de descripción de conceptos
Caracteres Símbolos que usa la gente, símbolos en un sentido abstracto. 1", "in", "a", "$", "¥",...
Byte es una unidad de almacenamiento de datos en las computadoras, un número binario de 8 bits, un tipo muy específico. espacio de almacenamiento 0x01, 0x45, 0xFA, ...
ANSI
La cadena está en la memoria, si "carácter" adopta la codificación ANSI y un carácter puede estar representado por uno o. más bytes, lo llamamos cadena. En la memoria, si el "carácter" está codificado en ANSI y el carácter puede representarse mediante un byte o varios bytes, lo llamamos cadena. cadena de bytes "Chino 123"
(ocupa 7 bytes)
UNICODE
Cadena si "carácter". Si el número de secuencia existe en la memoria como UNICODE, el La cadena se llama cadena UNICODE o cadena de bytes ancho L "中文123"
(ocupa 10 bytes)
Dado que diferentes codificaciones ANSI especifican diferentes estándares, para un multibyte determinado cadena, debemos saber qué regla de codificación utiliza para saber qué "caracteres" contiene, independientemente de la cadena UNICODE Independientemente del entorno, el contenido del "carácter" que representa es siempre el mismo
Carácter.
Categoría abierta: Programación
zìfú
Los caracteres son entidades abstractas que se pueden representar utilizando muchos esquemas de caracteres o páginas de códigos diferentes. Por ejemplo, Unicode UTF-16. La codificación representa caracteres como una secuencia de números enteros de 16 bits, mientras que la codificación Unicode UTF-8 representa los mismos caracteres que una secuencia de secciones de palabras de 8 bits.
La biblioteca pública de tiempo de ejecución del lenguaje *** utiliza Unicode UTF-16 (formato de transformación Unicode, un formato de codificación de 16 bits) para representar caracteres.
Las aplicaciones dirigidas al tiempo de ejecución del lenguaje común *** utilizan codificaciones para asignar representaciones de caracteres de esquemas de caracteres locales a otros esquemas. Las aplicaciones utilizan la decodificación para asignar caracteres de esquemas no nativos a esquemas nativos.
codificación ascii
Categoría abierta: tecnología informática, estándares, códigos
ASCII: código (generado) del estándar estadounidense (nacional) de intercambio de información, un uso 7 o 8 bits binarios para asignar (o especificar) un esquema de codificación de hasta 256 caracteres (incluidas letras, números, signos de puntuación, caracteres de control y otros símbolos) con valores numéricos.
ASCII se introdujo en 1968 para estandarizar la transferencia de datos entre diferentes sistemas de hardware y software y se utiliza en la mayoría de las microcomputadoras y en todas las computadoras personales. Los códigos ASCII se dividen en dos conjuntos: código ASCII estándar de 128 caracteres y código ASCII extendido de 128 caracteres adicionales. Comparar EBCDIC