Red de conocimiento informático - Conocimiento informático - ¿Cuáles son los conceptos y diferencias de caracteres, bytes y códigos ASCII?

¿Cuáles son los conceptos y diferencias de caracteres, bytes y códigos ASCII?

Por ejemplo, el código ASCII para el carácter a es 65

zìjié

Byte: un byte es una unidad de medida utilizada para transmitir información a través de una red (o almacenarla en un disco duro). o en información de memoria).

El byte es una unidad de medida utilizada por la tecnología de la información informática para medir la capacidad de almacenamiento y la capacidad de transmisión. Un byte equivale a 8 bits binarios.

Una letra inglesa (independientemente de mayúsculas y minúsculas) ocupa un byte de espacio y un carácter chino ocupa dos bytes de espacio.

Símbolos: los signos de puntuación en inglés ocupan un byte y los signos de puntuación en chino ocupan dos bytes.

La secuencia numérica binaria, como unidad digital en las computadoras, es generalmente un número binario de 8 bits. Por ejemplo, un código ASCII es un byte. La conversión de esta unidad:

. 1 gigabit Bytes (TB, KiloGigaByte) = 1024 gigabytes (2 elevado a 40 bytes de potencia)

(1 TB=1024 GB)

(1 TB=1024 GB)

(1 TB=1024 GB) 1024 GB)

1 gigabyte (GB, 1 GB=1024 MB)

(1 GB=1024 MB)

1 megabyte (MB, MegaByte) = 1024 kilobytes (bytes elevados a la potencia de 2 a 20)

(1MB=1024KB)

1 kilobyte Sección (KB, KiloByte) = 1024 bytes ( 2 a 10 potencias de bytes)

1 byte = 8 bits

1.2 Caracteres, bytes y cadenas

p>

La clave para entender la codificación es comprender correctamente los conceptos de caracteres y bytes. Es fácil confundir estos dos conceptos, por eso los distinguiremos aquí:

Ejemplos de descripción de conceptos

Caracteres Símbolos que usa la gente, símbolos en un sentido abstracto. 1", "in", "a", "$", "¥",...

Byte es una unidad de almacenamiento de datos en las computadoras, un número binario de 8 bits, un tipo muy específico. espacio de almacenamiento 0x01, 0x45, 0xFA, ...

ANSI

La cadena está en la memoria, si "carácter" adopta la codificación ANSI y un carácter puede estar representado por uno o. más bytes, lo llamamos cadena. En la memoria, si el "carácter" está codificado en ANSI y el carácter puede representarse mediante un byte o varios bytes, lo llamamos cadena. cadena de bytes "Chino 123"

(ocupa 7 bytes)

UNICODE

Cadena si "carácter". Si el número de secuencia existe en la memoria como UNICODE, el La cadena se llama cadena UNICODE o cadena de bytes ancho L "中文123"

(ocupa 10 bytes)

Dado que diferentes codificaciones ANSI especifican diferentes estándares, para un multibyte determinado cadena, debemos saber qué regla de codificación utiliza para saber qué "caracteres" contiene, independientemente de la cadena UNICODE Independientemente del entorno, el contenido del "carácter" que representa es siempre el mismo

Carácter.

Categoría abierta: Programación

zìfú

Los caracteres son entidades abstractas que se pueden representar utilizando muchos esquemas de caracteres o páginas de códigos diferentes. Por ejemplo, Unicode UTF-16. La codificación representa caracteres como una secuencia de números enteros de 16 bits, mientras que la codificación Unicode UTF-8 representa los mismos caracteres que una secuencia de secciones de palabras de 8 bits.

La biblioteca pública de tiempo de ejecución del lenguaje *** utiliza Unicode UTF-16 (formato de transformación Unicode, un formato de codificación de 16 bits) para representar caracteres.

Las aplicaciones dirigidas al tiempo de ejecución del lenguaje común *** utilizan codificaciones para asignar representaciones de caracteres de esquemas de caracteres locales a otros esquemas. Las aplicaciones utilizan la decodificación para asignar caracteres de esquemas no nativos a esquemas nativos.

codificación ascii

Categoría abierta: tecnología informática, estándares, códigos

ASCII: código (generado) del estándar estadounidense (nacional) de intercambio de información, un uso 7 o 8 bits binarios para asignar (o especificar) un esquema de codificación de hasta 256 caracteres (incluidas letras, números, signos de puntuación, caracteres de control y otros símbolos) con valores numéricos.

ASCII se introdujo en 1968 para estandarizar la transferencia de datos entre diferentes sistemas de hardware y software y se utiliza en la mayoría de las microcomputadoras y en todas las computadoras personales. Los códigos ASCII se dividen en dos conjuntos: código ASCII estándar de 128 caracteres y código ASCII extendido de 128 caracteres adicionales. Comparar EBCDIC