Red de conocimiento informático - Conocimiento informático - La diferencia entre caracteres y cadenas

La diferencia entre caracteres y cadenas

La diferencia entre caracteres y cadenas:

1. Una cadena es una secuencia de caracteres encerrada por un par de comillas dobles (como "abc");

2. Las constantes de caracteres están entre comillas simples;

3. Las constantes de caracteres son intelectualmente un carácter, mientras que las constantes de cadena contienen uno o más caracteres;

4. variables de caracteres, pero no puede asignar constantes de cadena a variables de caracteres; no existe una variable de cadena correspondiente en lenguaje C, pero puede usar matrices de caracteres para almacenar constantes de cadena: por ejemplo, char [] s = "abcde"

;

5. La pila de constantes de caracteres tiene un byte de espacio de memoria. El número de bytes de memoria de la constante de cadena es igual al número de bytes de la cadena más 1. ¿Agregar uno? ", que es la cadena al final; tenga en cuenta que el carácter 'a' es diferente de la cadena "a" almacenada en la memoria. :

Cadena: se utiliza principalmente para programación, descripción de conceptos y explicación de funciones. Consulte el texto para obtener detalles de uso. Aquí hay una pequeña adición: una cadena es similar a una matriz que almacena caracteres, por lo que cada uno de ellos. se pueden extraer sus elementos individuales, por ejemplo, s="abcdefghij", luego s[1]="a", s[10]="j", y la posición cero de la cadena es exactamente su longitud, como s. [0]=10 (※La función anterior Ansistring no está disponible.

Representación de cadena

Una representación común es utilizar una matriz de codificación de caracteres, cada carácter ocupa un byte (como ASCII código) o dos bytes (como Unicode). Su longitud se puede especificar con un terminador (generalmente NUL, que es 0 en el código ASCII, también utilizado en el lenguaje de programación C), o se puede agregar un valor entero delante de. para indicar su longitud (Este método se usa en el lenguaje Pascal).

La longitud de una cadena es el número de caracteres en la cadena (longitud de la secuencia), que puede ser cualquier número entero no negativo. La cadena vacía "es la única longitud en Σ. Una cadena de 0, representada por ε o λ.

Caracteres: son letras, números, palabras y símbolos utilizados en las computadoras, incluidos 1, 2, 3. , A, B, C y ~ -#! ¥...-*()-- etc. En la codificación ASCII, se necesita 1 byte para almacenar un carácter alfabético

El papel de los caracteres

Las computadoras y los dispositivos de comunicaciones utilizarán una codificación de caracteres para representar caracteres. Esto significa que los caracteres se asignan tradicionalmente a una secuencia de bits enteros para que puedan transmitirse a través de la red y almacenarse fácilmente. Dos ejemplos comunes son ASCII y Unicode. -8, según Google, UTF-8 es actualmente la codificación web más utilizada. A diferencia de la mayoría de las codificaciones de caracteres que asignan caracteres a números o cadenas de bits, el código Morse utiliza una cadena de pulsos electrónicos de longitud variable para representarlos.

Los caracteres son entidades abstractas que se pueden representar utilizando varios esquemas de caracteres o páginas de códigos diferentes. Por ejemplo, la codificación Unicode UTF-16 representa caracteres como una secuencia de enteros de 16 bits y Unicode UTF-8. La codificación representa el mismo carácter que una secuencia de bytes de 8 bits. La biblioteca pública de tiempo de ejecución del lenguaje *** de Microsoft utiliza Unicode UTF-16 (formato de transformación Unicode, una codificación de 16 bits) para representar caracteres.