Cómo calcular la longitud de una cuerda
La longitud de la cadena se calcula recorriendo la matriz.
Introducción al método:
En lenguaje C, una cadena es una matriz de caracteres que termina en '\0' (un carácter especial que indica el final de una cadena). Por lo tanto, la longitud de la cadena se puede calcular recorriendo la matriz.
Introducción a las cadenas:
Se utiliza principalmente para programación. Consulte el texto para obtener descripciones de conceptos, explicaciones de funciones y detalles de uso. Aquí hay un punto adicional: las cadenas son similares a las matrices de caracteres. almacenamiento, por lo que se puede extraer un solo elemento de cada bit, como s="abcdefghij", luego s[1]="b", s[9]="j", lo que puede brindarnos mucha comodidad. , como operaciones de alta precisión. Cada bit se puede convertir en un número y almacenar en una matriz.
Teoría formal:
Sea Σ un conjunto finito no vacío llamado alfabeto. Los elementos de Σ se denominan "símbolos" o "caracteres". Una cadena (o palabra) en Σ es cualquier secuencia finita de Σ. Por ejemplo, si Σ={0,1}, entonces 0101 es la cadena encima de Σ. La longitud de una cadena es el número de caracteres de la cadena (la longitud de la secuencia), que puede ser cualquier número entero no negativo.
Concatenación de subcadenas:
La concatenación es una operación binaria importante en Σ*. Para dos cadenas s y t en Σ*, su concatenación se define como la secuencia de caracteres en s seguida por la secuencia de caracteres en t, y se denota st.
Codificación de caracteres y representación de cadenas:
1. Codificación de caracteres
Históricamente, el tipo de datos de cadena asigna un byte para cada carácter, aunque el conjunto de caracteres preciso. varía de una región a otra, los programadores cuyas codificaciones de caracteres son lo suficientemente similares pueden ignorarlo: los conjuntos de caracteres del mismo sistema utilizados en diferentes regiones tienen un carácter en la misma posición o no lo tienen en absoluto. Estos conjuntos de caracteres suelen estar basados en ASCII o EBCDIC.
La representación razonable de texto fonético en idiomas como chino, japonés y coreano (llamados colectivamente CJK) requiere más de 256 caracteres (el límite de codificación de un byte por carácter). Las soluciones convencionales implican mantener una representación de un solo byte de ASCII y utilizar bytes dobles para representar glifos CJK.
2. Representación
Una representación común es utilizar una matriz de códigos de caracteres, cada carácter ocupa un byte (como en el código ASCII) o una sección de dos palabras (como en Unicode). Su longitud puede utilizar un terminador. O agregue un valor entero delante para indicar su longitud (este método se usa en lenguaje Pascal).