Método de entrada Microsoft Pinyin 2013
El método de entrada Microsoft Pinyin es el método de entrada de codificación de caracteres chinos de tercera generación de China. El trabajo básico del método de entrada chino comenzó en agosto de 1974. Este proyecto también se llama "Proyecto 748" y es uno de sus. Los principales logros son la "Tabla de frecuencia de caracteres chinos", que primero proporciona datos básicos importantes para el procesamiento de información de caracteres chinos. Después del análisis estadístico de la "Tabla de frecuencia de caracteres chinos" y otras tablas de palabras, la Administración Estatal de Normas promulgó el primer estándar nacional en el campo del procesamiento de información de caracteres chinos, "Conjunto básico de caracteres codificados en caracteres chinos para el intercambio de información" (GB2312- 80). Se trata de un estándar que marca época y que tiene una influencia de gran alcance en la historia del procesamiento de la información de los caracteres chinos.
En 1981, la Universidad de Wuhan y otros publicaron los resultados estadísticos de la frecuencia de raíces dentro del conjunto de caracteres del "Diccionario Xinhua". En 1984, la Comisión Nacional de Reforma del Carácter y la Universidad de Wuhan anunciaron los resultados del análisis estadístico dinámico de los trazos, componentes y estructuras de los caracteres chinos dentro de la colección de caracteres "Cihai".
En 1985, la Comisión Nacional de Reforma del Carácter y la Universidad de Shanxi anunciaron los resultados de un análisis estadístico por muestreo de los apellidos de las personas.
En 1986, el Instituto de Aeronáutica de Beijing y la Agencia de Noticias Xinhua utilizaron tecnología informática para publicar nuevas estadísticas de frecuencia de uso de caracteres chinos y estadísticas de frecuencia de circulación basadas en grandes corpus. Después de 1985, la Universidad Normal de Beijing, la Universidad Jiao Tong de Shanghai, El Instituto de Idiomas de Beijing y otros han utilizado su propia tecnología única de segmentación automática de palabras para publicar estadísticas sobre la frecuencia de uso de palabras chinas modernas basadas en un gran corpus. El Instituto de Lenguaje Informático de la Universidad de Pekín también ha establecido una "Información de gramática china moderna". Diccionario" centrado en la gramática china. El contenido es completo. El corpus chino detallado y fácil de usar y la base de datos de atributos de palabras han desempeñado un papel importante en la promoción del desarrollo de la tecnología de entrada de teclado de codificación de caracteres chinos.
Los estándares nacionales relacionados con los sistemas de entrada de teclado de caracteres chinos publicados después de la década de 1990 incluyen GB13000.1 "Múltiples caracteres codificados de ocho bits (UCS) de tecnología de la información" y GB18030 "Conjunto de caracteres codificados de caracteres chinos para el intercambio de información de tecnología de la información". "Expansión del conjunto básico", GB18031 "Requisitos generales para la entrada de caracteres chinos en teclados numéricos para tecnología de la información", GB15834 "Uso de signos de puntuación" y GB/T18220-2000, que se publicará próximamente, "Requisitos generales para el idioma chino". Entrada de caracteres en teclados generales para tecnología de la información". Las especificaciones promulgadas por el Comité de Idiomas incluyen GF3001 "Especificación de componentes de caracteres chinos de caracteres GB13000.1 para procesamiento de información", GF3002 "Especificación de orden de trazos de caracteres chinos del conjunto de caracteres GB13000.1", GF3003 "Especificación de representación de esquema Pinyin chino de procesamiento de información Teclado universal".
La siguiente es una introducción del método de entrada de primera generación al método de entrada de Microsoft:
El método de entrada de codificación de caracteres chinos de primera generación
El Sexto Instituto de Ministerio de Industria Electrónica En 1983, se anunció oficialmente CC-DOS, el primer sistema operativo de disco chino de mi país, lo que marcó una época en la historia del procesamiento de información chino en mi país. CC-DOS se amplía y modifica sobre la base de PC-DOS. En la versión 2.1 de CC-DOS, ampliamente utilizada, existen métodos de entrada pinyin simplificados, primer y último código, código rápido y código de área, que han cubierto los principales tipos de métodos de entrada, incluido el código fonético, el código gráfico, el código de forma fonética y el código numérico. code. La popularización de las aplicaciones informáticas en nuestro país ha jugado un papel pionero.
Los métodos de entrada más utilizados en ese momento eran Jianpin y el primer y último código. Jianpin es un código fonético puro, que utiliza un método pinyin entre Quanpin y Shuangpin, que comprime finales de tres o más letras. El primer y último código es un código gráfico puro, que contiene 97 partes, divididas en 52 categorías, no hay muchas reglas a seguir en la asignación de partes a las letras del teclado y la capacidad de memoria es grande solo una parte de cada prefijo; y el sufijo se toma al codificar, para piezas deformadas no enumeradas, el ingresador debe adivinar la posición clave a la que pertenecen. Ambos métodos no admiten asociaciones ni frases y ambos tienen muchos códigos duplicados. Por lo tanto, las operaciones de selección y cambio de página son muy frecuentes durante la entrada, y los ojos necesitan escanear constantemente la línea de aviso para encontrar las palabras requeridas entre muchos códigos repetidos. Escribir es agotador y lento, y es imposible realizar la escritura táctil.
El código rápido se logra mediante el método de codificación pinyin comprimido, que puede dispersar códigos repetidos hasta cierto punto.
Dado que el método de codificación de código rápido no tiene reglas a seguir, en realidad no se ha aplicado. El código de ubicación debe ingresarse mediante la memorización de 6763 caracteres y símbolos chinos. Por lo tanto, a excepción de los signos de puntuación que no había otra forma de ingresar en ese momento, básicamente nadie lo usó.
Otro de los primeros métodos de entrada de codificación de caracteres chinos fue el código telegráfico. El código telegráfico es un esquema de código de igual longitud de 4 dígitos, que utiliza palabras de código del 0000 al 9999, que pueden representar 10.000 caracteres (incluidos caracteres, letras y símbolos chinos). Los códigos telegráficos no tienen códigos repetidos, pero la regularidad de la codificación no es fuerte y es muy difícil de recordar. Por lo tanto, está completamente trasplantado a la computadora para las necesidades de quienes ya están familiarizados con los códigos telegráficos en los departamentos de correos y telecomunicaciones, y tiene poco significado para los ingresadores de caracteres chinos comunes.
En 1986, Lenovo Group lanzó un entorno de caracteres chinos de Lenovo cuando lanzó Lenovo Chinese Card. Utilizó por primera vez el método de Lenovo para acelerar la entrada de caracteres chinos. En ese momento no existían métodos de entrada de frases, por lo que la tecnología de Lenovo era refrescante. El proceso de entrada de caracteres chinos cambió de la codificación-gt original; cambio de página-gt; selección-gt; codificación-gt; selección-gt..., por lo que muchos métodos de entrada adoptaron este tipo de tecnología; . Sin embargo, de acuerdo con los estándares de la tecnología de entrada de codificación de caracteres chinos moderna, la tecnología de Lenovo todavía tiene dos debilidades fatales. Una debilidad es que si la siguiente palabra que se ingresará no forma una frase con la palabra ingresada anteriormente, la asociación fallará. Otra debilidad es que la interacción persona-computadora es demasiado frecuente cuando Lenovo selecciona. Aunque la longitud promedio del código se acorta, la velocidad de entrada real en realidad disminuirá.
En resumen, las características del método de entrada de codificación de caracteres chinos de primera generación son: en el entorno DOS, la entrada se realiza en unidades de caracteres individuales, se proporciona una línea de aviso especial en la parte inferior del pantalla para mostrar una gran cantidad de palabras de código repetidas, cambio de página, operaciones de selección frecuentes, use las teclas numéricas para seleccionar palabras recodificadas y use las teclas numéricas ALT para seleccionar repetidamente las palabras recodificadas que aparecen en la línea de solicitud; incluso la entrada de signos de puntuación de uso muy común requiere el uso de códigos de ubicación, lo cual es muy inconveniente. La adopción de la tecnología Lenovo ha mejorado la eficiencia de la entrada, pero su función es bastante limitada para cambiar entre varios métodos de entrada (incluido el cambio al inglés); ) se realiza a través de la tecla de función compuesta ALT Fn (F1-F12); se admiten los modos de ancho completo y medio ancho, pero no admite la puntuación china, no admite la entrada de frases y no admite frases personalizadas.
El método de entrada de codificación de caracteres chinos de segunda generación
En 1986, Stone Company cooperó con Mitsui Property Co., Ltd. de Japón para lanzar la máquina de escribir electrónica china Stone MS-2400, anunciando la Mecanografía electrónica profesional en China La mayoría de edad. Con el uso generalizado de las máquinas de escribir Sitong, el método de entrada Wubi incluido por primera vez con las máquinas de escribir Sitong se extendió. Más tarde, el método de entrada de dos tonos inventado por Liu Weimin y incluido con las máquinas de escribir Sitong también se utilizó ampliamente en ese momento.
La fuente Wubi es la solución de componente de código gráfico puro más típica. En las fuentes Wubi, los componentes generalmente se denominan radicales. La fuente Wubi utiliza 130 raíces de caracteres básicos. Los radicales básicos se dividen en cinco categorías según el trazo inicial, correspondientes a las cinco áreas del teclado universal. Cada categoría se subdivide en cinco grupos, correspondiendo cada grupo a una letra del teclado. En un carácter chino, la relación entre los caracteres raíz se resume en cuatro tipos: "soltero, San, Lian, Jiao". Al dividir los caracteres chinos, seguimos el principio de "dar prioridad a la mayor prioridad, tener en cuenta la intuición, conectar los caracteres pero no conectarlos, y separarlos pero no conectarlos". La fuente Wubi divide los caracteres chinos en tres tipos: caracteres chinos de nombre de clave, caracteres chinos de raíz de carácter formado y caracteres chinos de clave externa, cada uno de los cuales obedece a diferentes reglas de codificación. Además, existen uno, dos y tres niveles de códigos simplificados para la codificación de caracteres, que se forman tomando la primera, dos y tres letras del código completo correspondiente. La fuente Wubi también divide frases en tres tipos: palabras de dos caracteres, palabras de tres caracteres y palabras de varios caracteres. Las palabras de dos caracteres se codifican tomando en orden los dos primeros radicales de cada carácter. Las palabras de tres caracteres se codifican tomando la primera raíz de las dos primeras palabras y los dos primeros radicales de la última palabra en orden. Las palabras de varios caracteres se codifican tomando la primera raíz del primer, segundo, tercer y último carácter en orden.
La fuente Wubi tiene reglas de codificación muy complejas a cambio de una menor tasa de repetición de código en el conjunto de caracteres GB2312-80. Cuando se utilizan códigos cortos obligatorios, la tasa de códigos repetidos se puede reducir aún más. El código de frase se coloca en el espacio de codificación restante de la palabra de código completa, logrando una codificación mixta de palabras.
Siempre que el número de frases incluidas no sea grande, la posibilidad de códigos duplicados es relativamente pequeña. La fuente general de cinco trazos no tiene la función de crear palabras de creación propia. Estas características de la fuente Wubi simplemente satisfacen las necesidades de la mecanografía profesional y se convierten en una de las razones importantes por las que es muy popular en la era de la mecanografía profesional.
Aunque la fuente Wubi ha logrado un gran éxito en el mercado, no se pueden ignorar sus problemas. En primer lugar, la fuente Wubi es muy difícil de aprender y fácil de olvidar. Además de tener reglas de codificación muy complejas, existen muchas excepciones que deben memorizarse. Es muy común que los mecanógrafos de Wubi se queden atascados en algunos caracteres comunes al escribir. En este momento, debe cambiar temporalmente al método de entrada Pinyin. En segundo lugar, la fuente de cinco trazos tiene poca escalabilidad. Cuando el conjunto de caracteres pasa de GB2312-80 a GBK y GB18030, cuando aumenta el número de frases, la fuente Wubi tendrá una gran cantidad de códigos repetidos en la posición del código con una longitud de código de 4, lo que hará que pierda la ventaja de baja tasa de código repetido. La fuente Wubi adopta la estrategia de mostrar automáticamente códigos de 4 dígitos en la pantalla sin repetición. El aumento de códigos duplicados de 4 dígitos obliga al mecanógrafo a apartar más la vista del manuscrito para observar la línea de aviso para confirmar su entrada, y así. reduciendo la velocidad de entrada. Finalmente, la debilidad más fatal de la fuente Wubi es la mala estandarización. Zhang Xiaocun y otros criticaron ferozmente esto: "La fuente de cinco trazos viola las normas del lenguaje y la escritura. Es bastante arbitraria en la división de los caracteres chinos y tiene un impacto negativo que no se puede ignorar en la calidad cultural básica de la También estandariza la educación de los caracteres chinos. El impacto es directamente proporcional a la expansión de su rango de aplicación [20] ”
El método de entrada de doble tono es un código de tono puro relativamente inteligente [23][ 25]. La característica más importante del método de entrada de dos tonos es "definir caracteres mediante palabras y asociación inversa" para aliviar el problema de demasiados códigos repetidos para caracteres individuales en codificación fonética pura. Debido a que hay muchas palabras de dos caracteres, generalmente puede encontrar una determinada palabra de dos caracteres cuyo primer carácter sea la palabra que desea ingresar. Si la palabra de dos caracteres está en la primera posición candidata de la línea de solicitud, la clave de selección se puede omitir; de lo contrario, se requieren claves numéricas para la selección; Si necesita la palabra completa de dos caracteres, puede agregar una barra espaciadora para ingresar la segunda palabra. En otras palabras, si se utiliza Shuangpin, el número promedio de pulsaciones de teclas al ingresar caracteres de uso común se puede reducir a 2,5 mediante el uso de la tecnología de "identificación de caracteres basada en palabras", y básicamente evita la necesidad de escanear las líneas de aviso y voltear el Hay demasiadas palabras en el método tradicional de asociación pinyin Page, problemas de selección. En el método de entrada de dos tonos, para palabras de tres y cuatro caracteres, la consonante inicial de cada palabra se utiliza como código para ingresar y se agrega un espacio al final si es necesario. Para caracteres desconocidos, puede escribir "\\" para llamar a "Simulación de escritura a mano". Aunque puedes personalizar frases, no admite la creación de palabras en línea. Al crear palabras, debe utilizar un editor de texto externo para ingresar el código y las frases correspondientes en el formato que define.
El método de introducción de dos sílabas fue un avance importante en la historia de la introducción de caracteres pinyin y chinos, y fue bien recibido por muchos mecanógrafos no profesionales de la época. Sin embargo, también tiene graves deficiencias, por lo que ya casi nadie lo utiliza. En primer lugar, aunque su eficiencia de entrada ha mejorado mucho en comparación con el Pinyin tradicional, todavía tiene una brecha considerable en comparación con los métodos de entrada de Pinyin a nivel de oración posteriores, como el ABC inteligente. Además, al "definir palabras por palabras", muchas palabras se pueden determinar utilizando varias palabras, mientras que algunas palabras son difíciles de encontrar para determinarlas y los usuarios a menudo se sienten perdidos. Aunque el método de entrada de dos tonos proporciona muchos otros métodos para resolver el problema de la entrada de caracteres individuales. Por ejemplo, existen 6 reglas auxiliares para ingresar caracteres para apellidos como Deng, Guo y Yao. No es fácil recordar estos métodos y juzgar cuándo utilizar cada método. Dado que las palabras sólo se pueden crear sin conexión, personalizar frases también es un inconveniente.
La tercera generación del método de entrada de codificación de caracteres chinos
A finales de la década de 1990, con la mayor reducción de los precios de las computadoras, la mayor mejora de las capacidades de almacenamiento y procesamiento, la popularidad de Los sistemas operativos gráficos de Windows y el internacional Con el auge de Internet, la interfaz de usuario se ha vuelto muy amigable. Las microcomputadoras han ingresado a los hogares de la gente común en China y han ingresado a la educación primaria y secundaria, realizándose verdaderamente la amplia popularidad de las microcomputadoras en China.
La gran popularidad de las microcomputadoras ha hecho que escribir a máquina sea una habilidad básica para todos, al igual que poder escribir caracteres chinos es como necesitar que otros escriban por ti, lo cual en realidad es un signo de analfabetismo; .
Esto crea un gran grupo de usuarios de mecanógrafos no profesionales. Los mecanógrafos como profesión están desapareciendo rápidamente. El método de operación del usuario general al escribir es "querer escribir", que es completamente diferente del método de "mecanografía táctil" de los mecanógrafos profesionales. La "mecanografía táctil" requiere que el operador mire la pantalla lo menos posible. La información de retroalimentación proporcionada por el método de entrada solo es útil ocasionalmente cuando el operador no puede "teclear" cuando "quiere escribir", el operador siempre mira; La pantalla y entra El método de proporcionar retroalimentación y la cantidad de información de retroalimentación tendrán un gran impacto en las actividades de entrada del operador. El sistema operativo gráfico de Windows proporciona requisitos previos para enriquecer la interfaz hombre-máquina y puede satisfacer las necesidades de información de retroalimentación diversificada.
Las poderosas capacidades de almacenamiento y procesamiento de las microcomputadoras modernas proporcionan una base material para el nacimiento de nuevos métodos de entrada con uso intensivo de almacenamiento y procesamiento. Los programas de método de entrada ya no se limitan a la memoria residente de 64 KB de la era DOS. Las velocidades informáticas de nivel Gigabit permiten poner en funcionamiento complejos algoritmos inteligentes. No solo se ha ampliado la capacidad del disco duro de megabytes a gigabytes, sino que la velocidad de acceso al disco duro también ha mejorado considerablemente en comparación con la era DOS. Almacenar enormes bibliotecas de palabras en su disco duro y realizar búsquedas rápidas ya no es un problema.
Después de que la educación informática se lleva a cabo cada vez más en las escuelas primarias y secundarias, los estudiantes comienzan a aprender a mecanografiar desde una edad temprana. Se planteó agudamente la cuestión de la relación entre la codificación de caracteres chinos y la enseñanza de idiomas. El requisito mínimo es que la codificación de caracteres chinos no pueda entrar en conflicto con el conocimiento del idioma. La situación ideal es combinar la introducción de la codificación de caracteres chinos con el aprendizaje del idioma y el conocimiento de los caracteres para promoverse mutuamente.
Bajo los antecedentes anteriores, surgió el método de entrada de codificación de caracteres chinos de tercera generación. Su ideología rectora es: estandarización, fácil de aprender, fácil de usar y tratar de mantener la velocidad de entrada. Durante este período, la investigación sobre métodos inteligentes de entrada de pinyin alcanzó su clímax, y también aparecieron códigos de glifos puros con trazos o pares de trazos como unidades de entrada, y también aparecieron códigos de formas fonéticas basados en consonantes y trazos iniciales (o pares de trazos). 29 ]-[48].
(1) Método de entrada inteligente de Pinyin
El método de entrada inteligente de Pinyin se puede dividir en cuatro tipos según sus principios de implementación: basado en comprensión, basado en estadísticas pragmáticas y coincidencia de plantillas. basado y basado en el contexto.
Smart ABC es actualmente el método de entrada Pinyin a nivel de casi oración más utilizado en los sistemas operativos Windows, porque convierte palabras y frases en unidades en lugar de oraciones completas. La característica más importante de Smart ABC es que es muy conveniente personalizar frases y ajustar el orden de las palabras repetidas. Los usuarios solo necesitan ingresar según sus propias ideas. No necesitan realizar una segmentación manual de palabras al ingresar. El sistema segmentará automáticamente las palabras una por una de adelante hacia atrás. Cuando no hay una frase, el sistema muestra automáticamente las palabras codificadas repetidas como caracteres únicos para que el usuario elija y una vez que el usuario selecciona y forma una nueva palabra, el sistema puede recordarla. Cuando la segmentación de palabras del sistema es incorrecta o las palabras proporcionadas por el sistema no son las que el usuario necesita, el usuario también puede modificarlas y el sistema también puede recordar las modificaciones realizadas por el usuario. Después de un largo período de uso, si el usuario no cambia, el sistema se adaptará gradualmente a los hábitos de uso del usuario, haciendo que el proceso de entrada del usuario sea más cómodo.
Smart ABC también tiene muchas áreas dignos de mejora. En primer lugar, al escribir, puede utilizar libremente Quan Pin, Pin simplificado o Pin mixto, y el usuario puede convertir sonidos en palabras en cualquier momento. Hay demasiadas formas para que los usuarios sepan cuál es la mejor. Parece muy flexible, pero en realidad deja la tarea de optimizar la entrada al usuario. Sin embargo, la mayoría de los usuarios no son expertos en esta área y no pueden completar bien esta tarea, lo que hace que los usuarios tomen muchos desvíos o formen hábitos de entrada malos e ineficientes. En segundo lugar, la precisión de la conversión de fonética a caracteres no es alta y las modificaciones dentro de la oración son frecuentes, lo que resulta en una velocidad de entrada insatisfactoria. Incluso el uso de Shuangpin no es tan eficiente como la codificación natural.
Microsoft Pinyin es un método de entrada verdaderamente inteligente para la conversión de fonética a carácter a nivel de oración. Es la culminación de años de resultados de investigación científica en la tecnología de procesamiento del lenguaje natural de Microsoft. Microsoft Pinyin utiliza Pinyin como método de entrada de caracteres chinos. Los usuarios pueden utilizar y dominar fácilmente esta tecnología de entrada de caracteres chinos sin necesidad de aprendizaje ni formación especiales.
Microsoft Pinyin adopta un método de conversión de oraciones completas basado en oraciones. Los usuarios ingresan continuamente el pinyin de toda la oración sin tener que segmentar manualmente las palabras y seleccionar palabras candidatas. Esto no solo garantiza la fluidez del pensamiento del usuario, sino que también mejora enormemente la entrada. eficiencia. La interfaz hombre-máquina proporcionada por Microsoft Pinyin es muy distintiva. La ventana de agrupación de palabras se puede incrustar en el cursor de inserción del texto que se ingresa, lo que reduce la frecuencia de movimiento de los ojos del usuario durante la entrada y mejora en gran medida la facilidad de uso del método de entrada. Convierta clave por clave y solicite el resultado de la conversión, para que los usuarios no tengan que tomar su propia decisión sobre cuándo realizar la conversión. No hay límite para la longitud del código que el usuario puede ingresar. Cuando se excede el límite de longitud del sistema o se encuentra un período, el sistema convertirá automáticamente el código para que el usuario pueda continuar ingresando sin interrupción. Debido al contexto más amplio considerado, Microsoft Pinyin puede lograr una alta precisión de conversión. Microsoft Pinyin rechaza a los usuarios ingresar pinyin simplificado y pinyin mixto de forma predeterminada, lo que puede guiar a los usuarios a desarrollar buenos hábitos de entrada.
Microsoft Pinyin también tiene algunos problemas. En primer lugar, resulta engorroso e ineficiente realizar la edición dentro de las oraciones cuando se producen errores de codificación de entrada o conversiones incorrectas. En segundo lugar, al convertir clave por clave, el contenido convertido correctamente a menudo se modifica incorrectamente. El usuario tiene que controlar la exactitud del contenido ingresado en cualquier momento, lo cual es muy problemático cuando hay mucho contenido convertido. Además, Microsoft Pinyin no proporciona un método para acelerar la entrada de caracteres individuales, ni proporciona un método para ingresar caracteres desconocidos. Es un método de entrada incompleto.
Método de entrada basado en trazos (o pares de trazos) y/o consonantes iniciales
Utilizando trazos y consonantes iniciales, los dos caracteres chinos más simples, presentan información para codificar, lo que puede mejorar enormemente input La facilidad de aprendizaje del derecho[12]. Sin embargo, los trazos de los caracteres chinos generalmente se clasifican en cinco tipos. Muy pocos tipos de trazos aumentarán inevitablemente la longitud de la codificación, lo que afectará la velocidad de entrada. Por lo tanto, cómo acortar la longitud del código y mejorar la eficiencia de la entrada se ha convertido en una cuestión clave para el éxito de este tipo de método de entrada.
El Código Shuangbi desarrollado por Fujian Shuangbi Code Software Development Co., Ltd. es un código de glifos puro basado en trazos. Para superar el problema de muy pocos tipos de trazos, Double Stroke Code introduce un nuevo tipo de trazo "cruz", ampliando así los tipos de trazos a seis tipos. Al buscar el código, se toman dos trazos para formar un par de trazos. *** Puede formar 36 pares de bolígrafos diferentes y seleccionar la entrada de teclas en el área de teclas correspondiente del teclado. Además, el código de doble trazo también estipula que los caracteres junto a la palabra "enfermedad", "口", el identificador y "日" deben codificarse en su conjunto. Según las formas combinadas de diferentes estructuras de los caracteres chinos, el código de doble trazo divide los caracteres chinos en tres tipos básicos: tipo izquierda-derecha, tipo arriba-abajo y tipo completo. No importa qué tipo de caracteres chinos sean, están codificados según cuatro códigos. El método de entrada de frases de código de doble trazo es: para palabras de dos caracteres, ingrese los dos primeros dígitos de cada carácter, para palabras de tres caracteres, ingrese el primer dígito de los dos primeros caracteres y los dos primeros dígitos del último; carácter; para palabras de cuatro caracteres o más, ingrese uno o más dígitos Dos, tres, el primer dígito de la última palabra.
Las ventajas del código de doble trazo son: en comparación con el método tradicional de entrada de componentes, la cantidad de memoria se reduce mucho; la longitud promedio del código también es bastante corta después de usar un par de lápices y codificación de 36 teclas; Si no presiona el par de lápices y presiona la entrada de un solo trazo, puede trasplantar fácilmente códigos de doble trazo al teclado numérico. Sin embargo, las deficiencias del código de doble trazo también son muy obvias: como método de entrada basado en trazos, sus reglas de adquisición y codificación de código son complicadas, hay muchas excepciones y todavía es muy difícil de aprender a usar la parte superior; fila de teclas numéricas para codificación, lo cual es incómodo de presionar y entra en conflicto con la entrada de números de uso común, lo que afecta la velocidad de entrada real.
El método de entrada de dos tiempos inventado por el Sr. Chen Jinsong es uno de los métodos de entrada más utilizados actualmente. Es un método de entrada basado en consonantes y trazos iniciales, y también se puede introducir basándose únicamente en trazos. Los 30 caracteres codificados del método de entrada de dos trazos se distribuyen en seis áreas del teclado universal, a saber, cinco áreas de dos trazos y una área de un solo trazo. Luego, el área se coloca según el segundo trazo del trazo doble o según el trazo único, en el orden de horizontal, vertical, desplazado, punteado y plegado. Pero es necesario memorizar las 10 claves para establecer radicales. El método de entrada de dos trazos divide los caracteres chinos en caracteres individuales y caracteres combinados según la estructura del glifo. Al ingresar caracteres chinos, el primer dígito es la primera letra del pinyin chino y los trazos se toman a partir del segundo dígito, hasta cuatro dígitos, si hay menos de cuatro dígitos, se toman todos si no se pueden tomar trazos dobles. , se toman trazos únicos. No es necesario dividir los caracteres individuales; el primer código es la primera letra de Pinyin y el segundo código es el código de los trazos en el orden de los trazos, con un máximo de cuatro códigos.
El carácter combinado se divide en dos mitades. De acuerdo con las reglas del orden de los trazos de los caracteres chinos, la parte escrita primero es la primera mitad y la parte escrita después es la segunda mitad. El primer código toma la primera letra de Pinyin y la segunda; El código toma los primeros y segundos trazos de la primera mitad, y el segundo código toma la primera letra de la primera mitad. El tercer código toma los primeros y segundos trazos de la segunda mitad, y el cuarto código toma los terceros y cuartos trazos de. la segunda mitad. Las reglas de codificación para frases del método de entrada de dos trazos son: para palabras de dos caracteres, tome los dos primeros códigos de cada carácter, para palabras de tres caracteres, tome los dos primeros códigos del primer carácter y el primer código de los dos últimos; caracteres; para palabras con cuatro o más caracteres, tome los dos primeros códigos de cada carácter. Tome los primeros tres caracteres y el primer código del último carácter.
Las ventajas del método de entrada de dos trazos son: las reglas de codificación son más simples que el código de doble trazo y solo se utilizan 30 caracteres de codificación mediante el uso de dos tipos de codificación de información característica de caracteres chinos, inicial; consonantes y trazos, para distinguir palabras con el mismo código. Se ha mejorado la capacidad de palabras y se ha logrado una mayor eficiencia de entrada. También se pueden ingresar caracteres desconocidos en modo de formato completo si la entrada se realiza con trazos únicos en lugar de pares de bolígrafos; También se puede trasplantar fácilmente al teclado numérico. Sin embargo, todavía existen problemas con el método de entrada de dos trazos: debido al uso de pares de plumas y radicales establecidos, y la necesidad de distinguir entre caracteres individuales y caracteres combinados para diferentes codificaciones, todavía es difícil de aprender y usar.
Método de entrada de codificación de teclado numérico
Hasta la fecha, el número de propietarios de teléfonos móviles en todo el país ha superado los 300 millones y el valor de salida de mensajes cortos de teléfonos móviles ha superado los 5 mil millones de yuanes. El número de propietarios de teléfonos móviles ha superado al de usuarios de PC, y el número de personas que utilizan teléfonos móviles para introducir caracteres chinos supera con creces el número de personas que utilizan grandes teclados de uso general para introducir caracteres chinos.
Actualmente, los métodos de entrada de trazos T9 pinyin y T9 de la empresa estadounidense Tejet, el método de entrada de trazos Zi Neng de la empresa canadiense Ziyuan y el método de entrada iTap de la empresa Motorola han monopolizado el mercado de métodos de entrada de teléfonos móviles en el continente. China, Hong Kong y Taiwán. Sin embargo, los métodos de entrada del teclado numérico de teléfonos móviles extranjeros son muy insatisfactorios. Tomando como ejemplo la entrada de trazos, iTap usa 9 trazos, las palabras pueden usar 8 trazos y T9 usa 5 trazos. Para el mismo golpe, se pueden colocar diferentes teléfonos móviles en diferentes posiciones y la velocidad de entrada no es la ideal.
Para romper la vergonzosa situación de los métodos de entrada de teléfonos móviles extranjeros que monopolizan el mercado chino de teléfonos móviles y los métodos de entrada de teléfonos móviles no estándar. Patrocinado por la Sociedad de Información China de China y organizado por Golden Code Publishing House (Hong Kong) Co., Ltd. y otras unidades, el primer concurso de entrada de chino móvil de tres días de duración y código numérico de caracteres chinos se celebró en el Gran Salón de la Personas el 21 de noviembre de 2004. Ingrese al Foro de la Cumbre de Aplicaciones Tecnológicas. Entre los 32 equipos participantes, 23 participaron en la competencia de ingreso de código digital de caracteres chinos de teléfonos móviles simulados y 9 equipos participaron en la competencia de ingreso de códigos chinos de teléfonos móviles. Además de los esquemas de codificación digital que han participado en la competencia, los más llamativos incluyen los dígitos Wubi del Sr. Wang Yongmin [49], los dígitos izquierdo y derecho del Sr. Zheng Yansong [50], etc. Lo siguiente solo presenta el pinyin T9 más utilizado, los trazos T9 y el código dorado y el código de dígitos popular que ganó el campeonato en la primera competencia de entrada móvil china.
T9 Pinyin esencialmente utiliza una de las primeras tecnologías de entrada de teclado universal que combina pinyin de un solo carácter con asociación. Su innovación más importante es que puede determinar si las sílabas mandarín legales se pueden combinar basándose en la combinación de teclas del teclado del teléfono móvil, evitando así las desventajas tradicionales de ingresar una letra pinyin presionando varias teclas. Sin embargo, cuando la combinación de teclas es adecuada para varias sílabas mandarín legales y la sílaba mandarín seleccionada por defecto no es la que el usuario necesita, el usuario aún tiene que realizar una selección manual. Además, la ortografía larga de Quanpin, la necesidad de presionar la tecla 1 para ingresar al estado de selección y la excesiva interacción persona-computadora causada por Lenovo hacen que la eficiencia de entrada de T9 Pinyin sea muy baja, y Quanpin es muy difícil para las personas. que no son buenos en mandarín.
T9 Stroke adopta el método de clasificación de trazos actual de la mayoría de los métodos de entrada y clasifica los trazos de caracteres chinos en cinco categorías: horizontal, vertical, izquierda, punto y pliegue, que están representados por 1, 2, 3, 4. y 5 respectivamente. Al grabar caracteres chinos, ingrese según el orden de los trazos, indicaciones tecla por tecla, varios por pantalla, prioridad de alta frecuencia, se pueden ingresar hasta 12 trazos y se admite la asociación. Dado que se utilizan cinco teclas para representar cinco trazos, no es necesario realizar juicios inteligentes sobre combinaciones como T9 Pinyin, y la lógica de procesamiento interno es muy simple. T9 Stroke aprovecha al máximo la rica información de trazo y los bits de código corto de códigos de longitud desigual, y puede seleccionar directamente palabras de código repetidas, por lo que su eficiencia de entrada real es mayor que la de T9 Pinyin.
Código Digital Público [51] utiliza 10 dígitos para codificar palabras.
Además de usar 1, 2, 3, 4 y 5 para representar los cinco trazos de horizontal, vertical, oblicuo, punto y pliegue respectivamente, 6, 7, 8, 9 y 0 también se usan para representar los cinco trazos. de componentes de clase de intersección, inserción, ocho, pequeño y boca. El primero, segundo, tercero, cuarto y últimos cinco códigos de un solo carácter se toman según el orden de los trazos. Si no hay suficientes códigos, se utiliza la longitud real del código de la frase. Popular Digit Code utiliza bastantes combinaciones de trazos como componentes, pero debido a su clara clasificación, es más fácil de recordar que muchos métodos de entrada similares. Además, las cuidadosas reglas de codificación reducen la tasa de repetición, lo que lo destaca de la competencia. Sin embargo, cabe señalar que utiliza bastantes componentes, las reglas de codificación no son simples y la dificultad de aprendizaje sigue siendo bastante alta.
El código dorado utiliza 9 números para codificar palabras. Además de usar 1, 2, 3, 4 y 5 para representar los cinco trazos de horizontal, vertical, izquierda, punto y pliegue respectivamente, 6, 7, 8 y 9 también se usan para representar "boca", " diez", "ocho", "亠" cuatro tipos de componentes. Al codificar, se distingue el principio y el final de los caracteres, y también se distingue la diferencia entre caracteres individuales y caracteres combinados. Cuando la línea del mensaje no está vacía, 0, * y # se utilizan como teclas de selección. La característica más importante del código dorado es que al ingresar, si los números utilizados para codificar y el código ingresado juntos no pueden formar otro código de palabra, la tecla numérica se puede usar para seleccionar palabras con el mismo código, lo que aumenta considerablemente la cantidad de palabras. La capacidad de selección de claves del método de entrada acorta la longitud promedio dinámica del código; combinado con el uso de códigos de previsión de alta frecuencia de longitud desigual, básicamente no hay necesidad de pasar páginas al ingresar, lo que mejora aún más la eficiencia de la entrada. Sin embargo, no existe un estándar para distinguir entre el principio y el final de una palabra y, a menudo, varía de persona a persona. El uso dinámico de las claves de codificación restantes para seleccionar palabras recodificadas también hace que la posición de la clave de selección cambie también; mucho, aumentando la carga de la interacción persona-computadora.