Red de conocimiento informático - Aprendizaje de código fuente - ¿Qué software puede utilizar el escáner para reconocer automáticamente el texto impreso como texto editable?

¿Qué software puede utilizar el escáner para reconocer automáticamente el texto impreso como texto editable?

El escáner puede completar la edición con la ayuda del Shangshu No. 7. Shangshu No. 7 es un software desarrollado específicamente para el reconocimiento de texto Shangshu No. 7 es un sistema de software que aplica tecnología OCR para satisfacer las necesidades de entrada de libros, periódicos y revistas, notas de ofertas, documentos oficiales, etc., y para implementar el sistema. métodos de gestión. El software Shangshu No. 7 OCR es un sistema de software adecuado para que individuos, pequeñas bibliotecas, pequeños archivos y pequeñas empresas ingresen documentos a gran escala, reproduzcan libros y digitalicen grandes cantidades de materiales.

Caracteres chinos simplificados y tradicionales: Además de los caracteres chinos simplificados, también puedes leer más de 5.400 caracteres tradicionales taiwaneses, caracteres tradicionales de Hong Kong y caracteres chinos GBK.

Identifica tipos de fuentes: puede identificar más de 100 fuentes, como estilo Song, estilo Song de imitación, escritura normal, negra, estela Wei, escritura oficial, estilo redondo y escritura normal, y admite diseños mixtos de múltiples fuentes.

Tamaño de fuente de identificación: tamaño inicial, fuente pequeña tamaño 6.

Reconocimiento de formularios: puede juzgar, dividir, identificar y restaurar automáticamente varios formularios impresos de uso general.

Admite el sistema WINDOWS tradicional

Uso:

1. Abra Shangshu No. 7 y elija abrir la imagen. (La versión que estoy usando puede reconocer formatos como bmp, tif y jpg)

2. Seleccione Iniciar reconocimiento o presione F8. Los resultados del reconocimiento se mostrarán en la parte superior de la ventana y los resultados del análisis de diseño se mostrarán en la parte inferior. La línea roja es la parte identificable y la línea verde es la parte irreconocible.

3. Seleccione Salida: al archivo de formato especificado y guarde los resultados del reconocimiento en el formato requerido.

Operaciones detalladas

1. El software Shangshu No. 7 OCR es un software de MICROTEK Zhongjing Technology Company. Compró la licencia de Hanwang Technology y se la regaló a los usuarios. El software se encuentra en el CD del controlador que viene con el escáner y los usuarios pueden elegir. instalarlo.

2. Después de instalar el software, los usuarios deben hacer clic en "Inicio" en la esquina inferior izquierda del escritorio, buscar el ícono del software "Shang Shu No. 7 OCR" y hacer clic en él. Abra la interfaz de usuario de Shangshu No. 7 OCR.

3. Abra "Seleccionar escáner" en la pestaña "Archivo" de Shangshu No. 7 OCR y seleccione la opción correspondiente al controlador del escáner "MICROTEK SCANWIZARD 5". y seleccione Aceptar.

4. Seleccione "Escanear" en el menú "Archivo" para abrir el controlador del escáner. La siguiente interfaz es el "Panel de control avanzado" del escáner.

5. Los usuarios presten atención a seleccionar el "Tipo de imagen" en la ventana "Configuración" a la izquierda del software SCANWIZARD 5. Seleccione el tipo de "Color RGB" o "Escala de grises" y tenga en cuenta que la resolución del escáner es 300PPI.

6. Después de que el usuario complete la "vista previa" y establezca el rango a escanear, puede hacer clic en el botón "Escanear" y el escáner comenzará a escanear. Pase los archivos escaneados directamente al directorio predeterminado de Shangshu No. 7 OCR (el directorio predeterminado para almacenar archivos de imágenes es el directorio IMAGE en el directorio SHOCR2002 en la unidad C de la computadora del usuario). Una vez completado el escaneo, cierre el controlador del escáner SCANWIZARD 5. El usuario puede ver que el archivo a escanear se entregó a Shangshu No. 7 y el nombre de archivo predeterminado es HW001.JPG.

7. Se solicita a los usuarios que seleccionen "Corrección automática de inclinación" en el menú "Editar" del software Shangshu No. 7 y dejen que el software Shangshu No. 7 gire la imagen escaneada en consecuencia para garantizar que el texto de la imagen esté dispuesto horizontalmente, no inclinado. Porque el texto demasiado inclinado afectará el efecto de reconocimiento del software Shangshu.

9. Una vez completado el análisis del diseño, el usuario puede ver los bloques de texto correspondientes y los cuadros de identificación correspondientes están seleccionados.

10. En este momento, el usuario debe prestar atención a si los atributos del cuadro de identificación correspondiente son correctos. El cuadro de identificación tiene cuatro atributos: "columna horizontal", "columna vertical", "tabla" e "imagen", respectivamente, y están representados por cuatro cuadros de selección de colores diferentes.

11. Después de la verificación, el usuario puede utilizar el botón "Iniciar reconocimiento" en el menú "Reconocimiento".

Obtenga el resultado...

12. En este punto, el texto ha entrado en el estado de revisión del texto...

13. Una vez que el usuario haya terminado de corregir, o no corrija en Shangshu No. 7, el usuario puede seleccionar "Al archivo de formato especificado" en el menú "Salida".

El usuario puede ver que los resultados del reconocimiento incluyen Se pueden seleccionar TXT, RTF, HTML, XLS y otros formatos. El directorio de salida predeterminado es el directorio OUTPUT en el directorio SHOCR2002 en la unidad C de la computadora del usuario. El usuario selecciona el nombre de archivo correspondiente y lo guarda. Para mayor comodidad, los usuarios pueden elegir la opción de "salida a un editor externo", de modo que al guardar, Shangshu No. 7 OCR invocará automáticamente el software de edición correspondiente. Por ejemplo, el guardado de TXT puede llamar automáticamente al software Bloc de notas y el guardado de RTF. llamará automáticamente al software WORD, el guardado XLS llamará automáticamente al software EXCEL.

Se completa una simple operación de OCR.

Instrucciones de reconocimiento

Las imágenes de texto escaneadas con un escáner no se pueden editar ni modificar. En la enseñanza, es necesario utilizar un software de reconocimiento de texto para reconocer las imágenes de texto y convertir las imágenes al formato. formato de texto, existen muchos programas de reconocimiento de texto comunes, las funciones principales son básicamente las mismas, Shangshu No. 7 es uno de los excelentes. El proceso de reconocimiento y conversión de texto e imágenes usando Shangshu No. 7 se puede completar fácilmente usando su menú principal: "Archivo", "Editar", "Reconocimiento" y "Salida".

Pasos de reconocimiento

Paso 1: Obtener el archivo de imagen de texto.

Seleccione el comando "Escanear" o "Abrir imagen" (abre el archivo de imagen escaneado) en el menú "Archivo" para abrir el archivo de imagen. Si hay varios escáneres conectados, puede seleccionar el comando "Seleccionar escáner" en el menú "Archivo" para llamar al escáner.

Paso 2: Ajuste la página de la imagen escaneada

Seleccione "Corrección de inclinación de la página de la imagen" en el submenú "Procesamiento de la página de la imagen" en el menú "Editar" (proporciona un método de implementación manual y automático). ) y "rotar" y otros comandos para ajustar la página de la imagen escaneada.

Paso 3: Análisis de diseño y transformación de reconocimiento de texto

Para el análisis de diseño, seleccione el rango de reconocimiento Antes de realizar el reconocimiento de texto, debe seleccionar el rango de reconocimiento. es "análisis de diseño". La función de análisis de diseño automático de Shangshu No. 7 es muy sólida y también puede mantener una alta precisión al analizar diseños complejos como periódicos y revistas.

Después de la configuración, simplemente haga clic en el botón "Iniciar reconocimiento" para iniciar el reconocimiento de texto.

Paso 4: Revisión y modificación

Una vez completado el reconocimiento automático, aparecerá la "ventana de texto" del resultado del reconocimiento. Esta ventana puede proporcionar la revisión del resultado del reconocimiento. Para facilitar la revisión, Shangshu No. 7 ha agregado El cursor sigue el método de corrección para mostrar la línea de la imagen original (la línea amarilla aparece en la Figura 3).

El método de revisión proporcionado le permite ver la diferencia entre el texto original de la imagen y el texto reconocido de un vistazo. Si encuentra que el reconocimiento es incorrecto, puede realizar correcciones.

Paso 5: Salida

Shang Shu No. 7

Si se confirma después de verificar y modificar, seleccione el menú "Salida" del resultado del reconocimiento. Los formatos de archivo de salida son: RTF, HTML, XLS, 2126, puede elegir el formato correspondiente según sus propias necesidades. Si el usuario desea obtener resultados de reconocimiento similares al texto original, elija el formato RTF. Después de abrir el archivo resultante en formato RTF con WORD, encontrará que casi todos los rastros del texto original, incluidas las imágenes en color de la página original, se han conservado en WORD.