Red de conocimiento informático - Conocimiento del nombre de dominio - Cómo escanear libros antiguos para convertirlos en texto

Cómo escanear libros antiguos para convertirlos en texto

1. Cómo utilizar un escáner para convertir texto de libros en archivos WORD

Método 1. El método más sencillo es elegir una máquina con un clic en Aceptar y seleccionar directamente la máquina. Con esto, la máquina con función de tecla de acceso directo puede convertir al formato Word o Excel con un solo clic.

Otro método es elegir la versión TextKing del software de Hanwang. Después de escanearlo directamente, elija insertar el ícono WORD para convertir. El escáner de BenQ está disponible en las máquinas de gama más baja. Método 2: Primero instale el escáner, luego inicie "Microsoft Office/Herramientas de Microsoft Office/Escaneo de documentos de Microsoft Office" para comenzar a escanear.

Consejo: Este componente no está incluido en la instalación predeterminada de Office 2003. Si utiliza esta función por primera vez, es posible que se le solicite que inserte el CD de Office 2003 para realizar la instalación. Dado que se trata de escaneo de texto, generalmente seleccionamos el "modo blanco y negro", hacemos clic en Escanear y comenzamos a llamar al controlador del escáner para escanear.

Esto también debe configurarse en "Modo Blanco y Negro", y la resolución recomendada es 300 ppp. Una vez completado el escaneo, la imagen se transferirá automáticamente a otro componente de Office 2003, "Microsoft Office Document Imaging".

Haga clic en el botón "Usar OCR para reconocer texto" en la barra de herramientas para comenzar a reconocer el documento que acaba de escanear. Presione el botón "Enviar texto a Word" para convertir el texto reconocido a Word.

Si desea obtener parte del texto, simplemente use el mouse para seleccionar el texto requerido, luego haga clic derecho y seleccione "Enviar texto a Word" para enviar el texto en el área seleccionada a Palabra. Se recomienda optar por instalar completamente sus programas complementarios al instalar Office y luego en el sistema XP.

Después de conectar el escáner, haga doble clic en él y aparecerá un mensaje de Escaneo de documentos de Microsoft Office. Selecciónelo para escanear. Una vez completado el escaneo, hay un botón con un ícono de palabra en la parte superior.

Descubrirás que el texto que escaneaste ya existe en Word... pero está guardado como un documento .doc en formato web. Simplemente haga una conversión simple. Este efecto de reconocimiento de OCR de Microsoft es bastante bueno y, para un libro como un libro, puede escanear las páginas izquierda y derecha al mismo tiempo y puede organizar automáticamente las dos páginas en orden de número de página.

Lo anterior se ejecuta en Windows XP Office 2003. Método 3: escanee con un escáner, identifíquelo con el software OCR, envíelo como texto y péguelo en WORD. El software OCR recomienda Shangshu OCR y Hanwang OCR.

Utilice el escáner para convertir el documento a la versión en chino simplificado de Adobe Acrobat Reader, luego utilice una instantánea y péguela. El texto sigue siendo texto, la imagen es una imagen fija. También puede convertirlo directamente para escanearlo. con un escáner y utilice el software OCR. Reconózcalo, envíelo como texto y péguelo en WORD. Por ejemplo: tome el software de reconocimiento Shangshu OCR de Zhongjing Scanner como ejemplo. Al colocar un libro en la superficie plana del escáner, es mejor colocar el texto en la esquina del libro lo más cerca posible de la superficie plana. ¡Esto asegura que el texto no se distorsionará al escanear, asegurando la precisión del reconocimiento! Después de escanear el área de texto en el software Shangshu OCR, primero confirme que la configuración del sistema en el menú "Archivo" en la esquina superior izquierda sea para reconocer chino simplificado o inglés puro (Nota: ¡la tasa de reconocimiento de chino tradicional se reducirá!).

Luego realice la corrección de inclinación (en el menú "Editar"). Si el área de texto está claramente inclinada, es posible que se reconozca como código confuso o información incorrecta. Una vez completada la corrección, se analiza el diseño, hay un icono en la barra de herramientas y luego se reconoce. Finalmente, haga clic en el menú "Salida" para generar el formato especificado, seleccione el formato "RTF" y guárdelo como un documento de Word. Método 4: Instale el software OCR Antes de utilizar el software OCR para el reconocimiento, puede utilizar un software de procesamiento de imágenes (como Photoshop) para procesarlo, convertirlo al modo blanco y negro y aumentar el contraste de forma adecuada, lo que puede mejorar en gran medida la tasa de reconocimiento. . Tutorial gráfico de extracción de texto de imagen (OCR) o Microsoft Office Document Imaging (incluido en office2003) Hay una imagen de documento componente en OFFICE, que tiene la misma función poderosa.

No sólo se pueden extraer las imágenes de texto escaneadas, sino también las palabras de los avisos promocionales en la pared tomadas con la cámara digital. El primer paso es abrir una imagen o un libro electrónico con texto, buscar la página que desea extraer, presionar la "tecla ALT Imprimir pantalla (PrintScreen)" en el teclado para capturar la pantalla o utilizar otro software de captura.

Guardar en formato tif. En el segundo paso, debemos instalar el componente de "Microsoft Office Document Imaging", hacer clic en "Inicio → Programas → Microsoft Office → Microsoft Office Tools", hacer clic en "Microsoft Office Document Imaging" en "Microsoft Office Tools" y luego abrir el imagen y busque la herramienta de reconocimiento OCR (como ojos), haga clic en esta herramienta para iniciar la instalación. En este momento, debe colocar el archivo de instalación de Office en el CD (o unidad de CD-ROM virtual).

Paso 3: Abra la imagen con Microsoft Office Document Imaging, use la herramienta OCR (círculo rojo en la imagen) para seleccionar el texto que desea extraer, luego haga clic derecho y seleccione -Copiar a Word o bloc. O use la cámara como escáner para ingresar texto: la cámara que usamos habitualmente parece usarse solo para chatear. De hecho, muchos amigos siempre usan algunos libros cuando escriben artículos e información. vaya a una agencia de impresión para escanear e imprimir. De hecho, nuestra cámara puede resolver este problema. 1. Instale Microsoft Office 2003 (solo se utiliza Office 2003 como ejemplo.

Se aceptan otras versiones de Office). 2. Abra "Inicio → Microsoft Office → Herramientas de Microsoft Office → Escaneo de documentos de Microsoft Office". Si este elemento no está instalado, el sistema lo instalará automáticamente. Aparecerá un cuadro de diálogo para escanear archivos nuevos. Haga clic en el botón [Escáner], seleccione la cámara en el cuadro de diálogo emergente y seleccione la casilla de verificación "Mostrar el controlador del escáner antes de escanear", luego seleccione "Modo blanco y negro". y marque los elementos "Mensaje de avance de formulario" y "Ver archivos después de escanear".

En tercer lugar, haga clic en el botón [Escanear] nuevamente para escanear. Durante el proceso de escaneo, aparecerá un cuadro de diálogo, seleccione el botón [Formato] y seleccione una resolución de 600*480 en "Tamaño de salida". Luego, coloque el documento en posición horizontal y ajuste repetidamente el enfoque y la posición de la cámara para lograr el mejor efecto de imagen. Haga clic en el botón [Capturar] para obtener la imagen, que se mostrará en ".