Cómo utilizar Office para generar archivos PDF
Puedes descargar el software correspondiente
1. Reconocimiento de archivos PDF:
1) Archivos que se pueden reconocer directamente (archivos PDF guardados en forma de texto) : Instale la versión profesional de Acrobat 5, tenga en cuenta que no es Acrobat Reader, guárdelo directamente como un archivo rtf (identifique el archivo completo) o seleccione el botón de selección de texto en la barra de herramientas, luego seleccione el área de texto y luego cópielo a palabra, etc
2) Archivos que no se pueden reconocer directamente (archivos PDF guardados como imágenes): instale office2003 e instale la herramienta de Office Microsoft Office Document Imaging (instale completamente esta herramienta) y luego se agregará Microsoft a la impresora. . seleccione el menú "Herramientas" "Usar OCR para reconocer texto". Una vez completado el reconocimiento, seleccione "Enviar texto a Word" en "Herramientas" y, finalmente, todo el reconocimiento del archivo PDF se generará en un archivo de Word.
Nota: Microsoft Office Document Image puede identificar y convertir con mucha precisión el archivo completo al chino, inglés y tablas. Sin embargo, no puede generar gráficos en Word. En cambio, todos los gráficos del archivo se forman de forma independiente. imágenes El archivo se coloca en una carpeta con el mismo nombre en la misma ubicación, por lo que los gráficos se pueden abrir con el software snagit y luego copiarlos a Word. (Todo el software de reconocimiento no puede manejar muy bien el problema del reconocimiento gráfico. Este método de procesamiento de Microsoft Office Document Image ya es una muy buena solución para este problema).
3) Archivo PDF cifrado: descargue el software de descifrado primero, y luego consulte 1), 2) después del descifrado
4) Archivo pdf en chino tradicional: después de usar el método 2) para identificar la palabra, use las "Herramientas" - "Idioma" - en el word --"Conversión de chino tradicional y simplificado"
2. Convierta el texto en JPG a WORD. Sin embargo, en el trabajo diario, podemos encontrarnos con la necesidad de volver a modificar o formatear las tablas o artículos. Todo el mundo sabe que el formato del archivo escaneado es un formato de imagen. Generalmente, solo los escáneres de alta gama pueden elegir directamente escanear a formato PDF o WORD, pero si solo tenemos un escáner normal y necesitamos modificar el escaneo, ahora enseñaré. le explicamos cómo lograr nuestro objetivo bajo ciertas condiciones.
En primer lugar, debemos preparar OFFICE 2003 y luego abrir la herramienta de escaneo de documentos de Micosoft Office en la herramienta OFFCIE y configurarla. Puede hacer clic derecho en la imagen que necesita modificarse, seleccionar Imprimir y luego continuar con el siguiente paso. Al seleccionar la impresora, seleccione Micosoft Office Document Image Writer y luego imprima la imagen en un formato de imagen con una extensión de archivo. Formato mdi Luego seleccione "Enviar texto a WORD" en la herramienta del menú. Es así de simple y conveniente.
3. use el navegador caj ocr
2) Reconocimiento completo de archivos: imprima en la impresora Microsoft Office Document Image Writer, las siguientes operaciones son las mismas que las 2) anteriores
3) Descargue el texto completo de tesis doctoral: leer doctorado en línea Para una tesis de maestría, no cierre el navegador caj hasta que pueda ver la última página Busque un archivo más grande en el caché en el directorio de instalación de caj y cópielo en otra ubicación. Luego use 2) para convertir todo en Word.
4. Reconocimiento de archivos Superstar:
1) Reconocimiento de texto parcial: utilice directamente el OCR del navegador Superstar
2) Reconocimiento completo de archivos: imprima en Microsoft Office. Impresora Document Image Writer, las siguientes operaciones son las mismas que las 2) anteriores. Cabe señalar que la función de impresión Chaoxing es un poco diferente, porque Chaoxing separa la tabla de contenido y el texto completo, por lo que al imprimir, debe identificarse. la tabla de contenido y el texto en Word respectivamente. Al imprimir, complete el número de página de impresión desde 1 hasta la última página. No elija imprimir todo. Además, en las opciones de impresión, establezca la proporción de la página en tamaño real, no en ancho completo. Nota: La velocidad de reconocimiento es mucho más lenta que otros formatos, tenga paciencia, pero al final, cuando vea que la versión en Word de todo el libro se puede generar fácilmente, quedará extasiado, jaja. El resultado de mi experimento fue un libro de 280 páginas y la identificación tardó varios minutos.
3) Chaoxing es relativamente problemático. Si aún tiene problemas, primero puede imprimir Chaoxing en un archivo pdf completo y luego usar 1. para convertirlo a Word.
5. Reconocimiento en otras situaciones:
Utilice el software snagit para convertir cualquier forma de texto en una imagen. Por ejemplo, utilice snagit para copiar la pantalla en una imagen, luego haga clic derecho en el archivo de imagen y utilice Microsoft Office. Imagen del documento para abrir el gráfico Otros Igual que 2).
Nota: no utilice otro software de reconocimiento, ya que solo puede reconocer chino o inglés, o no puede reconocer el archivo completo, o no puede reconocer la imagen de copia de la pantalla, o el error de reconocimiento es muy grande. Grande, el formulario no se puede reconocer, se requiere registro, la velocidad de reconocimiento es muy lenta o es incómodo de usar (no está estrechamente integrado con Word). Estos software incluyen: Ziguang OCR, Wanfang PDFocr, Shangshu, Hanwang. , ScanSoft PDF Converter, pdf2word, y he instalado todo tipo de software recomendado, etc., pero ahora los he eliminado todos como si fueran basura. Siempre que instales Acrobat Professional Edition, Snagit y Office 2003, ahora podrás hacer cualquier cosa perfectamente. Lo más importante es que estos softwares son fáciles de conseguir.
Comentarios adicionales sobre algunos problemas:
Después de algunos experimentos, se descubrió que la imagen del documento de Microsoft Office tiene algunos problemas de inestabilidad, por ejemplo, al usar caj para imprimir en el documento de Microsoft Office. Impresora Image Writer, descubrí que usar la versión caj5.5 es más rápido (caj5.5 no se puede actualizar), mientras que caj5.0 a veces parece fallar.
Además, cuando la visualización de la página es grande, la tasa de reconocimiento de conversión es mayor.
Si hay problemas con archivos con muchas páginas, incluido Super Star, se pueden convertir varias veces.
Agregado nuevamente:
1. Dado que la impresión virtual en Microsoft Office Document Image Writer es relativamente lenta y el archivo virtual formado es muy grande, un libro con más de 200 páginas equivale aproximadamente a 200 páginas. 60M, por lo tanto, afectará seriamente la velocidad de funcionamiento de la máquina, el espacio en la unidad C y el espacio de memoria. Se recomienda que la máquina con una buena configuración no convierta más de 200 páginas a la vez, y la máquina con una mala configuración no. convierta más de 100 páginas al mismo tiempo, al imprimir, aparecerá un diagrama de impresora en la barra del sistema en la esquina inferior derecha. Puede hacer doble clic para ver el progreso de la tarea de impresión, para no pensar que. se ha estrellado. Además, elimine los archivos de impresión virtual en el directorio c:\windows\temp una vez completada la conversión; de lo contrario, su unidad c se agotará pronto.
2. Se recomienda que si la impresión en Microsoft Office Document Image Writer es muy lenta o está suspendida, primero pueda imprimir en la impresora virtual snagit, que generará automáticamente un archivo tiff, que es más rápido que Microsoft. Office Document Image Writer y luego, en snagit, seleccione la impresora como impresora Microsoft Office Document Image Writer (equivalente a imprimir en la impresora Microsoft Office Document Image Writer), luego seleccione la impresora en snagit---outputs y luego seleccione snagit ----archivo--- -finalizar la salida, puede generar el archivo msi y los demás son iguales.