Cómo leer información de texto en documentos pdf desde el programa php
Biblioteca de funciones de archivos en formato PDF del programa PHP
Esta biblioteca de funciones tiene 65 funciones
PDF es un formato de archivo portátil desarrollado por Adobe. Sus archivos se pueden transmitir. navegar en la red, o incluso imprimir usando una impresora o imprimir usando otros dispositivos de salida, y se puede conservar la disposición original del texto y las imágenes. Puede encontrar información detallada en el sitio web de Adobe. Consulte las secciones sobre PDF o Acrobat.
En sistemas UNIX, puede utilizar la biblioteca de funciones PDF desarrollada por Thomas Merz. Después de compilarlo e instalarlo, compile el programa PHP antes de que PHP pueda usar pdflib. Es posible que necesite una biblioteca JPEG y TIFF al compilar.
Además de utilizar esta biblioteca de funciones para crear archivos PDF, ClibPDF, un producto desarrollado por FastIO, también puede procesar archivos PDF.
El siguiente es un ejemplo de procesamiento de un archivo PDF. Este ejemplo procesa test.pdf y espera a que el usuario lo lea.
lt;?php
$fp = fopen("test.pdf", "w");
$pdf = PDF_open($fp);
pdf_set_info_author($pdf, "Uwe Steinmann");
PDF_set_info_title($pdf, "Prueba del contenedor PHP de PDFlib 2.0"); $pdf, "Nombre del autor");
pdf_set_info_creator($pdf, "Ver autor");
pdf_set_info_subject($pdf, "Pruebas");
PDF_begin_page($pdf, 595, 842);
PDF_add_outline($pdf, "Página 1");
pdf_set_font($pdf, "Times-Roman", 30, 4);
pdf_set_text_rendering($pdf, 1);
PDF_show_xy($pdf, "Times Roman esbozado", 50, 750);
pdf_moveto( $pdf, 50, 740);
pdf_lineto($pdf, 330, 740);
pdf_stroke($pdf);
PDF_end_page($pdf) ;
PDF_close($pdf);
fclose($fp);
echo "lt;A HREF=getpdf.php3gt;finishedlt;/Agt; "; gt;
gettest.php3 en el ejemplo anterior puede verse similar al siguiente
lt;?php
$fp = fopen("test.pdf ", "r");
header("Tipo de contenido: aplicación/pdf");
fpassthru($fp);
fclose($ fp); gt;
PDF_get_info: Devuelve información del archivo.
PDF_set_info_creator: Configura la cadena del creador.
PDF_set_info_title: Título del archivo de configuración.
PDF_set_info_subject: Asunto del archivo de configuración.
PDF_set_info_keywords: Palabras clave del archivo de configuración.
PDF_set_info_author: Autor del archivo de configuración.
PDF_open: Crea un nuevo archivo PDF.
PDF_close: Cierra el archivo PDF.
PDF_begin_page: Inicia la página del archivo PDF.
PDF_end_page: cierra la página del archivo PDF.
PDF_show: salida de cadenas a archivos PDF.
PDF_show_xy: genera la cadena en las coordenadas especificadas.
PDF_set_font: Configura la fuente y el tamaño utilizado.
PDF_set_leading: Configurar el interlineado.
PDF_set_text_rendering: Configurar la representación del texto.
PDF_set_horiz_scaling: Configura el espaciado horizontal del texto.
PDF_set_text_rise: Configurar la altura del texto.
PDF_set_text_matrix: Configurar matriz de texto.
PDF_set_text_pos: Configurar la posición del texto.
PDF_set_char_spacing: Configurar el espaciado entre caracteres.
PDF_set_word_spacing: Configurar el espaciado entre palabras.
PDF_continue_text: Texto de salida.
PDF_stringwidth: Calcula el ancho de la cadena.
PDF_save: Guarda variables de entorno.
PDF_restore: Restaura variables de entorno.
PDF_translate: Mover el origen.
PDF_scale: Clase Zoom.
PDF_rotate: Clase de rotación.
PDF_setflat: Configurar valor de suavizado.
PDF_setlinejoin: Configurar parámetros de conexión.
PDF_setlinecap: Configurar parámetros de linecap.
PDF_setmiterlimit: Configura el límite de hipotenusa.
PDF_setlinewidth: Configura el ancho de línea.
PDF_setdash: Configurar estilo de línea discontinua.
PDF_moveto: Configura los puntos de coordenadas a procesar.
PDF_curveto: Dibujar curva de Bézier.
PDF_lineto: Dibuja una línea recta.
PDF_circle: Dibuja un círculo.
PDF_arc: Dibujar arco.
PDF_rect: Dibuja un rectángulo.
PDF_closepath: Forma una forma vectorial cerrada.
PDF_stroke: Dibuja una línea a lo largo de un vector.
PDF_closepath_stroke: forma una forma vectorial cerrada y dibuja una línea a lo largo del vector.
PDF_fill: Rellena el vector actual.
PDF_fill_stroke: Rellena el vector actual y dibuja una línea a lo largo del vector.
PDF_closepath_fill_stroke: forma una forma vectorial cerrada dibujando una línea a lo largo del vector y rellenándola.
PDF_endpath: Cierra el vector actual.
PDF_clip: Combina todos los vectores.
PDF_setgray_fill: Especifica el color de relleno como escala de grises.
PDF_setgray_stroke: Especifica que el color del dibujo será en escala de grises.
PDF_setgray: Especifica el color del dibujo como escala de grises y rellénalo.
PDF_setrgbcolor_fill: Especifica el color de relleno como color.
PDF_setrgbcolor_stroke: Especifica el color del dibujo como color.
PDF_setrgbcolor: Especifica el color del dibujo como color y rellénalo.
PDF_add_outline: Añade marcadores a la página actual.
PDF_set_transition: Configura la conversión de la página.
PDF_set_duration: Configura el tiempo de cambio entre dos páginas.
PDF_open_gif: abre un archivo de imagen GIF.
PDF_open_memory_image: Abre el archivo de imagen de la memoria.
PDF_open_jpeg: abre un archivo de imagen JPEG.
PDF_close_image: Cierra el archivo de imagen.
PDF_place_image: Coloca la imagen en la ubicación especificada en el archivo PDF.
PDF_put_image: Coloca una imagen en un archivo PDF.
PDF_execute_image: Coloca la imagen del archivo PDF en la ubicación especificada.
PDF_add_annotation: Añadir anotación.