Red de conocimiento informático - Material del sitio web - Cómo leer parte de un documento PDF usando Java

Cómo leer parte de un documento PDF usando Java

Necesitas usar la API de PDFbox

https://pdfbox.apache.org/1.8/cookbook/textextraction.html

El ejemplo es el siguiente import?java.io .File;?

import?java.io.IOException;?

import?org.apache.pdfbox.pdmodel.PDDocument;?

import?org .apache.pdfbox.text.PDFTextStripper;

import?org.apache.pdfbox.text.PDFTextStripperByArea;

¿probar?{

PDDocument?document?= ?null;

document?=?PDDocument.load(new?File("test.pdf"));

document.getClass();

if?(! document.isEncrypted())?{

PDFTextStripperByArea?stripper?=?new?PDFTextStripperByArea();

stripper.setSortByPosition(true);

PDFTextStripper?Tstripper?=?new?PDFTextStripper();

String?st?=?Tstripper.getText(document);

System.out. println("Texto: "? ?st);

}

}?{

e.printStackTrace();

}

}

?