Cómo leer parte de un documento PDF usando Java
Necesitas usar la API de PDFbox
https://pdfbox.apache.org/1.8/cookbook/textextraction.html
El ejemplo es el siguiente import?java.io .File;?
import?java.io.IOException;?
import?org.apache.pdfbox.pdmodel.PDDocument;?
import?org .apache.pdfbox.text.PDFTextStripper;
import?org.apache.pdfbox.text.PDFTextStripperByArea;
¿probar?{
PDDocument?document?= ?null;
document?=?PDDocument.load(new?File("test.pdf"));
document.getClass(); p>
if?(! document.isEncrypted())?{
PDFTextStripperByArea?stripper?=?new?PDFTextStripperByArea();
stripper.setSortByPosition(true);
PDFTextStripper?Tstripper?=?new?PDFTextStripper();
String?st?=?Tstripper.getText(document);
System.out. println("Texto: "? ?st);
}
}?{
e.printStackTrace();
}
}
?