Documento API de extracción de coordenadas de texto PDF basado en PDFBox
com.aistrong.analysis.pdf.service
public ArrayListlt; Listlt; WordWithTextPositionsgt; readWordWithTextPositions(Ruta de cadena)
ruta de almacenamiento del archivo pdf
ArrayListlt; Listlt; WordWithTextPositionsgt;
Cada objeto WordWithTextPositions almacena todos los caracteres en 1 línea (ver nota), donde cada carácter corresponde a un objeto TextPosition, cada TextPosition almacena todos. información relevante del personaje, incluidos caracteres, coordenadas, etc. Para obtener más detalles, consulte el documento API de pdfBox Class TextPosition
Salida: