Red de conocimiento informático - Material del sitio web - Documento API de extracción de coordenadas de texto PDF basado en PDFBox

Documento API de extracción de coordenadas de texto PDF basado en PDFBox

com.aistrong.analysis.pdf.service

public ArrayListlt; Listlt; WordWithTextPositionsgt; readWordWithTextPositions(Ruta de cadena)

ruta de almacenamiento del archivo pdf

ArrayListlt; Listlt; WordWithTextPositionsgt;

Cada objeto WordWithTextPositions almacena todos los caracteres en 1 línea (ver nota), donde cada carácter corresponde a un objeto TextPosition, cada TextPosition almacena todos. información relevante del personaje, incluidos caracteres, coordenadas, etc. Para obtener más detalles, consulte el documento API de pdfBox Class TextPosition

Salida: