¿Cuáles son los métodos eficientes para que el entrenamiento de Tesseract-OCR reconozca códigos de verificación?
2. Utilice JTessBoxEditor para fusionar las imágenes .tif obtenidas en una sola imagen (Herramienta->TessBoxEditor). Utilice JTessBoxEditor para abrir los archivos x.tif uno por uno para corregirlos (nota: cada corrección debe guardarse)
6. Después de la corrección, ejecute la línea de comando:
tesseract.exe. x.tif x nobatch box.train;
unicharset_extractor.exe x.box;
7. Cree un archivo llamado "font_properties" en el directorio e ingrese el siguiente contenido x 1 0 0 1 0;
8. Ejecute el siguiente comando desde la línea de comando:
cntraining.exe x.tr;
mftraining.exe -F font_properties - U unicharset x. tr;
9. p>
9. Agregue el prefijo del nombre de entrenamiento "x." a los múltiples archivos unicharset/inttemp/normproto/pffmtable. ;
10. tessdata x. Generar el archivo x.traineddata de datos de aprendizaje de calibración final;
11.