Red de conocimiento informático - Problemas con los teléfonos móviles - ¿Cuáles son los métodos eficientes para que el entrenamiento de Tesseract-OCR reconozca códigos de verificación?

¿Cuáles son los métodos eficientes para que el entrenamiento de Tesseract-OCR reconozca códigos de verificación?

1. Recopile imágenes en la biblioteca de imágenes (generalmente, el efecto de reconocimiento es mejor si cada carácter aparece aproximadamente 20 veces), realice un procesamiento preliminar (binarización/escala de grises/filtrado/reducción de ruido, etc.) de acuerdo con las características de las imágenes, y Guardar como formato .tif (x.tif);

2. Utilice JTessBoxEditor para fusionar las imágenes .tif obtenidas en una sola imagen (Herramienta->TessBoxEditor). Utilice JTessBoxEditor para abrir los archivos x.tif uno por uno para corregirlos (nota: cada corrección debe guardarse)

6. Después de la corrección, ejecute la línea de comando:

tesseract.exe. x.tif x nobatch box.train;

unicharset_extractor.exe x.box;

7. Cree un archivo llamado "font_properties" en el directorio e ingrese el siguiente contenido x 1 0 0 1 0;

8. Ejecute el siguiente comando desde la línea de comando:

cntraining.exe x.tr;

mftraining.exe -F font_properties - U unicharset x. tr;

9. p>

9. Agregue el prefijo del nombre de entrenamiento "x." a los múltiples archivos unicharset/inttemp/normproto/pffmtable. ;

10. tessdata x. Generar el archivo x.traineddata de datos de aprendizaje de calibración final;

11.