Cómo configurar tesseract-ocr para que coincida solo con números + letras mayúsculas
Directorio de carpetas C:\Program Files (x86)\Tesseract-OCR\tessdata\configs, copie el número y asígnele el nombre de su número, use notepad++ para editar tessedit_char_whitelist?0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ
Si Está utilizando la versión 3.04, siga el tutorial directamente para operar tesseract?C:\1.jpg?C:\1?yours
Obtendrá fácilmente los resultados que desea.
Pero si está utilizando 4.00, encontrará que la lista blanca no tiene ningún efecto.
Extraño, ¿podría ser que el entorno de configuración sea incorrecto? ¿O es un error tipográfico? Ninguno.
Tesseract proporciona el modo de motor OCR. 0?=Solo Tesseract original
1?=Solo LSTM de red neuronal
2?=Tesseract +?LSTM
3?=Basado en los valores predeterminados disponibles p> p>
Actualmente, LSTM no puede admitir listas blancas y el equipo de Tesseract parece no tener intención de resolver este problema.
Selecciona el cubo de Rubik original, es decir --oem 0tesseract?--oem?0?C:\1.jpg?C:\1?yours
De esta manera puedes utilizar la lista blanca. Pero la precisión del reconocimiento será menor que antes.