Sistema TH-OCR de Tsinghua
Sdk: kit de desarrollo de software
Contenido del SDK TH-OCR
El SDK TH-OCR utiliza TH-OCR para otros programas Proporciona una interfaz de programación para el reconocimiento de caracteres chinos e incluye algunos códigos de muestra.
Limitaciones del SDK TH-OCR
El SDK solo proporciona una interfaz de desarrollo, y el software desarrollado utilizando el SDK requiere autorización para cada conjunto de módulos en ejecución.
Requiere una configuración mínima del sistema
486 o más de CPU, 8 mo más de memoria, sistema operativo Win95, Win98 o WinNT.
Uso de TH-OCR SDK
1. Modo de interfaz:
Utilice la llamada dll estándar de Windows. Los usuarios pueden llamar funciones en el SDK a través de funciones en el dll.
2. Programa de muestra:
El sistema incluye programas de muestra VC y VB, que se encuentran en los subdirectorios de VBdemo y VCdemo respectivamente.
(i) VCdemo, que demuestra funciones básicas de reconocimiento de archivos.
(2) VBdemo, demuestra la mayoría de las funciones.
3. Introducción a las funciones del sistema
El sistema tiene todas las funciones del núcleo de reconocimiento del sistema TH-OCR, incluido
(I) admite lectura de TIFF, PCX. e imágenes en formato BMP, compatibles con formatos TIFF comprimidos Packbits y G4.
(ii) La inclinación de la imagen causada por el escaneo se puede corregir automáticamente.
(iii) Se puede realizar un análisis de diseño automático en las imágenes.
(4) Admite salida de código interno, como el código GB_2312 (usado en China continental), el código BIG_5 (usado en la provincia de Taiwán), GBK, JIS, Shift-JIS, KSC.
(v) Capacidad de reconocer imágenes de texto en inglés sencillo, chino simplificado y tradicional, japonés y coreano.
(vi) Según los resultados del reconocimiento, el diseño se puede restaurar y exportar a formatos de archivo RTF y HTML.
㈦Admite el reconocimiento de imágenes en la memoria.
(viii) Se puede obtener la información de posición y tamaño de los caracteres reconocidos en el texto original.
㈨Apoya la determinación de áreas designadas.
(x) Admite la función de devolución de llamada para mostrar el progreso del reconocimiento.
4. Ejemplo de proceso de reconocimiento de archivos de imagen:
(1) Ejecutar la inicialización Tw_start();
(2) Iniciar la identificación de TW_recongfile(lpstrimagefilename,... ,n opción);
(3) Fin de reconocimiento Tw_End();
La versión del SDK TH-OCR
El SDK se divide en Hay diferentes versiones como Basic Edition, Professional Edition y Enterprise Edition. Cada versión tiene diferentes rendimientos, funciones, precios y métodos de cifrado.
La versión básica no tiene cifrado y es ligeramente peor que la versión profesional. Las diferencias incluyen:
La tasa de reconocimiento es ligeramente menor.
No se admite la corrección de errores de posprocesamiento basada en el modelo de lenguaje.
No se admite la exportación a formatos RTF y HTML.
No existe ninguna función de procesamiento de formularios.
No existe una función de adquisición de posición de caracteres.