Aplicación experimental para el reconocimiento óptico de caracteres (OCR)
Aplicación experimental para el reconocimiento óptico de caracteres (OCR)
Esta aplicación es una aplicación experimental que desarrollé hace varios años y que demuestra el uso del motor Tesseract OCR para reconocer texto en imágenes capturadas por la cámara del dispositivo.
Esta aplicación ejecuta OCR en su dispositivo (sin cargar sus imágenes en un servidor) y es adecuada para reconocer palabras individuales o frases cortas de texto, pero está destinada a aficionados y desarrolladores de software interesados en OCR y no al público general.
A diferencia de la API Mobile Vision de Google, esta aplicación puede reconocer texto impreso en fuentes no latinas sin conexión. Para lograrlo, esta aplicación incorpora una cantidad inusualmente grande de datos de entrenamiento para varios idiomas. Estos datos de entrenamiento se almacenan en su teléfono y esta aplicación ocupa mucho más espacio que las aplicaciones normales.
Esta aplicación no realiza ningún preprocesamiento de imágenes antes de entregar los fotogramas de imágenes capturadas a Tesseract, por lo que la aplicación no está ajustada para ningún caso de uso específico y, como resultado, su precisión y velocidad de reconocimiento dependen en gran medida de factores situacionales como la perspectiva, iluminación y tipo de fuente.
El código fuente de esta aplicación está disponible en GitHub (con cambios menores para adaptarse a las restricciones de tamaño de archivos de GitHub). El código de esta aplicación es una combinación de código abierto relacionado con la cámara del proyecto de escáner de código de barras ZXing y código de reconocimiento óptico de caracteres de código abierto del proyecto Tesseract OCR.
CAPTURA DE TEXTO
La captura de un solo disparo predeterminada ejecuta OCR en una imagen instantánea que se captura al hacer clic en el botón del obturador, como una foto normal.
Cuando se marca la casilla de verificación "vista previa continua", la aplicación muestra una visualización dinámica en tiempo real de lo que el dispositivo reconoce justo al lado del visor de la cámara. El modo de vista previa continua funciona mejor en un dispositivo rápido.
USANDO ESTA APLICACIÓN
• Apunte el dispositivo a una pequeña región de texto y toque el botón del obturador en pantalla para iniciar el OCR.
• Para reconocer caracteres chinos, japoneses o coreanos individuales, configure el modo de segmentación de página en "un solo carácter".
PRECISIÓN DEL RECONOCIMIENTO
• Varios factores pueden provocar que el OCR falle: iluminación desigual, texto estilizado o texto sin suficiente contraste con el fondo. Procura tener una buena iluminación.
• Sostenga el dispositivo con firmeza y asegúrese de que la imagen esté enfocada.
• Si necesita escanear un bloque grande de texto o un documento completo, pruebe con una aplicación de escaneo de documentos como Text Fairy.
IDIOMAS
• Esta aplicación admite varios idiomas/escrituras que Google Translate no reconoce.
• Idiomas admitidos para OCR:
africaans
albanés
amárico
árabe
Assamese
azerbaiyano
Azerbaiyano (cirílico)
vasco
bielorruso
bengalí
bosnio
búlgaro
birmano
catalán
cebuano
Cherokee
Chino (simplificado)
Chino (tradicional)
croata
checo
danés
Holandés
Dzongkha
Inglés
Inglés, Medio (1100-1500)
esperanto
estonio
finlandés
franco
Francés
Francés medio (ca. 1400-1600)
gallego
georgiano
Georgiano - Antiguo
Alemán
Griego, Antiguo (-1453)
Griego moderno (1453-)
gujarati
haitiano
hebreo
hindi
húngaro
islandés
indonesio
inuktitut
irlandés
italiano
Italiano - Antiguo
japonés
javanés
canarés
kazajo
jemer
coreano
kurdo
Kirguistán
laosiano
latín
letón
lituano
macedónio
malayo
malayalam
maltés
marathi
nepalí
noruego
Oriya
pastún
persa
Polaco
portugués
punjabi
rumano
ruso
Sanskrit
serbio
serbio (latín)
cingalés
eslovaco
esloveno
Español
Español - Antiguo
swahili
sueco
siríaco
tagalo
tayiko
Tamil
telugu
tailandés
tibetano
Tigrinya
turco
ucranio
urdu
uigur
uzbeko
Uzbeko (cirílico)
vietnamita
galés
yídish
NOTAS DEL DISPOSITIVO SAMSUNG
• En dispositivos Samsung Galaxy, es posible que tengas que mantener presionado el botón de menú para configurar las preferencias.
• Puede obtener mejores resultados si desmarca "Modo de enfoque estándar".
Leer más