Iniciosolicitudoficina de negocios

Aplicación experimental para el reconocimiento óptico de caracteres (OCR)

Aplicación experimental para el reconocimiento óptico de caracteres (OCR)

Esta aplicación es una aplicación experimental que desarrollé hace varios años y que demuestra el uso del motor Tesseract OCR para reconocer texto en imágenes capturadas por la cámara del dispositivo.

Esta aplicación ejecuta OCR en su dispositivo (sin cargar sus imágenes en un servidor) y es adecuada para reconocer palabras individuales o frases cortas de texto, pero está destinada a aficionados y desarrolladores de software interesados ​​en OCR y no al público general.

A diferencia de la API Mobile Vision de Google, esta aplicación puede reconocer texto impreso en fuentes no latinas sin conexión. Para lograrlo, esta aplicación incorpora una cantidad inusualmente grande de datos de entrenamiento para varios idiomas. Estos datos de entrenamiento se almacenan en su teléfono y esta aplicación ocupa mucho más espacio que las aplicaciones normales.

Esta aplicación no realiza ningún preprocesamiento de imágenes antes de entregar los fotogramas de imágenes capturadas a Tesseract, por lo que la aplicación no está ajustada para ningún caso de uso específico y, como resultado, su precisión y velocidad de reconocimiento dependen en gran medida de factores situacionales como la perspectiva, iluminación y tipo de fuente.

El código fuente de esta aplicación está disponible en GitHub (con cambios menores para adaptarse a las restricciones de tamaño de archivos de GitHub). El código de esta aplicación es una combinación de código abierto relacionado con la cámara del proyecto de escáner de código de barras ZXing y código de reconocimiento óptico de caracteres de código abierto del proyecto Tesseract OCR.

CAPTURA DE TEXTO

La captura de un solo disparo predeterminada ejecuta OCR en una imagen instantánea que se captura al hacer clic en el botón del obturador, como una foto normal.

Cuando se marca la casilla de verificación "vista previa continua", la aplicación muestra una visualización dinámica en tiempo real de lo que el dispositivo reconoce justo al lado del visor de la cámara. El modo de vista previa continua funciona mejor en un dispositivo rápido.

USANDO ESTA APLICACIÓN

• Apunte el dispositivo a una pequeña región de texto y toque el botón del obturador en pantalla para iniciar el OCR.

• Para reconocer caracteres chinos, japoneses o coreanos individuales, configure el modo de segmentación de página en "un solo carácter".

PRECISIÓN DEL RECONOCIMIENTO

• Varios factores pueden provocar que el OCR falle: iluminación desigual, texto estilizado o texto sin suficiente contraste con el fondo. Procura tener una buena iluminación.

• Sostenga el dispositivo con firmeza y asegúrese de que la imagen esté enfocada.

• Si necesita escanear un bloque grande de texto o un documento completo, pruebe con una aplicación de escaneo de documentos como Text Fairy.

IDIOMAS

• Esta aplicación admite varios idiomas/escrituras que Google Translate no reconoce.

• Idiomas admitidos para OCR:

africaans

albanés

amárico

árabe

Assamese

azerbaiyano

Azerbaiyano (cirílico)

vasco

bielorruso

bengalí

bosnio

búlgaro

birmano

catalán

cebuano

Cherokee

Chino (simplificado)

Chino (tradicional)

croata

checo

danés

Holandés

Dzongkha

Inglés

Inglés, Medio (1100-1500)

esperanto

estonio

finlandés

franco

Francés

Francés medio (ca. 1400-1600)

gallego

georgiano

Georgiano - Antiguo

Alemán

Griego, Antiguo (-1453)

Griego moderno (1453-)

gujarati

haitiano

hebreo

hindi

húngaro

islandés

indonesio

inuktitut

irlandés

italiano

Italiano - Antiguo

japonés

javanés

canarés

kazajo

jemer

coreano

kurdo

Kirguistán

laosiano

latín

letón

lituano

macedónio

malayo

malayalam

maltés

marathi

nepalí

noruego

Oriya

pastún

persa

Polaco

portugués

punjabi

rumano

ruso

Sanskrit

serbio

serbio (latín)

cingalés

eslovaco

esloveno

Español

Español - Antiguo

swahili

sueco

siríaco

tagalo

tayiko

Tamil

telugu

tailandés

tibetano

Tigrinya

turco

ucranio

urdu

uigur

uzbeko

Uzbeko (cirílico)

vietnamita

galés

yídish

NOTAS DEL DISPOSITIVO SAMSUNG

• En dispositivos Samsung Galaxy, es posible que tengas que mantener presionado el botón de menú para configurar las preferencias.

• Puede obtener mejores resultados si desmarca "Modo de enfoque estándar".

Novedades de la última versión 0.6.0

Última actualización el 24 de agosto de 2017 Nuevo en la versión 0.6.0 (13 de agosto de 2017):
• Empaquetado todos los datos de entrenamiento en un archivo de expansión en lugar de descargarlos individualmente en tiempo de ejecución.
• Se agregó soporte de OCR para 47 scripts nuevos.
• Actualizado para usar Tesseract v3.05.
• Se reemplazó la traducción en la aplicación con un botón que enlaza con Google Translate.
• Se agregó un botón de copiar como alternativa a mantener presionado el texto reconocido.
• Ahora se requieren los servicios de Google Play.
• Ahora se requiere Android 2.3+.

Leer más

Los usuarios también vieron

Ver todo

Te puede interesar

Ver todo

Más juegos similares

Ver todo

Más juegos de niveles

Ver todo