Accueilapplicationbureau d'affaires

Application expérimentale pour la reconnaissance optique de caractères (OCR)

Application expérimentale pour la reconnaissance optique de caractères (OCR)

Cette application est une application expérimentale que j'ai développée il y a plusieurs années et qui démontre l'utilisation du moteur Tesseract OCR pour reconnaître le texte dans les images capturées par l'appareil photo de l'appareil.

Cette application exécute l'OCR sur votre appareil – sans télécharger vos images sur un serveur – et convient à la reconnaissance de mots individuels ou de courtes phrases de texte, mais cette application est destinée aux amateurs et aux développeurs de logiciels intéressés par l'OCR et non au grand public.

Contrairement à l'API Mobile Vision de Google, cette application est capable de reconnaître le texte imprimé dans des polices non latines hors ligne. Pour y parvenir, cette application intègre une quantité inhabituellement importante de données de formation pour plusieurs langues. Ces données d'entraînement sont stockées sur votre téléphone et cette application prend beaucoup plus de place que les applications ordinaires.

Aucun prétraitement d'image n'est effectué par cette application avant de transmettre les images capturées à Tesseract. L'application n'est donc pas adaptée à un cas d'utilisation spécifique et, par conséquent, sa précision et sa vitesse de reconnaissance dépendent fortement de facteurs situationnels tels que la perspective, l'éclairage et le type de police.

Le code source de cette application est disponible sur GitHub (avec des modifications mineures pour tenir compte des restrictions de taille de fichier GitHub). Le code de cette application est une combinaison de code open source lié à la caméra du projet de scanner de codes à barres ZXing et de code de reconnaissance optique de caractères open source du projet Tesseract OCR.

CAPTURE DE TEXTE

La capture unique par défaut exécute l'OCR sur une image instantanée capturée lorsque vous cliquez sur le bouton de l'obturateur, comme une photo ordinaire.

Lorsque la case « Aperçu continu » est cochée, l'application affiche un affichage dynamique en temps réel de ce que l'appareil reconnaît juste à côté du viseur de l'appareil photo. Le mode de prévisualisation continue fonctionne mieux sur un appareil rapide.

UTILISER CETTE APPLICATION

• Pointez l'appareil vers une petite zone de texte et appuyez sur le déclencheur à l'écran pour démarrer l'OCR.

• Pour reconnaître des caractères chinois/japonais/coréens individuels, définissez le mode de segmentation de page sur « caractère unique ».

PRÉCISION DE LA RECONNAISSANCE

• Divers facteurs peuvent entraîner l'échec de l'OCR : éclairage inégal, texte stylisé ou texte sans contraste suffisant par rapport à l'arrière-plan. Essayez d'avoir un bon éclairage.

• Tenez l'appareil stable et assurez-vous que l'image est nette.

• Si vous devez numériser un gros bloc de texte ou un document entier, essayez plutôt une application de numérisation de documents telle que Text Fairy.

LANGUES

• Cette application prend en charge plusieurs langues/scripts non reconnus par Google Translate.

• Langues prises en charge pour l'OCR :

afrikaans

albanais

Amharique

arabe

Assamais

azerbaïdjanais

azerbaïdjanais (cyrillique)

Basque

biélorusse

bengali

bosniaque

bulgare

birman

catalan

Cebuano

Cherokee

Chinois (simplifié)

Chinois (traditionnel)

croate

tchèque

danois

Néerlandais

Dzongkha

Anglais

Anglais, moyen (11h00-15h00)

espéranto

estonien

finlandais

Franc

Français

Français, Moyen (vers 1400-1600)

Galicien

géorgien

Géorgien - Vieux

Allemand

Grec, ancien (-1453)

Grec, moderne (1453-)

gujarati

haïtien

hébreu

hindi

hongrois

islandais

indonésien

Inuktitut

irlandais

italien

Italien - Vieux

japonais

javanais

Kannada

Kazakh

Khmer

coréen

kurde

Kirghize

Laotien

latin

letton

lituanien

Macédonien

malais

Malayalam

maltais

Marathi

Népalais

norvégien

Oriya

pachtou

persan

polonais

portugais

Pendjabi

roumain

russe

Sanskrit

serbe

serbe (latin)

Cinghalais

slovaque

slovène

Espagnol

Espagnol - Vieux

Swahili

suédois

syriaque

Tagalog

tadjik

Tamoul

Télougou

thaïlandais

Tibétain

Tigrinya

turc

ukrainien

Ourdou

Ouïghour

Ouzbek

Ouzbek (cyrillique)

vietnamien

gallois

yiddish

REMARQUES SUR L'APPAREIL SAMSUNG

• Sur les appareils Samsung Galaxy, vous devrez peut-être appuyer longuement sur le bouton de menu pour définir les préférences.

• Vous pouvez obtenir de meilleurs résultats si vous décochez « Mode de mise au point standard ».

Quoi de neuf dans la dernière version 0.6.0

Dernière mise à jour le 24 août 2017 Nouveau dans la version 0.6.0 (13 août 2017) :
• Regroupé toutes les données d'entraînement dans un fichier d'extension au lieu de les télécharger individuellement au moment de l'exécution.
• Ajout du support OCR pour 47 nouveaux scripts.
• Mise à niveau pour utiliser Tesseract v3.05.
• Remplacement de la traduction dans l'application par un bouton qui renvoie à Google Translate.
• Ajout d'un bouton de copie comme alternative à un appui long sur le texte reconnu.
• Les services Google Play sont désormais requis.
• Android 2.3+ est désormais requis.

En savoir plus

Les utilisateurs ont également consulté

Voir tout

Cela pourrait vous intéresser

Voir tout

Plus de jeux similaires

Voir tout

Plus de jeux de niveau

Voir tout