Application expérimentale pour la reconnaissance optique de caractères (OCR)
Application expérimentale pour la reconnaissance optique de caractères (OCR)
Cette application est une application expérimentale que j'ai développée il y a plusieurs années et qui démontre l'utilisation du moteur Tesseract OCR pour reconnaître le texte dans les images capturées par l'appareil photo de l'appareil.
Cette application exécute l'OCR sur votre appareil – sans télécharger vos images sur un serveur – et convient à la reconnaissance de mots individuels ou de courtes phrases de texte, mais cette application est destinée aux amateurs et aux développeurs de logiciels intéressés par l'OCR et non au grand public.
Contrairement à l'API Mobile Vision de Google, cette application est capable de reconnaître le texte imprimé dans des polices non latines hors ligne. Pour y parvenir, cette application intègre une quantité inhabituellement importante de données de formation pour plusieurs langues. Ces données d'entraînement sont stockées sur votre téléphone et cette application prend beaucoup plus de place que les applications ordinaires.
Aucun prétraitement d'image n'est effectué par cette application avant de transmettre les images capturées à Tesseract. L'application n'est donc pas adaptée à un cas d'utilisation spécifique et, par conséquent, sa précision et sa vitesse de reconnaissance dépendent fortement de facteurs situationnels tels que la perspective, l'éclairage et le type de police.
Le code source de cette application est disponible sur GitHub (avec des modifications mineures pour tenir compte des restrictions de taille de fichier GitHub). Le code de cette application est une combinaison de code open source lié à la caméra du projet de scanner de codes à barres ZXing et de code de reconnaissance optique de caractères open source du projet Tesseract OCR.
CAPTURE DE TEXTE
La capture unique par défaut exécute l'OCR sur une image instantanée capturée lorsque vous cliquez sur le bouton de l'obturateur, comme une photo ordinaire.
Lorsque la case « Aperçu continu » est cochée, l'application affiche un affichage dynamique en temps réel de ce que l'appareil reconnaît juste à côté du viseur de l'appareil photo. Le mode de prévisualisation continue fonctionne mieux sur un appareil rapide.
UTILISER CETTE APPLICATION
• Pointez l'appareil vers une petite zone de texte et appuyez sur le déclencheur à l'écran pour démarrer l'OCR.
• Pour reconnaître des caractères chinois/japonais/coréens individuels, définissez le mode de segmentation de page sur « caractère unique ».
PRÉCISION DE LA RECONNAISSANCE
• Divers facteurs peuvent entraîner l'échec de l'OCR : éclairage inégal, texte stylisé ou texte sans contraste suffisant par rapport à l'arrière-plan. Essayez d'avoir un bon éclairage.
• Tenez l'appareil stable et assurez-vous que l'image est nette.
• Si vous devez numériser un gros bloc de texte ou un document entier, essayez plutôt une application de numérisation de documents telle que Text Fairy.
LANGUES
• Cette application prend en charge plusieurs langues/scripts non reconnus par Google Translate.
• Langues prises en charge pour l'OCR :
afrikaans
albanais
Amharique
arabe
Assamais
azerbaïdjanais
azerbaïdjanais (cyrillique)
Basque
biélorusse
bengali
bosniaque
bulgare
birman
catalan
Cebuano
Cherokee
Chinois (simplifié)
Chinois (traditionnel)
croate
tchèque
danois
Néerlandais
Dzongkha
Anglais
Anglais, moyen (11h00-15h00)
espéranto
estonien
finlandais
Franc
Français
Français, Moyen (vers 1400-1600)
Galicien
géorgien
Géorgien - Vieux
Allemand
Grec, ancien (-1453)
Grec, moderne (1453-)
gujarati
haïtien
hébreu
hindi
hongrois
islandais
indonésien
Inuktitut
irlandais
italien
Italien - Vieux
japonais
javanais
Kannada
Kazakh
Khmer
coréen
kurde
Kirghize
Laotien
latin
letton
lituanien
Macédonien
malais
Malayalam
maltais
Marathi
Népalais
norvégien
Oriya
pachtou
persan
polonais
portugais
Pendjabi
roumain
russe
Sanskrit
serbe
serbe (latin)
Cinghalais
slovaque
slovène
Espagnol
Espagnol - Vieux
Swahili
suédois
syriaque
Tagalog
tadjik
Tamoul
Télougou
thaïlandais
Tibétain
Tigrinya
turc
ukrainien
Ourdou
Ouïghour
Ouzbek
Ouzbek (cyrillique)
vietnamien
gallois
yiddish
REMARQUES SUR L'APPAREIL SAMSUNG
• Sur les appareils Samsung Galaxy, vous devrez peut-être appuyer longuement sur le bouton de menu pour définir les préférences.
• Vous pouvez obtenir de meilleurs résultats si vous décochez « Mode de mise au point standard ».
En savoir plus