Experimentelle App zur optischen Zeichenerkennung (OCR)
Experimentelle App zur optischen Zeichenerkennung (OCR)
Bei dieser App handelt es sich um eine experimentelle App, die ich vor einigen Jahren entwickelt habe und die die Verwendung der Tesseract OCR-Engine zum Erkennen von Text in Bildern demonstriert, die von der Gerätekamera aufgenommen wurden.
Diese App führt OCR auf Ihrem Gerät aus – ohne Ihre Bilder auf einen Server hochzuladen – und eignet sich zum Erkennen einzelner Wörter oder kurzer Textphrasen. Diese App ist jedoch für Hobbyisten und Softwareentwickler gedacht, die sich für OCR interessieren, und nicht für die allgemeine Zielgruppe.
Im Gegensatz zur Mobile Vision API von Google ist diese App in der Lage, offline Texte zu erkennen, die in nicht-lateinischen Schriftarten gedruckt sind. Um dies zu erreichen, integriert diese App ungewöhnlich viele Trainingsdaten für mehrere Sprachen. Diese Trainingsdaten werden auf Ihrem Telefon gespeichert und diese App nimmt viel mehr Platz ein als gewöhnliche Apps.
Diese App führt keine Bildvorverarbeitung durch, bevor erfasste Bilder an Tesseract übergeben werden. Daher ist die App nicht auf einen bestimmten Anwendungsfall abgestimmt und ihre Erkennungsgenauigkeit und -geschwindigkeit hängt daher stark von Situationsfaktoren wie Perspektive, Beleuchtung und Schriftart.
Der Quellcode für diese App ist auf GitHub verfügbar (mit geringfügigen Änderungen, um den Dateigrößenbeschränkungen von GitHub Rechnung zu tragen). Der Code für diese App ist eine Kombination aus Open-Source-Kamera-Code aus dem ZXing-Barcode-Scanner-Projekt und Open-Source-Code zur optischen Zeichenerkennung aus dem Tesseract OCR-Projekt.
TEXTERFASSUNG
Bei der standardmäßigen Einzelbildaufnahme wird die OCR für ein Schnappschussbild ausgeführt, das wie bei einem normalen Foto aufgenommen wird, wenn Sie auf den Auslöser klicken.
Wenn das Kontrollkästchen „Kontinuierliche Vorschau“ aktiviert ist, zeigt die App direkt neben dem Kamerasucher eine dynamische Echtzeitanzeige dessen an, was das Gerät erkennt. Der kontinuierliche Vorschaumodus funktioniert am besten auf einem schnellen Gerät.
VERWENDUNG DIESER APP
• Richten Sie das Gerät auf einen kleinen Textbereich und berühren Sie den Auslöser auf dem Bildschirm, um die OCR zu starten.
• Um einzelne chinesische/japanische/koreanische Zeichen zu erkennen, stellen Sie den Seitensegmentierungsmodus auf „Einzelzeichen“ ein.
ERKENNUNGSGENAUIGKEIT
• Verschiedene Faktoren können dazu führen, dass die OCR fehlschlägt: ungleichmäßige Beleuchtung, stilisierter Text oder Text ohne ausreichenden Kontrast zum Hintergrund. Versuchen Sie, eine gute Beleuchtung zu haben.
• Halten Sie das Gerät ruhig und stellen Sie sicher, dass das Bild scharf ist.
• Wenn Sie einen großen Textblock oder ein ganzes Dokument scannen müssen, probieren Sie stattdessen eine Dokumentenscan-App wie Text Fairy aus.
SPRACHEN
• Diese App unterstützt mehrere Sprachen/Skripte, die von Google Translate nicht erkannt werden.
• Unterstützte Sprachen für OCR:
Afrikaans
albanisch
Amharisch
Arabisch
Assamesisch
Aserbaidschanisch
Aserbaidschanisch (Kyrillisch)
baskisch
Weißrussisch
Bengali
bosnisch
bulgarisch
birmanisch
katalanisch
Cebuano
Cherokee
Chinesisch (vereinfacht)
Chinesisch (traditionell)
kroatisch
tschechisch
dänisch
Niederländisch
Dzongkha
Englisch
Englisch, Mittelenglisch (1100-1500)
Esperanto
estnisch
finnisch
fränkisch
Französisch
Französisch, Mittelfranzösisch (ca. 1400-1600)
galizisch
georgisch
Georgisch - Alt
Deutsch
Griechisch, Antike (-1453)
Griechisch, Moderne (1453-)
Gujarati
haitianisch
hebräisch
Hindi
ungarisch
isländisch
Indonesisch
Inuktitut
irisch
Italienisch
Italienisch - Alt
japanisch
Javanisch
Kannada
Kasachisch
Khmer
Koreanisch
kurdisch
Kirgisisch
Laotisch
lateinisch
lettisch
litauisch
mazedonisch
malaiisch
Malayalam
maltesisch
Marathi
Nepali
norwegisch
Oriya
Paschtu
persisch
Polieren
Portugiesisch
Punjabi
rumänisch
Russisch
Sanskrit
serbisch
Serbisch (Latein)
Singhalesisch
slowakisch
Slowenisch
Spanisch
Spanisch - Alt
Suaheli
Schwedisch
Syrisch
Tagalog
Tadschikisch
Tamilisch
Telugu
Thailändisch
Tibetisch
Tigrinya
Türkisch
ukrainisch
Urdu
Uigur
Usbekisch
Usbekisch (Kyrillisch)
Vietnamesisch
Walisisch
Jiddisch
HINWEISE ZU SAMSUNG-GERÄTEN
• Auf Samsung Galaxy-Geräten müssen Sie möglicherweise lange auf die Menütaste drücken, um Einstellungen festzulegen.
• Möglicherweise erzielen Sie bessere Ergebnisse, wenn Sie „Standard-Fokusmodus“ deaktivieren.
Mehr lesen