StartseiteAnwendungGeschäftsbüro

Experimentelle App zur optischen Zeichenerkennung (OCR)

Experimentelle App zur optischen Zeichenerkennung (OCR)

Bei dieser App handelt es sich um eine experimentelle App, die ich vor einigen Jahren entwickelt habe und die die Verwendung der Tesseract OCR-Engine zum Erkennen von Text in Bildern demonstriert, die von der Gerätekamera aufgenommen wurden.

Diese App führt OCR auf Ihrem Gerät aus – ohne Ihre Bilder auf einen Server hochzuladen – und eignet sich zum Erkennen einzelner Wörter oder kurzer Textphrasen. Diese App ist jedoch für Hobbyisten und Softwareentwickler gedacht, die sich für OCR interessieren, und nicht für die allgemeine Zielgruppe.

Im Gegensatz zur Mobile Vision API von Google ist diese App in der Lage, offline Texte zu erkennen, die in nicht-lateinischen Schriftarten gedruckt sind. Um dies zu erreichen, integriert diese App ungewöhnlich viele Trainingsdaten für mehrere Sprachen. Diese Trainingsdaten werden auf Ihrem Telefon gespeichert und diese App nimmt viel mehr Platz ein als gewöhnliche Apps.

Diese App führt keine Bildvorverarbeitung durch, bevor erfasste Bilder an Tesseract übergeben werden. Daher ist die App nicht auf einen bestimmten Anwendungsfall abgestimmt und ihre Erkennungsgenauigkeit und -geschwindigkeit hängt daher stark von Situationsfaktoren wie Perspektive, Beleuchtung und Schriftart.

Der Quellcode für diese App ist auf GitHub verfügbar (mit geringfügigen Änderungen, um den Dateigrößenbeschränkungen von GitHub Rechnung zu tragen). Der Code für diese App ist eine Kombination aus Open-Source-Kamera-Code aus dem ZXing-Barcode-Scanner-Projekt und Open-Source-Code zur optischen Zeichenerkennung aus dem Tesseract OCR-Projekt.

TEXTERFASSUNG

Bei der standardmäßigen Einzelbildaufnahme wird die OCR für ein Schnappschussbild ausgeführt, das wie bei einem normalen Foto aufgenommen wird, wenn Sie auf den Auslöser klicken.

Wenn das Kontrollkästchen „Kontinuierliche Vorschau“ aktiviert ist, zeigt die App direkt neben dem Kamerasucher eine dynamische Echtzeitanzeige dessen an, was das Gerät erkennt. Der kontinuierliche Vorschaumodus funktioniert am besten auf einem schnellen Gerät.

VERWENDUNG DIESER APP

• Richten Sie das Gerät auf einen kleinen Textbereich und berühren Sie den Auslöser auf dem Bildschirm, um die OCR zu starten.

• Um einzelne chinesische/japanische/koreanische Zeichen zu erkennen, stellen Sie den Seitensegmentierungsmodus auf „Einzelzeichen“ ein.

ERKENNUNGSGENAUIGKEIT

• Verschiedene Faktoren können dazu führen, dass die OCR fehlschlägt: ungleichmäßige Beleuchtung, stilisierter Text oder Text ohne ausreichenden Kontrast zum Hintergrund. Versuchen Sie, eine gute Beleuchtung zu haben.

• Halten Sie das Gerät ruhig und stellen Sie sicher, dass das Bild scharf ist.

• Wenn Sie einen großen Textblock oder ein ganzes Dokument scannen müssen, probieren Sie stattdessen eine Dokumentenscan-App wie Text Fairy aus.

SPRACHEN

• Diese App unterstützt mehrere Sprachen/Skripte, die von Google Translate nicht erkannt werden.

• Unterstützte Sprachen für OCR:

Afrikaans

albanisch

Amharisch

Arabisch

Assamesisch

Aserbaidschanisch

Aserbaidschanisch (Kyrillisch)

baskisch

Weißrussisch

Bengali

bosnisch

bulgarisch

birmanisch

katalanisch

Cebuano

Cherokee

Chinesisch (vereinfacht)

Chinesisch (traditionell)

kroatisch

tschechisch

dänisch

Niederländisch

Dzongkha

Englisch

Englisch, Mittelenglisch (1100-1500)

Esperanto

estnisch

finnisch

fränkisch

Französisch

Französisch, Mittelfranzösisch (ca. 1400-1600)

galizisch

georgisch

Georgisch - Alt

Deutsch

Griechisch, Antike (-1453)

Griechisch, Moderne (1453-)

Gujarati

haitianisch

hebräisch

Hindi

ungarisch

isländisch

Indonesisch

Inuktitut

irisch

Italienisch

Italienisch - Alt

japanisch

Javanisch

Kannada

Kasachisch

Khmer

Koreanisch

kurdisch

Kirgisisch

Laotisch

lateinisch

lettisch

litauisch

mazedonisch

malaiisch

Malayalam

maltesisch

Marathi

Nepali

norwegisch

Oriya

Paschtu

persisch

Polieren

Portugiesisch

Punjabi

rumänisch

Russisch

Sanskrit

serbisch

Serbisch (Latein)

Singhalesisch

slowakisch

Slowenisch

Spanisch

Spanisch - Alt

Suaheli

Schwedisch

Syrisch

Tagalog

Tadschikisch

Tamilisch

Telugu

Thailändisch

Tibetisch

Tigrinya

Türkisch

ukrainisch

Urdu

Uigur

Usbekisch

Usbekisch (Kyrillisch)

Vietnamesisch

Walisisch

Jiddisch

HINWEISE ZU SAMSUNG-GERÄTEN

• Auf Samsung Galaxy-Geräten müssen Sie möglicherweise lange auf die Menütaste drücken, um Einstellungen festzulegen.

• Möglicherweise erzielen Sie bessere Ergebnisse, wenn Sie „Standard-Fokusmodus“ deaktivieren.

Was ist neu in der neuesten Version 0.6.0?

Zuletzt aktualisiert am 24. August 2017. Neu in Version 0.6.0 (13. August 2017):
• Alle Trainingsdaten wurden in einer Erweiterungsdatei verpackt, anstatt sie einzeln zur Laufzeit herunterzuladen.
• OCR-Unterstützung für 47 neue Skripte hinzugefügt.
• Auf die Verwendung von Tesseract v3.05 aktualisiert.
• Die In-App-Übersetzung wurde durch eine Schaltfläche ersetzt, die auf Google Translate verweist.
• Als Alternative zum langen Drücken des erkannten Textes wurde eine Schaltfläche zum Kopieren hinzugefügt.
• Google Play-Dienste sind jetzt erforderlich.
• Android 2.3+ ist jetzt erforderlich.

Mehr lesen

Benutzer sahen auch

Alle ansehen

Das könnte Ihnen gefallen

Alle ansehen

Weitere ähnliche Spiele

Alle ansehen

Weitere Level-Spiele

Alle ansehen