ホーム応用営業所

光学式文字認識 (OCR) の実験的アプリ

光学式文字認識 (OCR) の実験的アプリ

このアプリは、私が数年前に開発した実験的なアプリで、Tesseract OCR エンジンを使用してデバイスのカメラでキャプチャされた画像内のテキストを認識する方法を実証します。

このアプリは、画像をサーバーにアップロードせずにデバイス上で OCR を実行し、個々の単語やテキストの短いフレーズを認識するのに適していますが、このアプリは OCR に興味のある愛好家やソフトウェア開発者を対象としており、一般のユーザーを対象としていません。

Google の Mobile Vision API とは対照的に、このアプリは、オフラインでも非ラテンベースのフォントで印刷されたテキストを認識できます。これを実現するために、このアプリには複数の言語の異常に大量のトレーニング データが組み込まれています。このトレーニング データは携帯電話に保存され、このアプリは通常のアプリよりもはるかに多くのスペースを占有します。

このアプリでは、キャプチャした画像フレームを Tesseract に渡す前に画像の前処理は実行されません。そのため、アプリは特定のユースケース向けに調整されておらず、その結果、認識の精度と速度は遠近感などの状況要因に大きく依存します。照明とフォントの種類。

このアプリのソース コードは GitHub で入手できます (GitHub のファイル サイズ制限に対応するために若干の変更が加えられています)。このアプリのコードは、ZXing バーコード スキャナ プロジェクトのオープンソース カメラ関連コードと Tesseract OCR プロジェクトのオープンソースの光学式文字認識コードを組み合わせたものです。

テキストキャプチャ

デフォルトのシングルショット キャプチャでは、通常の写真と同様に、シャッター ボタンをクリックしたときにキャプチャされるスナップショット画像に対して OCR が実行されます。

「継続プレビュー」チェックボックスをオンにすると、アプリはカメラのビューファインダーのすぐ横に、デバイスが認識している内容を動的にリアルタイムで表示します。連続プレビュー モードは、高速なデバイスで最適に機能します。

このアプリの使用方法

• テキストの小さな領域にデバイスを向け、画面上のシャッター ボタンをタッチして OCR を開始します。

• 中国語/日本語/韓国語の個々の文字を認識するには、ページ分割モードを「単一文字」に設定します。

認識精度

• 不均一な照明、様式化されたテキスト、背景とのコントラストが十分でないテキストなど、さまざまな要因によって OCR が失敗する可能性があります。良い照明を取り入れるようにしましょう。

• デバイスをしっかりと持ち、画像の焦点が合っていることを確認してください。

• 大きなテキスト ブロックまたはドキュメント全体をスキャンする必要がある場合は、代わりに Text Fairy などのドキュメント スキャン アプリを試してください。

言語

• このアプリは、Google 翻訳で認識されないいくつかの言語/スクリプトをサポートしています。

• OCR でサポートされている言語:

アフリカーンス語

アルバニア人

アムハラ語

アラビア語

アッサム語

アゼルバイジャン語

アゼルバイジャン語 (キリル文字)

バスク語

ベラルーシ語

ベンガル語

ボスニア語

ブルガリア語

ビルマ語

カタルーニャ語

セブアノ語

チェロキー

中国語(簡体字)

中国語(繁体字)

クロアチア語

チェコ語

デンマーク語

オランダ語

ゾンカ語

英語

英語、中級 (1100-1500)

エスペラント

エストニア語

フィンランド語

フランク人

フランス語

フランス語、中期 (約 1400 ~ 1600 年)

ガリシア語

グルジア語

グルジア語 - 古い

ドイツ語

ギリシャ、古代 (-1453)

ギリシャ、現代 (1453-)

グジャラート語

ハイチ人

ヘブライ語

ヒンディー語

ハンガリー語

アイスランド語

インドネシア語

イヌクティトゥット島

アイルランド人

イタリア語

イタリア語 - 古い

日本語

ジャワ語

カンナダ語

カザフ語

クメール語

韓国人

クルド

キルギス

ラオ語

ラテン

ラトビア語

リトアニア語

マケドニア語

マレー語

マラヤーラム語

マルタ語

マラーティー語

ネパール語

ノルウェー語

おりや

パシュトゥー語

ペルシア語

研磨

ポルトガル語

パンジャブ語

ルーマニア語

ロシア

サンスクリット

セルビア語

セルビア語 (ラテン語)

シンハラ語

スロバキア語

スロベニア語

スペイン語

スペイン語 - 古い

スワヒリ語

スウェーデン語

シリア語

タガログ語

タジク語

タミル語

テルグ語

タイ語

チベット語

ティグリニャ

トルコ語

ウクライナ語

ウルドゥー語

ウイグル語

ウズベク語

ウズベク語 (キリル文字)

ベトナム語

ウェールズ語

イディッシュ語

サムスンデバイスに関する注意事項

• Samsung Galaxy デバイスでは、環境設定を行うためにメニュー ボタンを長押しする必要がある場合があります。

• 「標準フォーカスモード」のチェックを外すと、より良い結果が得られる場合があります。

最新バージョン 0.6.0 の新機能

最終更新日: 2017 年 8 月 24 日 バージョン 0.6.0 の新機能 (2017 年 8 月 13 日):
• 実行時に個別にダウンロードするのではなく、すべてのトレーニング データを拡張ファイルにパッケージ化しました。
• 47 の新しいスクリプトに対する OCR サポートを追加しました。
• Tesseract v3.05 を使用するようにアップグレードされました。
• アプリ内翻訳を Google 翻訳にリンクするボタンに置​​き換えました。
• 認識されたテキストを長押しする代わりにコピー ボタンを追加しました。
• Google Play サービスが必須になりました。
• Android 2.3 以降が必須になりました。

続きを読む

ユーザーが見たもの

すべて見る

おすすめ

すべて見る

類似のゲームをもっと見る

すべて見る

その他のレベル ゲーム

すべて見る