首頁應用商務辦公室

光學字元辨識 (OCR) 實驗應用

光學字元辨識 (OCR) 實驗應用

這個應用程式是我幾年前開發的一個實驗性應用程序,它演示瞭如何使用 Tesseract OCR 引擎來識別設備相機捕獲的圖像中的文字。

該應用程式在您的裝置上執行OCR(無需將圖像上傳到伺服器),並且適合識別單字或文字短語,但該應用程式面向對OCR 感興趣的愛好者和軟體開發人員,而不是面向普通受眾。

與 Google 的 Mobile Vision API 相比,該應用程式能夠在離線狀態下識別以非拉丁字體列印的文字。為了實現這一目標,該應用程式包含了多種語言的異常大量的訓練資料。這些訓練資料儲存在您的手機上,並且該應用程式比普通應用程式佔用更多空間。

在將捕獲的圖像幀移交給Tesseract 之前,該應用程式不會執行任何圖像預處理,因此該應用程式不會針對任何特定用例進行調整,因此,其識別準確性和速度在很大程度上取決於視角等情境因素,照明和字體類型。

此應用程式的原始程式碼可在 GitHub 上取得(進行了一些細微更改以適應 GitHub 檔案大小限制)。該應用程式的代碼是來自 ZXing 條碼掃描器專案的開源相機相關代碼和來自 Tesseract OCR 專案的開源光學字元識別代碼的組合。

文字捕捉

預設的單次拍攝會對點擊快門按鈕時拍攝的快照影像執行 OCR,就像普通照片一樣。

當勾選「連續預覽」複選框時,應用程式會在相機取景器旁動態即時顯示裝置正在辨識的內容。連續預覽模式在快速設備上效果最佳。

使用這個應用程式

• 將裝置指向一小塊文字區域,然後觸控螢幕上的快門按鈕以啟動 OCR。

• 若要辨識單一中文/日文/韓文字符,請將頁面分割模式設為「單一字元」。

辨識準確率

• 多種因素都可能導致 OCR 失敗:照明不均勻、文字風格化或文字與背景的對比不足。嘗試擁有良好的照明。

• 平穩握住設備,並確保圖片清晰對焦。

• 如果您需要掃描大塊文字或整個文檔,請嘗試使用文檔掃描應用程序,例如 Text Fairy。

語言

• 此應用程式支援Google翻譯無法辨識的多種語言/文字。

• OCR 支援的語言:

南非荷蘭語

阿爾巴尼亞語

阿姆哈拉語

阿拉伯

阿薩姆語

亞塞拜然語

亞塞拜然語(西里爾文)

巴斯克

白俄羅斯語

孟加拉

波士尼亞語

保加利亞語

緬甸語

加泰隆尼亞語

宿霧語

切羅基

中文(簡體)

中文(繁體)

克羅埃西亞語

捷克語

丹麥語

荷蘭語

宗卡

英語

英語,中級 (1100-1500)

世界語

愛沙尼亞語

芬蘭

法蘭克語

法語

中世紀法文(約 1400-1600 年)

加利西亞語

喬治亞語

格魯吉亞語 - 舊

德文

古希臘語 (-1453)

現代希臘文(1453-)

古吉拉特語

海地

希伯來文

印地語

匈牙利

冰島語

印尼

因紐特語

愛爾蘭語

義大利語

義大利語 - 老

日本人

爪哇語

卡納達語

哈薩克語

高棉語

韓國人

庫德

吉爾吉斯斯坦

寮國

拉丁

拉脫維亞語

立陶宛語

馬其頓語

馬來語

馬拉雅拉姆語

馬爾他語

馬拉地語

尼泊爾語

挪威

奧裡亞語

普什圖語

波斯語

拋光

葡萄牙語

旁遮普語

羅馬尼亞語

俄文

梵文

塞爾維亞

塞爾維亞語(拉丁語)

僧伽羅語

斯洛伐克語

斯洛維尼亞語

西班牙語

西班牙語 - 舊

斯瓦希里語

瑞典

敘利亞語

他加祿語

塔吉克

泰米爾語

泰盧固語

泰國

提格里尼亞

土耳其

烏克蘭

烏爾都語

維吾爾族

烏茲別克語

烏茲別克語(西里爾字母)

越南語

威爾斯語

意第緒語

三星設備註釋

• 在 Samsung Galaxy 裝置上,您可能需要長按選單按鈕才能設定首選項。

• 如果取消選取“標準對焦模式”,您可能會獲得更好的效果。

最新版本 0.6.0 的新增功能

最後更新於 2017 年 8 月 24 日 0.6.0 版新增內容(2017 年 8 月 13 日):
• 將所有訓練資料打包在擴充檔案中,而不是在執行時單獨下載。
• 新增了 47 個新腳本的 OCR 支援。
• 升級為使用Tesseract v3.05。
• 將應用程式內翻譯替換為連結至 Google 翻譯的按鈕。
• 新增複製按鈕作為長按已識別文字的替代方法。
• 現在需要Google Play 服務。
• 現在需要Android 2.3+。

閱讀更多信息

用戶還查看了

看全部

您可能感興趣

看全部

更多類似應用

看全部

更多Level應用

看全部