Главнаяприложениеделовой офис

Экспериментальное приложение для оптического распознавания символов (OCR)

Экспериментальное приложение для оптического распознавания символов (OCR)

Это экспериментальное приложение, разработанное мной несколько лет назад, которое демонстрирует использование механизма OCR Tesseract для распознавания текста на изображениях, снятых камерой устройства.

Это приложение запускает распознавание текста на вашем устройстве – без загрузки изображений на сервер – и подходит для распознавания отдельных слов или коротких фраз текста, но это приложение предназначено для любителей и разработчиков программного обеспечения, заинтересованных в распознавании текста, а не для широкой аудитории.

В отличие от Google Mobile Vision API, это приложение способно распознавать текст, напечатанный нелатинскими шрифтами, в автономном режиме. Для достижения этой цели это приложение включает в себя необычайно большой объем обучающих данных для нескольких языков. Данные тренировок хранятся на вашем телефоне, и это приложение занимает гораздо больше места, чем обычные приложения.

Это приложение не выполняет предварительную обработку изображения перед передачей захваченных кадров изображения в Tesseract, поэтому приложение не настроено для какого-либо конкретного случая использования, и, как следствие, точность и скорость его распознавания сильно зависят от ситуационных факторов, таких как перспектива, освещение и тип шрифта.

Исходный код этого приложения доступен на GitHub (с небольшими изменениями, позволяющими учесть ограничения на размер файлов GitHub). Код этого приложения представляет собой комбинацию кода с открытым исходным кодом, связанного с камерой, из проекта сканера штрих-кода ZXing и кода оптического распознавания символов с открытым исходным кодом из проекта Tesseract OCR.

ЗАХВАТ ТЕКСТА

При покадровом захвате по умолчанию выполняется оптическое распознавание изображения на снимке, сделанном при нажатии кнопки спуска затвора, как на обычной фотографии.

Когда флажок «непрерывный предварительный просмотр» установлен, приложение отображает в реальном времени динамическое отображение того, что распознает устройство, прямо рядом с видоискателем камеры. Режим непрерывного предварительного просмотра лучше всего работает на быстром устройстве.

ИСПОЛЬЗОВАНИЕ ЭТОГО ПРИЛОЖЕНИЯ

• Наведите устройство на небольшой участок текста и коснитесь экранной кнопки спуска затвора, чтобы запустить распознавание текста.

• Для распознавания отдельных китайских/японских/корейских символов установите режим сегментации страницы на «один символ».

ТОЧНОСТЬ РАСПОЗНАВАНИЯ

• К сбоям в работе оптического распознавания символов могут привести различные факторы: неравномерное освещение, стилизованный текст или текст с недостаточным контрастом по отношению к фону. Постарайтесь обеспечить хорошее освещение.

• Держите устройство неподвижно и убедитесь, что изображение в фокусе.

• Если вам нужно отсканировать большой блок текста или весь документ, попробуйте вместо этого приложение для сканирования документов, например Text Fairy.

ЯЗЫКИ

• Это приложение поддерживает несколько языков/скриптов, не распознаваемых Google Translate.

• Поддерживаемые языки для оптического распознавания символов:

африкаанс

албанский

амхарский

арабский

ассамский

азербайджанский

Азербайджанский (кириллица)

Баскский

белорусский

Бенгальский

Боснийский

болгарский

бирманский

каталонский

кебуано

Чероки

Китайский (упрощенный)

Китайский (традиционный)

хорватский

чешский

датский

Голландский

Дзонгка

Английский

Английский, Средний (1100-1500)

эсперанто

эстонский

финский

франкский

Французский

Французский, Средний (ок. 1400-1600)

галисийский

грузинский

Грузинский - Старый

немецкий

Греческий, Древний (-1453)

Греческий, современный (1453-)

Гуджарати

гаитянский

иврит

хинди

венгерский

исландский

индонезийский

Инуктитут

ирландский

итальянский

Итальянский - Старый

японский

яванский

Каннада

казахский

кхмерский

корейский

курдский

киргизский

Лаосский

латинский

латышский

литовский

македонский

малайский

малаялам

мальтийский

Маратхи

непальский

норвежский

Ория

пушту

персидский

Польский

португальский

панджаби

румынский

Русский

санскрит

сербский

Сербский (латиница)

сингальский

словацкий

словенский

испанский

Испанский – Старый

суахили

Шведский

сирийский

Тагальский

таджикский

тамильский

телугу

тайский

тибетский

Тигринья

турецкий

Украинский

урду

уйгурский

Узбекский

Узбекский (кириллица)

вьетнамский

валлийский

идиш

ПРИМЕЧАНИЯ К УСТРОЙСТВУ SAMSUNG

• На устройствах Samsung Galaxy вам может потребоваться нажать и удерживать кнопку меню, чтобы установить настройки.

• Вы можете получить лучшие результаты, если снимите флажок «Стандартный режим фокусировки».

Что нового в последней версии 0.6.0

Последнее обновление: 24 августа 2017 г. Новое в версии 0.6.0 (13 августа 2017 г.):
• Все данные обучения упакованы в файл расширения вместо загрузки по отдельности во время выполнения.
• Добавлена ​​поддержка распознавания текста для 47 новых скриптов.
• Обновлено для использования Tesseract v3.05.
• Перевод в приложении заменен кнопкой со ссылкой на Google Translate.
• Добавлена ​​кнопка копирования в качестве альтернативы длительному нажатию распознанного текста.
• Теперь требуются службы Google Play.
• Теперь требуется Android 2.3+.

Читать далее

Пользователи также смотрели

Посмотреть все

Вам может понравиться

Посмотреть все

Еще похожие игры

Посмотреть все

Больше игр уровня

Посмотреть все