애플리케이션영업소

광학 문자 인식(OCR)을 위한 실험적 앱

광학 문자 인식(OCR)을 위한 실험적 앱

이 앱은 장치 카메라로 캡처한 이미지의 텍스트를 인식하기 위해 Tesseract OCR 엔진을 사용하는 방법을 보여주기 위해 몇 년 전에 개발한 실험적인 앱입니다.

이 앱은 이미지를 서버에 업로드하지 않고 장치에서 OCR을 실행하며 개별 단어나 텍스트의 짧은 문구를 인식하는 데 적합합니다. 그러나 이 앱은 OCR에 관심이 있는 애호가 및 소프트웨어 개발자를 위한 것이지 일반 청중을 위한 것은 아닙니다.

Google의 Mobile Vision API와 달리 이 앱은 오프라인 상태에서 라틴어 기반이 아닌 글꼴로 인쇄된 텍스트를 인식할 수 있습니다. 이를 달성하기 위해 이 앱은 여러 언어에 대해 비정상적으로 많은 양의 교육 데이터를 통합합니다. 이 훈련 데이터는 휴대폰에 저장되며, 이 앱은 일반 앱보다 훨씬 더 많은 공간을 차지합니다.

이 앱은 캡처된 이미지 프레임을 Tesseract에 전달하기 전에 이미지 전처리를 수행하지 않으므로 앱은 특정 사용 사례에 맞게 조정되지 않으며 결과적으로 인식 정확도와 속도는 원근감과 같은 상황적 요인에 따라 크게 달라집니다. 조명, 글꼴 유형.

이 앱의 소스 코드는 GitHub에서 사용할 수 있습니다(GitHub 파일 크기 제한을 수용하기 위해 약간 변경됨). 이 앱의 코드는 ZXing 바코드 스캐너 프로젝트의 오픈 소스 카메라 관련 코드와 Tesseract OCR 프로젝트의 오픈 소스 광학 문자 인식 코드의 조합입니다.

텍스트 캡처

기본 단일 촬영 캡처는 일반 사진처럼 셔터 버튼을 클릭할 때 캡처된 스냅샷 이미지에 OCR을 실행합니다.

"연속 미리보기" 확인란을 선택하면 앱은 카메라 뷰파인더 바로 옆에 장치가 인식하는 내용을 동적으로 실시간으로 표시합니다. 연속 미리보기 모드는 빠른 장치에서 가장 잘 작동합니다.

이 앱 사용

• 장치를 텍스트의 작은 영역으로 가리키고 화면 셔터 버튼을 터치하여 OCR을 시작합니다.

• 개별 중국어/일본어/한국어 문자를 인식하려면 페이지 분할 모드를 "단일 문자"로 설정하세요.

인식 정확도

• 고르지 못한 조명, 스타일화된 텍스트, 배경과의 대비가 충분하지 않은 텍스트 등 다양한 요인으로 인해 OCR이 실패할 수 있습니다. 좋은 조명을 사용하십시오.

• 장치를 흔들리지 않게 잡고 사진의 초점이 맞는지 확인하십시오.

• 큰 텍스트 블록이나 전체 문서를 스캔해야 하는 경우 대신 Text Fairy와 같은 문서 스캔 앱을 사용해 보십시오.

언어

• 이 앱은 Google 번역에서 인식하지 못하는 여러 언어/스크립트를 지원합니다.

• OCR에 지원되는 언어:

아프리카 어

알바니아

암하라어

아라비아 말

아삼어

아제르바이잔

아제르바이잔어(키릴 자모)

바스크 사람

벨로루시어

벵골 사람

보스니아어

불가리아 사람

버마 사람

카탈로니아 사람

세부아노어

체로키어

중국어(간체)

중국어(번체)

크로아티아어

체코 사람

덴마크 말

네덜란드 사람

종카어

영어

영어, 중세(1100-1500)

에스페란토 말

에스토니아 사람

핀란드어

프랑크족의

프랑스 국민

프랑스어, 중세(약 1400-1600)

갈리시아어

그루지야 사람

그루지야어-오래된

독일 사람

그리스, 고대(-1453)

그리스, 현대(1453-)

구자라트어

아이티 섬 사람

헤브라이 사람

힌디 어

헝가리 인

아이슬란드어

인도네시아 인

이누이트어

아일랜드

이탈리아 사람

이탈리아어 - 오래된

일본어

자바어

칸나다어

카자흐어

크메르어

한국인

쿠르드어

키르기스어

라오스

라틴어

라트비아 사람

리투아니아 사람

마케도니아 어

말레이 사람

말라얄람어

몰티즈

마라티어

네팔어

노르웨이 인

오리야어

파슈토어

페르시아 인

광택

포르투갈 인

펀자브어

루마니아 사람

러시아인

산스크리트

세르비아 사람

세르비아어(라틴어)

신할라어

슬로바키아 사람

슬로베니아

스페인 사람

스페인어 - 구식

스와힐리어

스웨덴어

시리아어

타갈로그어

타직어

타밀 사람

텔루구어

태국어

티베트어

티그리냐

터키어

우크라이나 말

우르두어

위구르어

우즈벡어

우즈벡어(키릴 문자)

베트남 사람

웨일스 말

이디시어

삼성 디바이스 노트

• Samsung Galaxy 장치에서는 기본 설정을 지정하려면 메뉴 버튼을 길게 눌러야 할 수도 있습니다.

• "표준 초점 모드"를 선택 취소하면 더 나은 결과를 얻을 수 있습니다.

최신 버전 0.6.0의 새로운 기능

2017년 8월 24일에 마지막 업데이트됨 버전 0.6.0의 새로운 기능(2017년 8월 13일):
• 런타임에 개별적으로 다운로드하는 대신 모든 교육 데이터를 확장 파일에 패키지화했습니다.
• 47개의 새로운 스크립트에 대한 OCR 지원이 추가되었습니다.
• Tesseract v3.05를 사용하도록 업그레이드되었습니다.
• 인앱 번역을 Google 번역에 연결되는 버튼으로 대체했습니다.
• 인식된 텍스트를 길게 누르는 대신 복사 버튼을 추가했습니다.
• 이제 Google Play 서비스가 필요합니다.
• 이제 Android 2.3 이상이 필요합니다.

더 읽어보세요

사용자들이 함께 본 항목

모두 보기

추천 콘텐츠

모두 보기

유사한 게임 더보기

모두 보기

더 많은 레벨 게임

모두 보기