Aplikasi eksperimental untuk pengenalan karakter optik (OCR)
Aplikasi eksperimental untuk pengenalan karakter optik (OCR)
Aplikasi ini adalah aplikasi eksperimental yang saya kembangkan beberapa tahun lalu yang mendemonstrasikan penggunaan mesin Tesseract OCR untuk mengenali teks dalam gambar yang diambil oleh kamera perangkat.
Aplikasi ini menjalankan OCR di perangkat Anda – tanpa mengunggah gambar ke server – dan cocok untuk mengenali setiap kata atau frasa teks pendek, namun aplikasi ini ditujukan untuk penghobi dan pengembang perangkat lunak yang tertarik dengan OCR dan bukan untuk khalayak umum.
Berbeda dengan Mobile Vision API milik Google, aplikasi ini mampu mengenali teks yang dicetak dalam font berbasis non-Latin saat offline. Untuk mencapai hal ini, aplikasi ini menggabungkan data pelatihan dalam jumlah yang luar biasa besar untuk beberapa bahasa. Data pelatihan ini disimpan di ponsel Anda, dan aplikasi ini memakan lebih banyak ruang daripada aplikasi biasa.
Tidak ada pra-pemrosesan gambar yang dilakukan oleh aplikasi ini sebelum menyerahkan bingkai gambar yang diambil ke Tesseract, sehingga aplikasi tidak disesuaikan untuk kasus penggunaan tertentu dan, akibatnya, keakuratan dan kecepatan pengenalannya sangat bergantung pada faktor situasional seperti perspektif, pencahayaan, dan jenis font.
Kode sumber untuk aplikasi ini tersedia di GitHub (dengan sedikit perubahan untuk mengakomodasi batasan ukuran file GitHub). Kode untuk aplikasi ini adalah kombinasi kode sumber terbuka terkait kamera dari proyek pemindai kode batang ZXing dan kode pengenalan karakter optik sumber terbuka dari proyek Tesseract OCR.
TANGKAP TEKS
Pengambilan bidikan tunggal default menjalankan OCR pada gambar snapshot yang diambil saat Anda mengeklik tombol rana, seperti foto biasa.
Ketika kotak centang "pratinjau berkelanjutan" dicentang, aplikasi menampilkan tampilan dinamis dan real-time tentang apa yang dikenali perangkat tepat di samping jendela bidik kamera. Mode pratinjau berkelanjutan berfungsi paling baik pada perangkat yang cepat.
MENGGUNAKAN APLIKASI INI
• Arahkan perangkat ke area kecil teks dan sentuh tombol rana pada layar untuk memulai OCR.
• Untuk mengenali masing-masing karakter Cina/Jepang/Korea, atur mode segmentasi halaman ke "karakter tunggal".
AKURASI PENGAKUAN
• Berbagai faktor dapat menyebabkan kegagalan OCR: pencahayaan tidak merata, teks bergaya, atau teks tidak memiliki kontras yang cukup dengan latar belakang. Usahakan memiliki pencahayaan yang bagus.
• Pegang perangkat dengan stabil dan pastikan gambar berada dalam fokus.
• Jika Anda perlu memindai sebagian besar teks atau seluruh dokumen, cobalah aplikasi pemindaian dokumen seperti Text Fairy.
BAHASA
• Aplikasi ini mendukung beberapa bahasa/skrip yang tidak dikenali oleh Google Translate.
• Bahasa yang didukung untuk OCR:
Afrikanas
bahasa Albania
Amharik
Arab
orang Assam
Azerbaijan
Azerbaijan (Sirilik)
Basque
Belarusia
Benggala
Bosnia
Bulgaria
Birma
Katalan
Cebuano
Cherokee
Cina (Sederhana)
Cina (Tradisional)
Kroasia
Ceko
Denmark
Belanda
Dzongkha
Bahasa inggris
Inggris, Tengah (1100-1500)
Esperanto
Estonia
Finlandia
orang Franka
Perancis
Perancis, Tengah (ca. 1400-1600)
Galisia
orang Georgia
Georgia - Tua
Jerman
Yunani, Kuno (-1453)
Yunani, Modern (1453-)
Gujarati
Haiti
Ibrani
Hindi
Hongaria
Islandia
Indonesia
Inuktitut
Irlandia
Italia
Italia - Tua
Jepang
Jawa
Kannada
Kazakh
Khmer
Korea
Kurdi
Kirgistan
Laos
Latin
Latvia
Lithuania
Makedonia
Melayu
Malayalam
Malta
Marathi
Nepal
Norwegia
Oriya
pasto
Persia
Polandia
Portugis
Punjabi
Rumania
Rusia
Sansekerta
Serbia
Serbia (Latin)
Sinhala
bahasa Slowakia
Slovenia
Spanyol
Spanyol - Tua
Swahili
Swedia
Syria
bahasa Tagalog
Tajik
Tamil
Telugu
Thai
Tibet
harimaunya
Turki
Ukraina
bahasa Urdu
Uyghur
Uzbekistan
Uzbekistan (Sirilik)
Vietnam
bahasa Wales
Yiddi
CATATAN PERANGKAT SAMSUNG
• Pada perangkat Samsung Galaxy, Anda mungkin perlu menekan lama tombol menu untuk mengatur preferensi.
• Anda mungkin mendapatkan hasil yang lebih baik jika Anda tidak mencentang "Mode fokus standar".
Baca selengkapnya