halaman depanaplikasikantor bisnis

Aplikasi eksperimental untuk pengenalan karakter optik (OCR)

Aplikasi eksperimental untuk pengenalan karakter optik (OCR)

Aplikasi ini adalah aplikasi eksperimental yang saya kembangkan beberapa tahun lalu yang mendemonstrasikan penggunaan mesin Tesseract OCR untuk mengenali teks dalam gambar yang diambil oleh kamera perangkat.

Aplikasi ini menjalankan OCR di perangkat Anda – tanpa mengunggah gambar ke server – dan cocok untuk mengenali setiap kata atau frasa teks pendek, namun aplikasi ini ditujukan untuk penghobi dan pengembang perangkat lunak yang tertarik dengan OCR dan bukan untuk khalayak umum.

Berbeda dengan Mobile Vision API milik Google, aplikasi ini mampu mengenali teks yang dicetak dalam font berbasis non-Latin saat offline. Untuk mencapai hal ini, aplikasi ini menggabungkan data pelatihan dalam jumlah yang luar biasa besar untuk beberapa bahasa. Data pelatihan ini disimpan di ponsel Anda, dan aplikasi ini memakan lebih banyak ruang daripada aplikasi biasa.

Tidak ada pra-pemrosesan gambar yang dilakukan oleh aplikasi ini sebelum menyerahkan bingkai gambar yang diambil ke Tesseract, sehingga aplikasi tidak disesuaikan untuk kasus penggunaan tertentu dan, akibatnya, keakuratan dan kecepatan pengenalannya sangat bergantung pada faktor situasional seperti perspektif, pencahayaan, dan jenis font.

Kode sumber untuk aplikasi ini tersedia di GitHub (dengan sedikit perubahan untuk mengakomodasi batasan ukuran file GitHub). Kode untuk aplikasi ini adalah kombinasi kode sumber terbuka terkait kamera dari proyek pemindai kode batang ZXing dan kode pengenalan karakter optik sumber terbuka dari proyek Tesseract OCR.

TANGKAP TEKS

Pengambilan bidikan tunggal default menjalankan OCR pada gambar snapshot yang diambil saat Anda mengeklik tombol rana, seperti foto biasa.

Ketika kotak centang "pratinjau berkelanjutan" dicentang, aplikasi menampilkan tampilan dinamis dan real-time tentang apa yang dikenali perangkat tepat di samping jendela bidik kamera. Mode pratinjau berkelanjutan berfungsi paling baik pada perangkat yang cepat.

MENGGUNAKAN APLIKASI INI

• Arahkan perangkat ke area kecil teks dan sentuh tombol rana pada layar untuk memulai OCR.

• Untuk mengenali masing-masing karakter Cina/Jepang/Korea, atur mode segmentasi halaman ke "karakter tunggal".

AKURASI PENGAKUAN

• Berbagai faktor dapat menyebabkan kegagalan OCR: pencahayaan tidak merata, teks bergaya, atau teks tidak memiliki kontras yang cukup dengan latar belakang. Usahakan memiliki pencahayaan yang bagus.

• Pegang perangkat dengan stabil dan pastikan gambar berada dalam fokus.

• Jika Anda perlu memindai sebagian besar teks atau seluruh dokumen, cobalah aplikasi pemindaian dokumen seperti Text Fairy.

BAHASA

• Aplikasi ini mendukung beberapa bahasa/skrip yang tidak dikenali oleh Google Translate.

• Bahasa yang didukung untuk OCR:

Afrikanas

bahasa Albania

Amharik

Arab

orang Assam

Azerbaijan

Azerbaijan (Sirilik)

Basque

Belarusia

Benggala

Bosnia

Bulgaria

Birma

Katalan

Cebuano

Cherokee

Cina (Sederhana)

Cina (Tradisional)

Kroasia

Ceko

Denmark

Belanda

Dzongkha

Bahasa inggris

Inggris, Tengah (1100-1500)

Esperanto

Estonia

Finlandia

orang Franka

Perancis

Perancis, Tengah (ca. 1400-1600)

Galisia

orang Georgia

Georgia - Tua

Jerman

Yunani, Kuno (-1453)

Yunani, Modern (1453-)

Gujarati

Haiti

Ibrani

Hindi

Hongaria

Islandia

Indonesia

Inuktitut

Irlandia

Italia

Italia - Tua

Jepang

Jawa

Kannada

Kazakh

Khmer

Korea

Kurdi

Kirgistan

Laos

Latin

Latvia

Lithuania

Makedonia

Melayu

Malayalam

Malta

Marathi

Nepal

Norwegia

Oriya

pasto

Persia

Polandia

Portugis

Punjabi

Rumania

Rusia

Sansekerta

Serbia

Serbia (Latin)

Sinhala

bahasa Slowakia

Slovenia

Spanyol

Spanyol - Tua

Swahili

Swedia

Syria

bahasa Tagalog

Tajik

Tamil

Telugu

Thai

Tibet

harimaunya

Turki

Ukraina

bahasa Urdu

Uyghur

Uzbekistan

Uzbekistan (Sirilik)

Vietnam

bahasa Wales

Yiddi

CATATAN PERANGKAT SAMSUNG

• Pada perangkat Samsung Galaxy, Anda mungkin perlu menekan lama tombol menu untuk mengatur preferensi.

• Anda mungkin mendapatkan hasil yang lebih baik jika Anda tidak mencentang "Mode fokus standar".

Yang Baru di Versi Terbaru 0.6.0

Terakhir diperbarui pada 24 Agustus 2017 Baru di versi 0.6.0 (13 Agustus 2017):
• Mengemas semua data pelatihan dalam file ekspansi alih-alih mengunduh satu per satu pada waktu proses.
• Menambahkan dukungan OCR untuk 47 skrip baru.
• Ditingkatkan untuk menggunakan Tesseract v3.05.
• Mengganti terjemahan dalam aplikasi dengan tombol yang tertaut ke Google Terjemahan.
• Menambahkan tombol salin sebagai alternatif untuk menekan lama teks yang dikenali.
• Layanan Google Play sekarang diperlukan.
• Android 2.3+ kini diperlukan.

Baca selengkapnya

Pengguna juga melihat

Lihat semuanya

Anda mungkin tertarik

Lihat semuanya

Game serupa lainnya

Lihat semuanya

Lebih banyak permainan Level

Lihat semuanya