แอปทดลองสำหรับการรู้จำอักขระด้วยแสง (OCR)
แอปทดลองสำหรับการรู้จำอักขระด้วยแสง (OCR)
แอปนี้เป็นแอปทดลองที่ฉันพัฒนาขึ้นเมื่อหลายปีก่อนซึ่งสาธิตการใช้เครื่องมือ Tesseract OCR เพื่อจดจำข้อความในภาพที่ถ่ายโดยกล้องของอุปกรณ์
แอปนี้เรียกใช้ OCR บนอุปกรณ์ของคุณ โดยไม่ต้องอัปโหลดรูปภาพของคุณไปยังเซิร์ฟเวอร์ และเหมาะสำหรับการจดจำคำแต่ละคำหรือวลีสั้นๆ ของข้อความ แต่แอปนี้มีไว้สำหรับผู้ที่เป็นงานอดิเรกและนักพัฒนาซอฟต์แวร์ที่สนใจ OCR ไม่ใช่สำหรับผู้ชมทั่วไป
ตรงกันข้ามกับ Mobile Vision API ของ Google แอปนี้สามารถจดจำข้อความที่พิมพ์ด้วยแบบอักษรที่ไม่ใช่ภาษาละตินขณะออฟไลน์ เพื่อให้บรรลุเป้าหมายนี้ แอปนี้จึงรวมข้อมูลการฝึกอบรมสำหรับหลายภาษาจำนวนมากผิดปกติ ข้อมูลการฝึกอบรมนี้จัดเก็บไว้ในโทรศัพท์ของคุณ และแอปนี้ใช้พื้นที่มากกว่าแอปทั่วไปมาก
แอปนี้ไม่มีการประมวลผลภาพล่วงหน้าก่อนที่จะส่งมอบเฟรมภาพที่ถ่ายให้กับ Tesseract ดังนั้นแอปจึงไม่ได้รับการปรับแต่งสำหรับกรณีการใช้งานเฉพาะใดๆ และด้วยเหตุนี้ ความแม่นยำและความเร็วในการจดจำจึงขึ้นอยู่กับปัจจัยสถานการณ์ เช่น มุมมอง แสง และประเภทตัวอักษร
ซอร์สโค้ดสำหรับแอปนี้มีอยู่ใน GitHub (โดยมีการเปลี่ยนแปลงเล็กน้อยเพื่อรองรับข้อจำกัดขนาดไฟล์ GitHub) รหัสสำหรับแอพนี้คือการรวมกันของรหัสที่เกี่ยวข้องกับกล้องโอเพ่นซอร์สจากโครงการเครื่องสแกนบาร์โค้ด ZXing และรหัสการรู้จำอักขระแบบโอเพ่นซอร์สจากโครงการ Tesseract OCR
การจับข้อความ
การจับภาพช็อตเดียวตามค่าเริ่มต้นจะรัน OCR บนภาพสแนปชอตที่ถ่ายเมื่อคุณคลิกปุ่มชัตเตอร์ เช่นเดียวกับภาพถ่ายทั่วไป
เมื่อทำเครื่องหมายที่ช่อง "ดูตัวอย่างต่อเนื่อง" แอปจะแสดงไดนามิกแบบเรียลไทม์ของสิ่งที่อุปกรณ์รับรู้ข้างช่องมองภาพของกล้อง โหมดดูตัวอย่างต่อเนื่องทำงานได้ดีที่สุดบนอุปกรณ์ที่รวดเร็ว
การใช้แอพนี้
• ชี้อุปกรณ์ไปที่บริเวณข้อความเล็กๆ แล้วแตะปุ่มชัตเตอร์บนหน้าจอเพื่อเริ่ม OCR
• สำหรับการจดจำอักขระภาษาจีน/ญี่ปุ่น/เกาหลี แต่ละตัว ให้ตั้งค่าโหมดการแบ่งส่วนหน้าเป็น "อักขระตัวเดียว"
ความแม่นยำในการรับรู้
• ปัจจัยต่างๆ อาจทำให้ OCR ล้มเหลว: แสงสว่างที่ไม่สม่ำเสมอ ข้อความที่มีสไตล์ หรือข้อความที่ไม่มีคอนทราสต์จากพื้นหลังเพียงพอ พยายามให้มีแสงสว่างที่ดี
• ถืออุปกรณ์ให้นิ่ง และให้แน่ใจว่าภาพอยู่ในโฟกัส
• หากคุณต้องการสแกนข้อความจำนวนมากหรือทั้งเอกสาร ให้ลองใช้แอปสแกนเอกสาร เช่น Text Fairy แทน
ภาษา
• แอปนี้รองรับหลายภาษา/สคริปต์ที่ Google แปลภาษาไม่รู้จัก
• ภาษาที่รองรับสำหรับ OCR:
ชาวแอฟริกัน
แอลเบเนีย
อัมฮาริก
ภาษาอาหรับ
อัสสัม
อาเซอร์ไบจัน
อาเซอร์ไบจาน (ซีริลลิก)
บาสก์
เบลารุส
เบงกาลี
บอสเนีย
บัลแกเรีย
พม่า
คาตาลัน
เซบู
เชอโรกี
จีน (ตัวย่อ)
จีน (ดั้งเดิม)
โครเอเชีย
เช็ก
ภาษาเดนมาร์ก
ภาษาดัตช์
ซองคา
ภาษาอังกฤษ
อังกฤษ, กลาง (11.00-15.00)
เอสเปรันโต
เอสโตเนีย
ภาษาฟินแลนด์
ตรงไปตรงมา
ภาษาฝรั่งเศส
ฝรั่งเศส, กลาง (ค.ศ. 1400-1600)
กาลิเซีย
จอร์เจีย
จอร์เจีย - เก่า
เยอรมัน
กรีก โบราณ (-1453)
กรีก สมัยใหม่ (1453-)
คุชราต
ชาวเฮติ
ภาษาฮีบรู
ฮินดี
ภาษาฮังการี
ไอซ์แลนด์
ชาวอินโดนีเซีย
อินุกติตุต
ไอริช
ภาษาอิตาลี
อิตาลี - เก่า
ญี่ปุ่น
ชวา
กันนาดา
คาซัค
เขมร
เกาหลี
เคิร์ด
คีร์กีซ
ลาว
ละติน
ลัตเวีย
ลิทัวเนีย
มาซิโดเนีย
มาเลย์
มาลายาลัม
ภาษามอลตา
ภาษามราฐี
เนปาล
ภาษานอร์เวย์
โอริยา
ปาสโต้
เปอร์เซีย
ขัด
โปรตุเกส
ปัญจาบ
โรมาเนีย
ภาษารัสเซีย
ภาษาสันสกฤต
เซอร์เบีย
เซอร์เบีย (ละติน)
สิงหล
สโลวัก
ภาษาสโลเวเนีย
สเปน
สเปน - เก่า
สวาฮีลี
ภาษาสวีเดน
ซีเรียค
ตากาล็อก
ทาจิกิสถาน
ทมิฬ
เตลูกู
แบบไทย
ทิเบต
ทิกริญญา
ภาษาตุรกี
ภาษายูเครน
ภาษาอูรดู
ชาวอุยกูร์
อุซเบก
อุซเบก (ซีริลลิก)
ภาษาเวียดนาม
เวลส์
ภาษายิดดิช
หมายเหตุอุปกรณ์ SAMSUNG
• บนอุปกรณ์ Samsung Galaxy คุณอาจต้องกดปุ่มเมนูค้างไว้เพื่อตั้งค่ากำหนด
• คุณอาจได้รับผลลัพธ์ที่ดีขึ้นหากคุณยกเลิกการเลือก "โหมดโฟกัสมาตรฐาน"
อ่านเพิ่มเติม