เทคโนโลยี OCR และเหตุผลที่ควรนำไปใช้งาน

OCR หรือ Optical Character Recognition คือกระบวนการแปลงไฟล์ภาพเอกสารให้เป็นไฟล์ข้อความอัตโนมัติในรูปแบบดิจิทัล ซึ่งในการประมวลผลข้อมูลของ OCR จะมีการดึงข้อมูลตัวอักษรออกมา และทำการจำแนกตัวอักษรเหล่านั้นได้ แต่สิ่งที่ OCR ไม่สามารถทำได้ คือการอ่านวัตถุ หรือเข้าใจความหมาย ตัวอย่างเช่น ถ้าเราทำการสแกนคำศัพท์ โปรแกรม OCR ก็จะทำการอ่าน และเรียนรู้ตัวข้อความเหล่านั้น แต่ไม่ได้รู้ความหมายของคำนั้น

ประเภทของการทำ OCR

  1. การรู้จำอักษรแบบออนไลน์ (Online Character Recognition)

วิธีการอินพุตข้อมูลจะได้มาจากปากกาอิเล็กทรอนิกส์ ที่ใช้กับเครื่องคอมพิวเตอร์มือถือ ส่วนการวิเคราะห์ตัวอักษร จะทำในขณะที่มีการลากเส้น เพื่อเขียนตัวอักษร (ออนไลน์) เมื่อเปรียบเทียบกับการรู้จำลายมือเขียนแบบออฟไลน์ กลุ่มนี้จะง่ายกว่า เพราะจะได้ข้อมูลเพิ่มเติมเกี่ยวกับทิศทาง และลำดับการลากเส้นมาช่วย OCR กลุ่มนี้มักมาพร้อมกับอุปกรณ์การเขียนที่มีการกำหนดพื้นที่ให้อินพุตข้อมูล โดยส่วนใหญ่มักต้องเขียนทีละตัวอักษร โดยมีรหัสพิเศษเพื่อใช้ในการเขียนตัวอักษรแต่ละตัว

2. การรู้จำอักษรแบบออฟไลน์ (Offline Character Recognition)

อินพุตของระบบคือภาพตัวอักษร แบบพิมพ์หรือแบบเขียนที่ได้จากเครื่องสแกน โดยจะมีทั้งตัวอักษรแบบติดกันเป็นกลุ่ม และแบบเดี่ยว ก่อนที่โปรแกรมจะสามารถบอกได้ว่ารูปภาพที่ส่งเข้าไปประกอบด้วยตัวอักษรอะไรบ้าง ก็จะต้องผ่านหลายขั้นตอน ตั้งแต่การปรับแต่ง, จัดเตรียมข้อมูล และขั้นตอนการรู้จำ ขั้นตอนเหล่านี้มีความสำคัญต่อประสิทธิภาพโดยรวมของระบบ โดยเฉพาะอย่างยิ่งขั้นตอนการรู้จำจะเป็นหัวใจหลักของการทำ OCR เพราะเป็นส่วนที่จะแสดงว่ารูปตัวอักษรเป็นอักษรอะไร 

หากมีความผิดพลาดเกิดขึ้นในส่วนใดส่วนหนึ่ง ก็จะส่งผลกระทบไปยังส่วนถัดไปของระบบด้วย แน่นอนว่าเอาต์พุตที่ได้มาก็จะไม่ถูกต้องทั้งหมด 100 %

เพื่อเพิ่มความถูกต้อง ผู้ใช้โปรแกรมสามารถตรวจสอบและแก้ไขข้อความได้ โดยโปรแกรมจะทำการตรวจสอบความถูกต้องของการสะกดคำและไวยากรณ์ภาษาให้เบื้องต้น พร้อมกับแสดงเครื่องหมายบางอย่างเพื่อบอกให้ผู้ใช้ทราบว่าคำนี้อาจไม่ถูกต้อง แต่ก็ขึ้นอยู่กับผู้ใช้งานอีกเช่นกันว่าต้องการแก้ไขคำเหล่านี้ที่โปรแกรมแจ้งเตือนหรือไม่

เหตุผลที่ควรนำเทคโนโลยี OCR ไปใช้งาน

การนำเอกสารมาทำ OCR มีประโยชน์ดังนี้

  • ไม่ต้องป้อนข้อมูลเพื่อสร้างเอกสารเอง จึงช่วยประหยัดเวลาในการสร้างเอกสาร
  • ประหยัดพื้นที่ในการจัดเก็บข้อมูล และง่ายต่อการค้นหา เพราะเอกสารถูกแปลงเป็นไฟล์อิเล็กทรอนิกส์
  • แก้ไขหรือปรับแต่งไฟล์ได้ง่ายขึ้นในรูปแบบของไฟล์ Word หรือ Excel
  • เก็บข้อมูลลงในฐานข้อมูล (Database) ได้ และส่งข้อมูล (Interface) ให้กับระบบอื่นได้ง่ายขึ้น
  • ประยุกต์ใช้ OCR กับ RPA (Robotic Process Automation) เพื่อสร้างซอฟต์แวร์หุ่นยนต์ให้ช่วยทำงานซ้ำๆ แทนมนุษย์ได้

บทความที่เกี่ยวข้อง : ระบบบริหารจัดการเอกสารอิเล็กทรอนิกส์และการใช้เทคโนโลยี OCR