OCR หรือ Optical Character Recognition คือกระบวนการแปลงไฟล์ภาพเอกสารให้เป็นไฟล์ข้อความอัตโนมัติในรูปแบบดิจิทัล ซึ่งในการประมวลผลข้อมูลของ OCR จะมีการดึงข้อมูลตัวอักษรออกมา และทำการจำแนกตัวอักษรเหล่านั้นได้ แต่สิ่งที่ OCR ไม่สามารถทำได้ คือการอ่านวัตถุ หรือเข้าใจความหมาย ตัวอย่างเช่น ถ้าเราทำการสแกนคำศัพท์ โปรแกรม OCR ก็จะทำการอ่าน และเรียนรู้ตัวข้อความเหล่านั้น แต่ไม่ได้รู้ความหมายของคำนั้น
ประเภทของการทำ OCR
- การรู้จำอักษรแบบออนไลน์ (Online Character Recognition)
วิธีการอินพุตข้อมูลจะได้มาจากปากกาอิเล็กทรอนิกส์ ที่ใช้กับเครื่องคอมพิวเตอร์มือถือ ส่วนการวิเคราะห์ตัวอักษร จะทำในขณะที่มีการลากเส้น เพื่อเขียนตัวอักษร (ออนไลน์) เมื่อเปรียบเทียบกับการรู้จำลายมือเขียนแบบออฟไลน์ กลุ่มนี้จะง่ายกว่า เพราะจะได้ข้อมูลเพิ่มเติมเกี่ยวกับทิศทาง และลำดับการลากเส้นมาช่วย OCR กลุ่มนี้มักมาพร้อมกับอุปกรณ์การเขียนที่มีการกำหนดพื้นที่ให้อินพุตข้อมูล โดยส่วนใหญ่มักต้องเขียนทีละตัวอักษร โดยมีรหัสพิเศษเพื่อใช้ในการเขียนตัวอักษรแต่ละตัว
2. การรู้จำอักษรแบบออฟไลน์ (Offline Character Recognition)
อินพุตของระบบคือภาพตัวอักษร แบบพิมพ์หรือแบบเขียนที่ได้จากเครื่องสแกน โดยจะมีทั้งตัวอักษรแบบติดกันเป็นกลุ่ม และแบบเดี่ยว ก่อนที่โปรแกรมจะสามารถบอกได้ว่ารูปภาพที่ส่งเข้าไปประกอบด้วยตัวอักษรอะไรบ้าง ก็จะต้องผ่านหลายขั้นตอน ตั้งแต่การปรับแต่ง, จัดเตรียมข้อมูล และขั้นตอนการรู้จำ ขั้นตอนเหล่านี้มีความสำคัญต่อประสิทธิภาพโดยรวมของระบบ โดยเฉพาะอย่างยิ่งขั้นตอนการรู้จำจะเป็นหัวใจหลักของการทำ OCR เพราะเป็นส่วนที่จะแสดงว่ารูปตัวอักษรเป็นอักษรอะไร
หากมีความผิดพลาดเกิดขึ้นในส่วนใดส่วนหนึ่ง ก็จะส่งผลกระทบไปยังส่วนถัดไปของระบบด้วย แน่นอนว่าเอาต์พุตที่ได้มาก็จะไม่ถูกต้องทั้งหมด 100 %
เพื่อเพิ่มความถูกต้อง ผู้ใช้โปรแกรมสามารถตรวจสอบและแก้ไขข้อความได้ โดยโปรแกรมจะทำการตรวจสอบความถูกต้องของการสะกดคำและไวยากรณ์ภาษาให้เบื้องต้น พร้อมกับแสดงเครื่องหมายบางอย่างเพื่อบอกให้ผู้ใช้ทราบว่าคำนี้อาจไม่ถูกต้อง แต่ก็ขึ้นอยู่กับผู้ใช้งานอีกเช่นกันว่าต้องการแก้ไขคำเหล่านี้ที่โปรแกรมแจ้งเตือนหรือไม่
เหตุผลที่ควรนำเทคโนโลยี OCR ไปใช้งาน
การนำเอกสารมาทำ OCR มีประโยชน์ดังนี้
- ไม่ต้องป้อนข้อมูลเพื่อสร้างเอกสารเอง จึงช่วยประหยัดเวลาในการสร้างเอกสาร
- ประหยัดพื้นที่ในการจัดเก็บข้อมูล และง่ายต่อการค้นหา เพราะเอกสารถูกแปลงเป็นไฟล์อิเล็กทรอนิกส์
- แก้ไขหรือปรับแต่งไฟล์ได้ง่ายขึ้นในรูปแบบของไฟล์ Word หรือ Excel
- เก็บข้อมูลลงในฐานข้อมูล (Database) ได้ และส่งข้อมูล (Interface) ให้กับระบบอื่นได้ง่ายขึ้น
- ประยุกต์ใช้ OCR กับ RPA (Robotic Process Automation) เพื่อสร้างซอฟต์แวร์หุ่นยนต์ให้ช่วยทำงานซ้ำๆ แทนมนุษย์ได้
บทความที่เกี่ยวข้อง : ระบบบริหารจัดการเอกสารอิเล็กทรอนิกส์และการใช้เทคโนโลยี OCR