OCR คืออะไร

ในปัจจุบันการทำงานที่เกี่ยวข้องกับเอกสารยังคงมีอยู่มาก และมีเอกสารจำนวนไม่น้อยที่มีต้นฉบับอยู่ในรูปแบบของกระดาษ ซึ่งการนำเข้าสู่ระบบคอมพิวเตอร์นั้นจะต้องทำด้วยวิธีการสแกนเก็บไว้ในรูปแบบของรูปภาพเท่านั้น โดยไม่สามารถแก้ไขข้อความและยากต่อการค้นหาข้อมูลอีกด้วย และหากใช้วิธีการพิมพ์ก็จะทำให้เสียเวลาไม่น้อย การใช้เทคโนโลยี OCR จึงเป็นทางเลือกหนึ่งที่ช่วยให้การสร้างข้อมูลจากเอกสารทำได้อย่างรวดเร็วและมีประสิทธิภาพมากยิ่งขึ้น

?
OCR ย่อมาจากคำว่า Optical Character Recognition เป็นกระบวนการที่ใช้ในการแปลง สื่อสิ่งพิมพ์ที่อยูในรูปแบบของกระดาษ ให้กลายเป็นข้อความซึ่งสามารถทำการบันทึกเป็นไฟล์ข้อมูล และนำไปใช้ร่วมกับโปรแกรมอื่น ๆ ในคอมพิวเตอร์ได้ เช่น โปรแกรมประมวลผลคำ เป็นต้น หลักการทำงานของ OCR นั้นจะทำงานเหมือนกับเครื่องสแกนเนอร์ ซึ่งทำงานโดยใช้แสงและเลนส์ หรือที่เรียกกันว่า Optical Scanner ทำการสแกนข้อความบนหน้ากระดาษ แล้วแตกข้อมูลตัวอักษรมาสู่อนุกรมแบบจุด ซึ่งเรียกว่า Bitmap แล้วแปลไปเป็นข้อความคอมพิวเตอร์

OCR

การใช้งานซอฟต์แวร์ประเภท OCR ยังมีข้อจำกัดในเรื่องของรูปแบบตัวอักษรอยู่ คือหากมีการใช้ร่วมกับเอกสารที่เขียนด้วยลายมือ หรือแบบอักษรที่มีลักษณะคล้ายลายมือ จะใช้งานได้ไม่ดีเท่ากับเอกสารที่ใช้แบบอักษรมาตรฐาน

About comadmin

Check Also

Domain Name คืออะไร

โดยปกติแล้วการเข้าเว็บไซต์หรือการใช้อินเตอร์เน็ต เมื่อเราต้องการเข้าไปดูเว็บไซต์ๆหนึ่งเราจะต้องพิมพ์เป็น IP ของเว็บไซต์นั้นซึ่งมันยากต่อการจดจำเป็นอย่างมาก นักพัฒนาเลยได้มีการพัฒนาให้มีการเรียกใช้งานเว็บไซต์ได้ง่ายขึ้นด้วยการคิดค้น Domain Name ขึ้นมาใช้เรียกแทน IP ซึ่งการใช้ Domain Name นั้นมีความสะดวกสบายกว่าการใช้ IP เพราะเป็นการใช้คำที่ใช้กันอยู่ทุกวัน …

Leave a Reply

Your email address will not be published. Required fields are marked *