จุฬาฯ เปิดตัว ReadMe โปรแกรมแปลงเอกสาร-รูปภาพเป็นข้อความดิจิทัล

จุฬาฯ เปิดตัว ReadMe

จุฬาฯ เปิดตัว ReadMe โปรแกรมแปลงเอกสารและรูปภาพเป็นข้อความดิจิทัล แม่นยำ 90% พร้อม spin-off สู่ตลาดในนามบริษัท Eikonnex AI จำกัด

วันที่ 16 มิถุนายน 2565 รองศาสตราจารย์ ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์จากภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย เปิดเผยว่า ได้ร่วมกับ ทีมนิสิตปริญญาเอก ดร.ธนานพ กอบชัยสวัสดิ์ ร่วมพัฒนา “ReadMe” โปรแกรมประเภท OCR (Optical Character Recognition) เพื่อช่วยสแกนข้อความทั้งภาษาไทยและภาษาอังกฤษที่อยู่บนเอกสาร รูปภาพ หรือไฟล์วิดีโอ ให้ออกมาเป็นตัวหนังสือดิจิทัลได้ทันที สามารถอ่านภาษาไทยแม่นยำกว่า 90%

ธนารัตน์ ชลิดาพงศ์
ธนารัตน์ ชลิดาพงศ์

ซึ่งเทคโนโลยี OCR หรือ Optical Character Recognition คือ โปรแกรมที่ใช้สแกนตัวหนังสือจากภาพ หรือวิดีโอ ให้กลายเป็นตัวหนังสือแบบดิจิทัล เพื่อนำข้อมูลมาวิเคราะห์ผล พร้อมนำไปประยุกต์ใช้งานได้ทันที ซึ่งรูปภาพที่นำมาใช้สแกนนั้นเป็นได้ 2 ลักษณะ คือ รูปภาพทั่วไป (Scene text image) และรูปภาพที่เป็นเอกสาร (Document scanned image)

เทคโนโลยี OCR ประยุกต์ใช้ได้หลากหลายรูปแบบ เช่น การอ่านรหัสไปรษณีย์บนซองจดหมาย เพื่อคัดแยกซองจดหมายได้โดยอัตโนมัติ การอ่านหมายเลขบนแคร่รถไฟ เพื่อให้สามารถทราบตำแหน่งของตู้รถไฟว่าอยู่จุดไหนเวลาใดได้ทันที สามารถใช้กับกล้องติดหน้ารถยนต์เพื่อช่วยอ่านป้ายจราจรและป้ายบอกทาง หรือช่วยอ่านป้ายต่าง ๆ ให้ผู้มีสายตาเลือนราง เป็นต้น

“OCR ถือเป็นนวัตกรรมที่ใช้ปัญญาประดิษฐ์ช่วยลดการใช้แรงงานมนุษย์ ประหยัดเวลา ทำให้ชีวิตประจำวันของคนเรามีความสะดวกและง่ายขึ้นมากเลยทีเดียว”

ReadMe อ่านไทยคล่องแบบเจ้าของภาษา

รศ.ดร.ธนารัตน์ กล่าวต่อว่า เทคโนโลยี OCR ได้รับการพัฒนามาอย่างต่อเนื่องจนมีความแม่นยำสูงขึ้นกว่าก่อนมาก แต่ก็ยังคงมีจุดอ่อนที่เป็นอุปสรรคต่อการใช้งานสำหรับคนไทย ซึ่งก็คือการอ่านภาษาไทย

“ไวยากรณ์และโครงสร้างของภาษาอังกฤษจะง่ายต่อคอมพิวเตอร์ในการอ่าน แต่ภาษาไทยยากกว่ามาก เพราะตัวอักขระเยอะ มีสระ มีวรรณยุกต์ ในหนึ่งบรรทัดมีตัวอักษรได้ถึง 4 ระดับ ในขณะที่ภาษาอังกฤษมีเพียงระดับเดียว แต่ปัญหาดังกล่าวกลายเป็นอดีตไปแล้ว เมื่อเทคโนโลยีการเรียนรู้เชิงลึก (Deep Learning) เข้ามามีบทบาทช่วยให้ AI ฉลาดมากขึ้น เมื่อนำเทคโนโลยีใหม่มารวมกับโจทย์เดิม ก็ช่วยเพิ่มความแม่นยำให้เทคโนโลยี OCR อ่านภาษาไทยได้เก่งเหมือนมีคนไทยมาอ่านเอง”

ReadMe ช่วยเบาแรงในภาคธุรกิจ

ReadMe เป็นผลิตภัณฑ์ชิ้นแรกของบริษัท Eikonnex AI จำกัด ภายใต้การสนับสนุนจากศูนย์วิจัยและพัฒนาเทคโนโลยีเพื่ออุตสาหกรรม จุฬาลงกรณ์มหาวิทยาลัย (Chula UTC) ที่พัฒนาขึ้นหลังจากสำรวจปัญหาในภาคธุรกิจ

“งานของภาคธุรกิจส่วนใหญ่เป็นงานเอกสาร ซึ่งปัจจุบันยังใช้คนในการกรอกข้อมูลอยู่ เสียแรงและเวลามาก เราจึงพัฒนาโปรแกรม ReadMe เพื่อตอบโจทย์ธุรกิจ โดยเน้นที่การอ่านเอกสารให้แม่นยำ และเกิดข้อผิดพลาดให้น้อยที่สุด ยกตัวอย่างการประยุกต์ใช้ ReadMe ในสายงานธนาคาร องค์กรที่นำ ReadMe ไปใช้ในระบบแล้ว พบว่า เมื่อเทียบกับ OCR ของบริษัทอื่น ๆ ทั้งของไทยและต่างประเทศ ReadMe มีความแม่นยำมากที่สุดถึง 92.6% ช่วยลดความผิดพลาดของมนุษย์ได้มาก (human error)”

ปัจจุบัน บริษัท Eikonnex AI จำกัด ให้บริการ ReadMe ทั้งในรูปแบบของการเข้าไปช่วยพัฒนาโปรแกรมหรือแอปพลิเคชั่น (Software development) เพื่อธุรกิจนั้น ๆ หรือต้องการซื้อตัวโปรแกรม (Licensing) ไปใช้กับแอปพลิเคชั่นขององค์กรเองก็สามารถทำได้เช่นกัน

“ยุคนี้เป็นยุค digital transformation แทบทุกองค์กรต้องปรับตัว ปรับทุกอย่างให้เป็นดิจิทัล ReadMe เป็นหนึ่งในเครื่องมือที่จะช่วยให้องค์กรเข้าสู่ digital transformation ได้เร็วขึ้น”

รศ.ดร.ธนารัตน์ กล่าวอีกว่าเมื่อมี ReadMe เจ้าหน้าที่กรอกข้อมูลจะตกงาน หรือไม่ AI จะเข้ามาแทนที่ หรือช่วยอำนวยความสะดวกให้ชีวิตมนุษย์ ? มนุษย์ควรรับมือกับการเปลี่ยนแปลงเช่นนี้อย่างไร ? ผมต้องบอกว่า เทคโนโลยีก้าวหน้ามากและรวดเร็ว โดยเฉพาะเทคโนโลยี OCR หรือ ReadMe มาแน่ ๆ เมื่อซอฟแวร์สามารถอ่านและแปลงเอกสารต่าง ๆ ได้แม่นยำ หลายอาชีพ หลายงานจะถูกแทนที่ด้วยเทคโนโลยี มนุษย์ก็ต้องปรับตัวไปทำงานอื่นที่คอมพิวเตอร์ยังไม่สามารถทำได้

ทดลองใช้ ReadMe เวอร์ชั่นทดลองได้ที่ https://readme.eikonnex.ai/