โจทย์ที่ไม่มี “เฉลย” สู่เป้าหมายเทคโนโลยีเพื่อทุกคน

สัมภาษณ์

ในการถ่ายทอดสดรายการสำคัญ ๆ ของภาครัฐ ไม่ว่าจะเป็นงานพระราชพิธี งานสัมมนาสำคัญ หรือแม้แต่ในงาน Digital Thailand Big Bang 2019 ที่ผ่านมา ทั้งที่ผ่านช่องทีวีดิจิทัล หรือ เฟซบุ๊ก ไลฟ์ ก็จะเริ่มเห็น “คำบรรยายแทนเสียง” ที่ช่วยอำนวยความสะดวกให้ผู้ที่ไม่สามารถ “ได้ยิน” ได้เข้าใจผ่านการ “อ่าน” และเป็นผลงานของ “ระบบถอดความเสียงพูดแบบทันต่อเวลาผ่านระบบสื่อสารทางไกล” (A real time transcription system) ซึ่งพัฒนาโดยทีมวิจัยของ “ดร.อนันต์ลดา โชติมงคล” ศูนย์วิจัยเทคโนโลยีสิ่งอำนวยความสะดวกและเครื่องมือแพทย์ (A-MED) ทีมวิจัยเทคโนโลยีที่ทุกคนเข้าถึงและสิ่งอำนวยความสะดวก (AAT) สวทช.

โดยการทำงานของระบบจะใช้ real time communication protocol สำหรับการส่งสัญญาณเสียง ทำหน้าที่แบ่งเสียงพูดส่งไปให้เจ้าหน้าที่แต่ละคนถอดความและรวมข้อความจากเจ้าหน้าที่ตามลำดับเวลา เพื่อให้ได้ข้อความที่สมบูรณ์สำหรับส่งไปแสดงผล ซึ่งความแม่นยำอยู่ที่ 80-90%

“ระบบซับซ้อนกว่าแค่ฟังเสียงให้ชัดแล้วแบ่งกันพิมพ์ ๆ เพราะถ้าจะนำมาใช้กับงานโปรดักชั่นใหญ่ สิ่งสำคัญคือความเสถียรของระบบ เพื่อให้ทุกอย่างคงเป็นเรียลไทม์อยู่ตลอดเวลา และแสดงผลอย่างสม่ำเสมอ ทั้งยังต้องตัดคำสำหรับการแสดงผลบนจอโทรทัศน์ที่ให้สอดคล้องกับความถี่ของระบบออกอากาศที่จะไม่กวนกับโครงข่ายทีวี (MUX) หรือแม้แต่การสตรีมเสียงผ่านระบบของเฟซบุ๊ก-ยูทูบ ก็ยังมีโปรโตคอลแตกต่างกัน”

เพิ่มโอกาสสู่ความรู้

ทั้งยังร่วมกับมหาวิทยาลัยราชภัฏสกลนคร ใช้ในการเรียนการสอนหลักสูตรเรียนร่วมระดับชั้นปริญญาตรี สาขาคอมพิวเตอร์ เพื่อให้นักเรียนหูหนวกกับนักเรียนปกติสามารถเรียนรู้กันได้ทุกวิชาในหลักสูตร แก้ปัญหาขาดโอกาสทางการศึกษาของนักเรียนหูหนวกที่ปกติต้องใช้ล่ามในการเรียนการสอน ทำให้มีสถาบันการศึกษาไม่กี่แห่งที่สามารถเข้าเรียนได้ และยังหมดโอกาสที่จะเข้าเรียนได้หลากหลายตามความสนใจเฉพาะตัวด้วย เป็นการนำเทคโนโลยีเข้าไปช่วยแก้ปัญหาการจัดการเรียนการสอนให้กับนักเรียนกลุ่มนี้

“ในประเทศไทยผู้พิการทางการได้ยิน จะเริ่มเรียนหนังสือด้วยการใช้ภาษามือเป็นหลัก ทำให้ทักษะในการอ่านแบบคนปกติจะด้อยกว่า จะมีแค่ไม่ถึง 10% ของผู้พิการทางการได้ยินที่จะสามารถอ่านภาษาเขียนได้คล่อง ฉะนั้น การใช้ระบบถอดความเสียงจะได้เรียนรู้ภาษาที่ใช้ในรูปแบบสากลคู่ไปด้วย ซึ่งจะเป็นประโยชน์ในการทำงานต่อไปในอนาคต โดยอาจารย์สอนด้วยวิธีการปกติ แต่ในห้องเรียนจะมีอุปกรณ์รองรับระบบถอดความเสียงทางไกลจากส่วนกลาง ขึ้นหน้าจอผลลัพธ์ให้นักเรียนได้เห็นได้ในทันที ทั้งยังมีแอปพลิเคชั่นที่ทำให้ผู้เรียนสามารถย้อนกลับมาอ่านคำบรรยายที่ถอดเสียงได้ด้วย ซึ่งกลายเป็นประโยชน์ให้กับผู้ที่ไม่ได้มีปัญหาทางการได้ยินไปด้วย”

เป้าหมายต่อไปของการพัฒนา คือ การนำ “พาที” เทคโนโลยีแปลงเสียงพูดเป็นข้อความ หรือรู้จำเสียงพูดของเนคเทค ซึ่งเป็น AI เข้ามาเสริมช่วยถอดเสียงแทนคน เพื่อกระจายบริการให้ทั่วถึงมากขึ้นอย่างมหาวิทยาลัยที่ขอมา

“ในต่างประเทศ captionist ถือเป็นอาชีพหนึ่งที่สร้างรายได้ก็พยายามดึงคนพิการที่นั่งวีลแชร์ทำงานคอมพิวเตอร์ได้คล่อง รวมถึงร่วมกับมูลนิธิไอทีตามพระราชดำริฯ จัดอบรมในทัณฑสถาน เพื่อดึงเข้ามาทำงานได้ เพราะตัวระบบที่ออกแบบไม่จำเป็นที่ผู้พิมพ์ต้องอยู่ในสถานที่เดียวกับผู้พูด”

โครงการต่อไป คือ การพัฒนาเป็นอีบุ๊กที่เป็นระบบอ่านอัตโนมัติได้จะช่วยคนที่บกพร่องทางการเรียนรู้ได้ แอปพลิเคชั่น “reach book” ซึ่งในอีบุ๊กสามารถแทรกใส่ได้ทั้งวิดีโอ ภาษามือ เสียง

ไม่หวือหวาแต่ “อิมแพ็กต์”

และแม้ว่างานวิจัยเพื่อคนพิการจะไม่ได้สร้างรายได้หวือหวามาก แต่ “ดร.อนันต์ลดา” ระบุว่า สามารถสร้างอิมแพ็กต์มาก เพราะสิ่ง “จำเป็น” ช่วยเปิดโอกาสสู่การเรียนรู้ของผู้พิการได้มากขึ้น ทั้งปัจจุบันยังมีคนอีกกลุ่มที่ไม่ได้พิการ แต่มีปัญหาทางการได้ยินเพราะความเสื่อมของร่างกาย หรือแม้แต่ทีวีตามที่สาธารณะที่มีเสียงดัง ถ้ามีระบบเข้าไปซัพพอร์ตนอกจากจะช่วยให้การสื่อสารดีขึ้นในทุกสถานการณ์ เป็นเทคโนโลยีสำหรับ “ทุกคน” จริง ๆ ไม่ว่าจะเป็นคนกลุ่มไหนก็เลือกใช้งานได้ตามความต้องการของตัวเอง ทั้งการดูเรียลไทม์ หรือการเปิดดูย้อนหลังเป็นสต๊อกคอนเทนต์ให้

ปัจจุบันวงการวิจัยไทยได้รับการสนับสนุนดีขึ้น ภาครัฐและเอกชนเห็นความสำคัญที่จะนำไปใช้งาน แต่สิ่งที่อยากให้ภาครัฐเข้าใจ คือ การทำงานวิจัยต้องใช้เวลากว่าจะได้ผลลัพธ์ออกมา การลงทุนอินฟราสตรักเจอร์เป็นเรื่องที่ต้องมีเพื่อให้งานไปได้ และอยากให้เกิดการประสานงานระหว่างหน่วยงานเพื่อแชร์ทรัพยากรร่วมกัน

“งานวิจัยเป็นโจทย์ที่ไม่มี “เฉลย” และหลาย ๆ ครั้งก็ไม่ได้ทำสำเร็จ แต่ก็ต้องพร้อมจะเริ่มต้นใหม่ ต้องไม่ท้อ เพราะถ้ามันมีเฉลยอยู่แล้ว ไม่ใช่งานวิจัย แต่คือสิ่งที่มีคนคิดคนทำได้อยู่แล้ว”