จะรับมืออย่างไร…ไม่ให้เกิด Data Leak

คอลัมน์ Pawoot.com
โดย ภาวุธ พงษ์วิทยภานุ

หลังจากที่มีกระแสข่าวใหญ่ว่ามีคนแห่ลบบัญชีเฟซบุ๊กจำนวนมาก เนื่องจากข้อมูลที่อยู่ในเฟซบุ๊กเกิดรั่วออกมา สาเหตุมาจากเหตุการณ์ที่บริษัท Cambridge Analytica ซึ่งเป็นบริษัทที่ทำเกี่ยวกับการวิเคราะห์ข้อมูล ใช้วิธีการดึงข้อมูล ซึ่งปกติเฟซบุ๊กมีช่องทางที่เปิดให้เราดึงข้อมูลของผู้ใช้ได้อยู่แล้ว บริษัทนี้ดึงข้อมูลคนราว 200,000 คน ซึ่งคนเหล่านี้ยินยอมให้ดึงข้อมูล

วิธีการดึงข้อมูลน่าจะทำเป็นเซอร์เวย์ หรือเป็นควิซ ก่อนควิซใช้เฟซบุ๊กล็อกอินก่อน โดยหลักการคือเมื่อล็อกอินเข้าไปแล้ว นักพัฒนาจะเก็บข้อมูลที่เรียกว่า “โทเค็น” เหมือนได้สิทธิ์ในระดับหนึ่งที่จะเข้าไปดูข้อมูลของคุณได้ระดับหนึ่งเช่นกัน เช่น ดูชื่อ นามสกุล ดูว่าเน็ตเวิร์กมีเท่าไหร่ ฯลฯ ซึ่งแล้วแต่ว่านักพัฒนาจะขอข้อมูลอะไร


สิ่งหนึ่งที่นักพัฒนาต้องการ คือข้อมูลของเพื่อนในวงของคุณอีกที ปรากฏว่า Cambridge Analytica ได้ข้อมูลมา 270,000 คน และได้ข้อมูลกระจายออกไปต่อได้ถึง 50 ล้านราย ซึ่งเอาไปทำโปรเจ็กต์อื่นต่อได้ จึงพาดพิงถึงเรื่องการใช้ในการเลือกตั้งอเมริกาครั้งที่ผ่านมา

เมื่อเราเอาดาต้าไปวิเคราะห์จะสามารถเซ็กเมนต์หรือเลือกคนเป็นกลุ่มได้ว่า คนกลุ่มเหล่านี้มีพฤติกรรมอย่างไร มีแนวความคิดแบบไหน อยากบอกว่าในโลกโซเชียลมีเดียทุกวันนี้ ดาต้าที่เราใช้กันอยู่แบ่งออกเป็นหลายเลเวล เราปรับเลเวลได้ว่าจะให้ใครเห็นมากน้อยได้

ประเด็นคือข้อมูลที่นักพัฒนาเข้าถึงได้ผ่าน API หรือช่องทางที่เขาทำได้มีสิทธินำไปทำอย่างอื่นได้มากขึ้น การใช้โซเชียลมีเดียบางครั้งข้อมูลที่เราพิมพ์ไปอาจมีความเซ็นซิทีฟเรื่องของความเป็นส่วนตัวเช่นกัน ข้อมูลหลาย อย่างเป็นสาธารณะ และเมื่อข้อมูลเหล่านี้เป็นสาธารณะ ผู้ให้บริการในโลกออนไลน์จะมีช่องทางพิเศษสำหรับนักพัฒนาที่เรียกกันว่า API (application programming interface) ซึ่งจะเขียนโปรแกรมที่ดึงข้อมูลเหล่านี้ได้ แต่การดึงข้อมูลเหล่านี้ออกมาได้ต้องได้รับสิทธิ์ยินยอมจากเจ้าของหรือคนคนนั้นเสียก่อน บางครั้งข้อมูลเหล่านี้เมื่อนำมาประกอบเอามาต่อกันดี ๆ จะเริ่มระบุแพตเทิร์นหรือพฤติกรรมของคุณได้ และนำไปสู่การคาดการณ์ หรือบางทีจะรู้ถึงมุมมองหรือความคิดของคุณได้เลย

การที่คนโกรธแค้นหรือมีแผนที่จะลบเฟซบุ๊กเพราะคิดว่า เฟซบุ๊กไม่เก็บข้อมูลให้ดีพอ หากเราดึงข้อมูลมาจะเริ่มรู้ว่าแต่ละคนเป็นอย่างไร และการซื้อโฆษณาเดี๋ยวนี้เลือกกลุ่มทาร์เก็ตได้

ฉะนั้นเมื่อเรามีข้อมูล มีรายชื่อลูกค้า ก็เอาข้อมูลมาเซ็กเมนต์ เป็นกลุ่มผู้หญิง ผู้ชาย ฯลฯ เราก็พยายามเลือกโฆษณาที่ทำให้เกิดการเกลียดฝั่งตรงข้ามปล่อยออกไป หรือใช้โฆษณาที่เป็นในลักษณะหว่านล้อม ยิ่งมีข้อมูลลูกค้าเยอะ การทำโฆษณาหรือส่งข้อมูลออกไปจะเริ่มแม่นยำมากขึ้น

ดังนั้น เวลาที่เราไถฟีดลงมาหรือดูเฟซบุ๊ก ข้อมูลบางอย่างที่เห็นอาจไม่ได้เกิดอย่างธรรมชาติ คำถามที่ว่า หากข้อมูลไม่มีการรั่วออกมาจะทำวิธีข้างต้นได้หรือไม่ บอกได้เลยว่า เดาไม่ได้ แต่หากว่าเรามีไอดีของคนแล้วมีโปรแกรมที่จะเข้าไปอ่านไทม์ไลน์ได้ และมี AI ที่เข้าไปแบ่งกลุ่มวิเคราะห์ข้อมูลได้

ดังนั้นในการสื่อสารก็จะเอาเรื่องที่สนใจ หรือเกี่ยวข้องมานำเสนอ ยิ่งรู้จักคนมากเท่าไรก็จะยิ่งจัดกลุ่มได้

ฉะนั้นในแง่เรื่องการนำเสนอข้อมูลเพื่อไปเปลี่ยนมุมมองคนเหล่านั้นผ่านโซเชียลมีเดียทำได้ไม่ยาก อยากให้ตระหนักว่าข้อมูลโซเชียลมีเดียที่ใช้อยู่ในปัจจุบันที่อาจดูว่าเป็นเรื่องปกติ นำมาปะติดปะต่อได้ และข้อมูลบางอย่างที่ทำในโซเชียลมีเดียอาจทำให้รู้ตำแหน่ง รู้แนวความคิด รู้จักเพื่อน รู้สิ่งแวดล้อม ฯลฯ

เมื่อนำมาปะติดปะต่อแล้วจะบ่งบอกตัวคุณเองได้ดี บางทีแค่การถ่ายภาพในบ้านบรรดานักวิเคราะห์อาจมองเห็นไปถึงบ้านคุณเป็นอย่างไร มีอะไรตั้งอยู่ตรงไหนบ้างมันโยงใยไปได้อีกมาก เรียกกันว่า social big data ทุกข้อมูลจะถูกเก็บจนเกิด digital footprint

ข้อแนะนำในการรับมือ คือ ต้องรู้ว่าข้อมูลที่คุณทำอยู่ในปัจจุบันมีตรงไหนที่เซนซิทีฟมาก ๆ อาจต้องรู้ก่อนด้วยว่ากำลังใช้โปรแกรมอะไร และเก็บข้อมูลอะไรอยู่ ถ้ารู้ก็จะเริ่มบริหารข้อมูลได้ อีกอย่าง คือการใช้งานที่มีการเปิด privacy ของดาต้า ต้องดูว่าเปิดในระดับไหน บางทีเราคิดว่าเปิดหมดเลยละกันอาจไม่จำเป็นขนาดนั้น แอปบางตัวที่ไม่ได้ใช้มีการเก็บข้อมูลต่อเนื่อง ฉะนั้นแอปที่ไม่ได้ใช้ควรเอาออกไป