Big Data ข้อมูลอดีต…ทำนายอนาคต

คอลัมน์ New Normal

โดย ดร.ธีรศานต์ สหัสสพาศน์ ผู้อำนวยการหลักสูตร DNAbySPU.com

 

ถ้าจะพูดถึงคำศัพท์ที่กำลังมาแรงและเป็นที่พูดถึงในแวดวงการตลาดดิจิทัล คำว่า “big data” คงเป็นหนึ่งในคำศัพท์ที่ต้องเคยผ่านหูของท่านแน่นอน แต่ถ้าถามเจาะลึกลงไปว่า big data คืออะไร ? และมีประโยชน์อย่างไร ? คำศัพท์นี้อาจทำให้ท่านสับสน และทำให้ท่านงง เพราะไม่คุ้นเคยbig data หรือ “ชุดข้อมูลขนาดใหญ่” ซึ่งถูกแปลความหมายตรงตามตัวอักษร คือ การรวมกันของข้อมูลดิบที่ยังไม่ผ่านการวิเคราะห์ในปริมาณมหาศาล ไม่ว่าจะเป็นข้อมูลในรูปแบบของข้อความ รูปภาพ วิดีโอ รวมไปถึงข้อมูลในรูปแบบอื่น ๆ เช่น พฤติกรรมการซื้อ หรือพฤติกรรมการกดถูกใจในโซเชียลมีเดีย ก็เป็นส่วนหนึ่งของ big data ทั้งนั้น

ในอดีตท่านมักจะบันทึกข้อมูลต่าง ๆ ลงในตารางของไมโครซอฟท์ เอ็กซ์เซลที่คุ้นเคยและเข้าใจง่าย เพื่อจะได้เห็นภาพว่า “เกิดอะไรขึ้น ?” แต่แนวคิดหลักของ big data ต่างออกไป คือ การจัดเก็บข้อมูลอย่างเป็นระบบ แล้วนำออกมาใช้เพื่อทำนายแนวโน้มที่กำลังจะเกิดขึ้น และเพื่อตอบคำถามว่า “แล้วอะไรจะเกิดขึ้นต่อไปในอนาคต ?”

ช่วยให้ท่านวิเคราะห์ข้อมูล เพื่อตอบคำถามว่า “การจะทำนายอนาคตได้ ต้องเรียนรู้เรื่องราวจากอดีต” เป็นแนวคิดหลักของ big data

โดยแท้จริงแล้ว ท่านสามารถพบเจอ big data ได้ในชีวิตประจำวัน เช่น ในกรณีที่ท่านซื้อของออนไลน์ ท่านจะพบปุ่มคำสั่ง “สินค้าที่ดูล่าสุด” และ “สินค้าแนะนำสำหรับคุณ” ซึ่งเพิ่มความสะดวกสบายในการดูสินค้า แต่อาจส่งผลกระทบให้กระเป๋าสตางค์ท่านบางลง

big data เป็นแนวคิดที่สามารถประยุกต์เข้ากับเนื้อหาต่าง ๆ ได้อย่างหลากหลาย Wal-Mart พบชุดข้อมูลว่า ผู้ชายช่วงวัย 30-40 ปี ที่มาซื้อของตอนวันศุกร์ ที่มาซื้อผ้าอ้อมเด็ก มักจะซื้อเบียร์ด้วย ทำให้ Wal-Mart สามารถวางถังเบียร์ไว้ใกล้กับผ้าอ้อมเด็ก และเพิ่มยอดขายได้ขึ้นอีก 35%

การทำให้ GPS บนสมาร์ทโฟนมีความสมบูรณ์มากยิ่งขึ้น โดยนำเอาข้อมูลในทุก ๆ ด้าน ทุก ๆ ส่วนมาประกอบกัน ทั้งรายงานอุบัติเหตุ พื้นที่เขตการก่อสร้าง เพื่อพัฒนาการวางแผนการเดินทางที่สมบูรณ์แบบ หรือแม้แต่มีส่วนช่วยในการลดอาชญากรรมที่เกิดขึ้นในเมืองใหญ่ ที่ตำรวจดูแลไม่ถึง เช่น Los Angeles และ Santa Cruz ใน California ที่ใช้วิทยาการนี้ในการจับตาดูพื้นที่ที่มีแนวโน้มว่าจะเกิดอาชญากรรม และส่งตำรวจไปป้องกันภัยก่อนจะเกิดเวทีที่แสดงให้เห็นถึงพลานุภาพของ big data ได้ชัดเจนที่สุด คือ ศึกชิงตำแหน่งประธานาธิบดีสหรัฐอเมริกา ระหว่าง “โดนัลด์ ทรัมป์” ตัวแทนจากพรรครีพับลิกัน กับ “ฮิลลารี คลินตัน” ตัวแทนจากพรรคเดโมแครต ซึ่งถ้ามองไป

ที่ทรัพยากร ฮิลลารีมีครบถ้วนทุกอย่าง มีทีมงานกลยุทธ์การเมืองที่แข็งแกร่งที่สุด ทีมงานทำโพลที่ดีที่สุด รู้ว่าคนที่จะไปโหวตชอบอะไร ต้องให้ฮิลลารีไปหาเสียงที่เมืองไหน ต้องพูดอะไร ต้องเน้นระดมคนกลุ่มไหน ในเมืองไหนไปโหวต ต้องซื้อโฆษณาทีวีและหนังสือพิมพ์เพิ่มที่เมืองไหน ในขณะที่ทรัมป์มีแค่ทีมงานขนาดไม่ถึง 200 คน งบประมาณการซื้อสื่อในสเกลโซเชียลมีเดีย รวมถึงแนวคิดและคำพูดที่ดูจะไม่เข้าท่านัก

ส่วนหนึ่งของความสำเร็จของทรัมป์ คือ ความสำเร็จของการจัดการข้อมูล โดยถูกแสดงเป็นรูปธรรมผ่าน Project Alamo โปรเจ็กต์การตลาดผ่านฐานข้อมูลขนาดยักษ์ โดย “จาเร็ด คุชเนอร์” ลูกเขยของเขา ผู้เป็นสามีของ อิวานกา ทรัมป์ และยังเป็นเจ้าของธุรกิจอสังหาริมทรัพย์ นักลงทุน และเจ้าของธุรกิจสื่อสิ่งพิมพ์ New York Observer

เริ่มจากการสร้างฐานข้อมูล (database) ซึ่งรวมข้อมูลและรายชื่อของผู้สนับสนุนทรัมป์ ซึ่งมาจาก 3 แหล่งด้วยกัน ได้แก่ 1.ฐาน email list ของพรรครีพับลิกัน รวมทั้งสิ้นประมาณเจ็ดล้านรายชื่อ 2.ข้อมูลชื่อและเบอร์มือถือของผู้สนับสนุน ซึ่งได้มาจากการลงทะเบียนผ่านเว็บเพื่อเข้าฟังอีเวนต์หาเสียงของทรัมป์ 3.ข้อมูลชื่อ ที่อยู่ บัตรเครดิตของผู้ที่บริจาคเงินให้ทรัมป์ผ่านเว็บไซต์

จากการรวบรวมข้อมูลดังกล่าว ทำให้ทรัมป์ทราบว่ามีประมาณ 14 ล้านคน ใน 16 รัฐสำคัญ เป็น swing voters หรือยังไม่ได้ตัดสินใจเด็ดขาดว่าจะเลือกใคร และมีความเป็นไปได้ที่อาจจะโหวตให้กับทรัมป์ นอกจากนั้น ข้อมูลชุดนี้ยังช่วยให้ทีมงานของทรัมป์รู้ว่า คนพวกนี้อยู่ในพื้นที่ไหน เพื่อจะได้ออกไปจัดกิจกรรมหาเสียง รวมถึงทำให้รู้ว่าต้องโฆษณาให้คนแถวไหนได้รับรู้ เพื่อจะได้กลุ่มเป้าหมายที่มีลักษณะใกล้เคียงกับที่อาจเลือกทรัมป์ได้รับรู้ เพราะธรรมชาติของโซเชียลมีเดีย “คนที่มีรสนิยมเดียวกัน ย่อมเป็นเพื่อนกัน”

ทีมงานตัดสินใจใช้เม็ดเงินทั้งหมดเทลงบนระบบโฆษณาใน Facebook โดยใช้เงินทั้งหมดราว 2 ล้านเหรียญสหรัฐ ซึ่งถือว่าน้อยมากเมื่อเทียบกับสื่ออื่น เช่น โฆษณาทีวี หรือหนังสือพิมพ์ และคอยจับตาอ่านข้อมูลอย่างใกล้ชิด โดยใช้โปรแกรมวิเคราะห์ข้อมูลต่าง ๆ ที่ Facebook มีให้ เพื่อวัดผลว่าสื่อโฆษณาที่วางไป ได้ผลมากน้อยเพียงใด โดยทั้งหมดนี้ทำจากที่บ้านของเขาเอง

หลังจากตัดสินใจเลือก “สื่อหลัก” เป็นที่เรียบร้อยแล้ว ในขั้นต่อไป ทางทีมงานได้ทำ “A/B testing” หรือการทดสอบรูปแบบการโฆษณา เพื่อเปรียบเทียบว่า วิธีไหนให้ผลลัพธ์ดีกว่ากัน รวมทั้งหมดกว่า 100,000 รูปแบบ เพื่อศึกษาว่าแบบไหนมีประสิทธิภาพกว่า คนคลิกเข้าไปดูมากกว่ากัน แบบไหนได้ยอดบริจาคมากกว่ากัน

นอกเหนือจากนั้น Project Alamo ยังใช้กลยุทธ์ “กำจัดฐานเสียงของคู่แข่ง” โดยพยายามทำโฆษณาด้านลบ ที่จะเข้าถึงคน 3 กลุ่มที่สนับสนุนฮิลลารี ซึ่งคน 3 กลุ่มนี้ไม่จำเป็นต้องเลือกทรัมป์ ขอแค่เบื่อฮิลลารี จนนอนหลับอยู่บ้านในวันเลือกตั้งก็พอ

กลุ่มแรก คือ “คนอเมริกันหัวก้าวหน้า” โดยคอนเทนต์คือ การกลับลำสนับสนุนข้อตกลงหุ้นส่วนยุทธศาสตร์เศรษฐกิจภาคพื้นแปซิฟิก (Trans-Pacific Partnership-TPP) หลังจากที่เคยมีส่วนช่วยประธานาธิบดี บารัก โอบามาโปรโมตแผนนี้อย่างแข็งขัน สมัยที่ยังดำรงตำแหน่งรัฐมนตรีต่างประเทศ กลุ่มที่สอง คือ “ผู้หญิงคนขาว” โดยทำให้คนกลุ่มนี้

เห็นข้อมูลเกี่ยวกับเรื่องชู้สาวของ บิลล์ คลินตัน และการที่ฮิลลารีข่มขู่ผู้หญิงที่มีเรื่องชู้สาวกับสามีเธอ และกลุ่มที่สาม คือ “กลุ่มแอฟริกันอเมริกัน” ที่เธอเคยพูดวิจารณ์เชิงเสียดสีว่า ผู้ชายแอฟริกันอเมริกันเป็นนักล่า (super predator)

แล้วถ้าสุดท้าย ทรัมป์แพ้ ฐานข้อมูลและระบบนี้จะเป็นฐานรากในการโปรโมตธุรกิจในอาณาจักรของเขา หรือใช้สำหรับตัวเขาเอง หากจะยังเล่นการเมืองต่อ และยังสามารถสร้างรายได้ให้กับเขา โดยการขายข้อมูลให้กับกลุ่มธุรกิจอื่น ๆ ด้วย รวมถึงยังสามารถขายข้อมูลให้กับนักการเมืองที่ทรัมป์สนับสนุน โดยฐานข้อมูลชุดนี้คาดว่าน่าจะมีราคาประมาณ 36-112 ล้านดอลลาร์สหรัฐ เลยทีเดียว

“การจะทำนายอนาคตได้ ต้องเรียนรู้เรื่องราวจากอดีต” เป็นแนวคิดหลักของ big data อย่างไรก็ตาม การที่จะตีความ big data ให้เกิดประโยชน์สูงสุด ต้องใช้หลักการศิลปะของ “วิทยาศาสตร์ข้อมูล” หรือ data science มาทำการวิเคราะห์เพื่อดึงศักยภาพที่แฝงอยู่ในข้อมูลออกมาใช้งาน ซึ่งจะถูกอธิบายอย่างละเอียดในโอกาสต่อไป


การที่ท่าน ธุรกิจของท่าน อยากใช้แนวคิดดังกล่าว ไม่ใช่เรื่องผิด แต่ถ้าท่านยังไม่เข้าใจอย่างถ่องแท้ แล้วกระโดดข้ามไปใช้งานเลย “big data” ที่ท่านลำบากหามา อาจกลายสภาพเป็น “big problems” ให้กับองค์กรของท่านแทน