รู้จัก DeepSeek สตาร์ตอัพ AI จีนเขย่าโลก

DeepSeek ภาพโดย REUTERS/Dado Ruvic
DeepSeek ภาพโดย REUTERS/Dado Ruvic

DeepSeek สตาร์ตอัพ AI จีนที่กำลังมาแรง และสร้างความสั่นสะเทือนวงการบิ๊กเทคสหรัฐอยู่ในขณะนี้ แม้จะใช้เวลาการพัฒนาที่น้อยกว่า และใช้ชิปที่มีศักยภาพต่ำกว่า แต่ก็ยังสามารถวิ่งไล่กวดจนมีศักยภาพเทียบเท่าสหรัฐได้ด้วยต้นทุนที่ต่ำกว่า 20-30 เท่า 

ดร.สันติธาร เสถียรไทย Future Economy Advisor สถาบันวิจัยเพื่อการพัฒนาประเทศไทย (TDRI) และคณะกรรมการนโยบายการเงิน (กนง.) โพสต์เฟซบุ๊กวิเคราะห์ว่า DeepSeek ปรากฎตัวมาในจังหวะที่สำคัญพอดี และทำให้ทั่วโลกต้องตั้งคำถามต่อบทบาทการเป็นผู้นำของสหรัฐ ซึ่งอาจส่งผลกระทบต่อฉากทัศน์หลายมิติ ทั้งด้านภูมิรัฐศาสตร์และการพัฒนาเอไอในอนาคตของสองมหาอำนาจโลก

เช่นเดียวกับภาวุธ พงษ์วิทยภานุ คอลัมนิสต์ชื่อดังที่เขียนบทความลงบน “ประชาชาติธุรกิจ” เกี่ยวกับ DeepSeek บริษัทสตาร์ตอัพ AI จากจีนไว้อย่างน่าสนใจว่า การแข่งขันในตลาด AI ระดับสูงระหว่าง DeepSeek และ OpenAI ไม่เพียงแต่จะกระตุ้นให้เกิดการพัฒนาเทคโนโลยีที่ก้าวหน้ามากขึ้น

แต่ยังช่วยผลักดันให้เกิดการพัฒนามาตรฐานและแนวทางปฏิบัติที่ดีในการใช้งาน AI อีกด้วย ซึ่งผู้เชี่ยวชาญในวงการเทคโนโลยีต่างจับตามองการพัฒนาของทั้งสองบริษัท ว่าจะนำมาซึ่งนวัตกรรมและการเปลี่ยนแปลงอะไรในอนาคตอันใกล้นี้อย่างไร

ล่าสุด มติชน สรุปรายงานบทวิเคราะห์ของสำนักข่าวเอพีเกี่ยวกับปรากฎการณ์เขย่าโลกจาก DeepSeek ในวันที่ 28 มกราคม ซึ่งมีรายละเอียดที่น่าสนใจอย่างยิ่ง เพื่อให้เข้าใจถึงที่มาและนัยแห่งเหตุการณ์ดังกล่าว

ความตื่นตระหนกเกี่ยวกับแชตบอตปัญญาประดิษฐ์ที่สร้างโดย DeepSeek บริษัทเทคโนโลยีสตาร์ตอัพของจีน ส่งผลให้ตลาดหุ้นโลกสั่นสะเทือนในวันจันทร์ที่ 27 มกราคม พร้อมจุดชนวนให้เกิดการถกเถียงเกี่ยวกับการแข่งขันทางเศรษฐกิจและภูมิรัฐศาสตร์ระหว่างสหรัฐอเมริกาและจีนในการพัฒนาเทคโนโลยีปัญญาประดิษฐ์ หรือ AI

ADVERTISMENT

DeepSeek กลายเป็นแอปพลิเคชั่ นฟรีที่มียอดดาวน์โหลดสูงสุดใน App Store ของ Apple เมื่อวันจันทร์ โดยได้รับแรงกระตุ้นจากความอยากรู้เกี่ยวกับคู่แข่งของ ChatGPT แต่ยังคงมีสิ่งที่ทำให้ผู้สังเกตการณ์ในอุตสาหกรรมเทคโนโลยีของสหรัฐบางส่วนวิตกกังวล นั่นคือแนวคิดที่ว่าสตาร์ตอัพจีนสามารถตามทันบริษัทอเมริกันที่เป็นผู้นำด้าน AI เชิงสร้างสรรค์ด้วยต้นทุนเพียงเศษเสี้ยว

หากเรื่องทั้งหมดเป็นความจริง ก็ทำให้เกิดการตั้งคำถามตามมาถึงเงินจำนวนมหาศาลที่บริษัทเทคโนโลยีของสหรัฐบอกว่า พวกเขาวางแผนที่จะลงทุนกับศูนย์ข้อมูลและชิปคอมพิวเตอร์ที่จำเป็นสำหรับการขับเคลื่อนความก้าวหน้าด้าน AI ในอนาคต

ADVERTISMENT

อย่างไรก็ดี การโฆษณาเกินจริงและความเข้าใจผิดเกี่ยวกับความก้าวหน้าทางเทคโนโลยีของ DeepSeek ก็ทำให้เกิดความสับสนเช่นกัน

สเตซี ราสกอน นักวิเคราะห์ของเบิร์นสไตน์ ผู้ติดตามอุตสาหกรรมเซมิคอนดักเตอร์และเป็นหนึ่งในนักวิเคราะห์หุ้นหลายคนที่อธิบายว่าปฏิกิริยาที่เกิดขึ้นในวอลล์สตรีตนั้นเป็นเรื่องเกินจริง กล่าวว่า โมเดลที่พวกเขาสร้างขึ้นนั้นยอดเยี่ยมมาก แต่ก็ไม่ใช่ปาฏิหาริย์เช่นกัน พวกเขาไม่ได้ใช้สิ่งประดิษฐ์ใหม่ที่ไม่รู้จักหรือเป็นความลับหรืออะไรทำนองนั้น แต่สิ่งเหล่านี้เป็นสิ่งที่ทุกคนกำลังทดลองอยู่

DeepSeek คืออะไร ?

DeepSeek สตาร์ตอัพก่อตั้งขึ้นในปี 2023 ที่เมืองหางโจว ประเทศจีน และเปิดตัวโมเดลภาษาสำหรับ AI ขนาดใหญ่ตัวแรกในช่วงปลายปีนั้น เหลียง เหวินเฟิง ซีอีโอของ DeepSeek เคยร่วมก่อตั้งกองทุนเฮดจ์ฟันด์ที่ใหญ่ที่สุดอันหนึ่งของจีนอย่าง High-Flyer ซึ่งเน้นการซื้อขายเชิงปริมาณโดยใช้ AI

ในปี 2022 กองทุนดังกล่าวได้รวบรวมชิปประมวลผลกราฟิกประสิทธิภาพสูง A100 ของ Nvidia จากแคลิฟอร์เนียจำนวน 10,000 ตัว เพื่อใช้สร้างและรันระบบ AI ตามโพสต์ในแพลตฟอร์มโซเชียลมีเดีย WeChat ของจีนในช่วงฤดูร้อนปีนั้น หลังจากนั้นไม่นาน สหรัฐอเมริกาก็ได้จำกัดการขายชิปเหล่านี้ให้กับจีน

DeepSeek กล่าวว่าโมเดลล่าสุดของบริษัทสร้างขึ้นด้วยชิป H800 ที่มีประสิทธิภาพต่ำกว่าของ Nvidia ซึ่งไม่ได้ถูกห้ามในจีน ซึ่งเป็นการส่งสัญญาณว่าอาจไม่จำเป็นต้องใช้ฮาร์ดแวร์ที่หรูหราที่สุดสำหรับการวิจัย AI ขั้นสูง

DeepSeek เริ่มได้รับความสนใจในอุตสาหกรรม AI มากขึ้นเมื่อเดือนมกราคมที่ผ่านมา โดยเปิดตัวโมเดล AI ใหม่ที่อวดอ้างว่าเทียบเท่ากับโมเดลที่คล้ายกันจากบริษัทในสหรัฐอย่าง OpenAI ผู้ผลิต ChatGPT และคุ้มต้นทุนกว่าในการใช้ชิป Nvidia ราคาแพงในการฝึกระบบ AI โดยใช้ข้อมูลจำนวนมาก และมันสามารถเข้าถึงได้มากขึ้นเมื่อปรากฏอยู่ในร้านแอปของ Apple และ Google เมื่อต้นปีนี้

แต่เป็นบทความวิจัยติดตามผลที่เผยแพร่เมื่อสัปดาห์ที่แล้ว ซึ่งเป็นวันเดียวกับที่ประธานาธิบดีโดนัลด์ ทรัมป์ สาบานตนเข้ารับตำแหน่ง ที่จุดชนวนให้เกิดความตื่นตระหนกตามมา

บทความดังกล่าวเป็นเรื่องเกี่ยวกับโมเดล AI ของ DeepSeek อีกโมเดลหนึ่งที่เรียกว่า R1 ซึ่งแสดงให้เห็นถึงทักษะ “การใช้เหตุผล” ขั้นสูง เช่น ความสามารถในการคิดใหม่เกี่ยวกับแนวทางในการแก้ปัญหาคณิตศาสตร์ และมีราคาถูกกว่าโมเดลที่คล้ายกันใน OpenAI ที่เรียกว่า o1 อย่างเห็นได้ชัด

ราสกอนระบุว่า เขาไม่มีไอเดียว่าในภาพรวมแล้วธุรกิจของ DeepSeek เป็นอย่างไร แต่คิดว่าราคาเป็นจุดที่ทำให้ผู้คนตกใจ

สปุตนิกโมเมนต์ ?

เบื้องหลังดราม่าเกี่ยวกับความสามารถทางเทคนิคของ DeepSeek คือการถกเถียงกันภายในสหรัฐว่าจะแข่งขันกับจีนในด้าน AI อย่างไรดี และมันถูกนำไปโยงกับสิ่งที่เรียกว่า “สปุตนิกโมเมนต์” หรือช่วงเวลาที่รัสเซียส่งดาวเทียมสปุตนิก ซึ่งเป็นดาวเทียมดวงแรกของมนุษยชาติที่ขึ้นไปโคจรรอบโลก ด้วยการใช้เทคโนโลยีดั้งเดิมในการสร้างขีปนาวุธที่ใช้เงินทุนไม่สูงนัก แต่กลับทำให้รัสเซียกลายเป็นประเทศแรกประสบความสำเร็จในการส่งดาวเทียมขึ้นไปในห้วงอวกาศ

มาร์ก แอนเดรส์เซน นักลงทุนจากเวนเจอร์ แคปิตอล โพสต์บนแพลตฟอร์มโซเชียลเอ็กซ์ในวันอาทิตย์ที่เพิ่งผ่านมาว่า “DeepSeek R1 คือช่วงเวลาแห่งสปุตนิกของ AI” ซึ่งเป็นการอ้างอิงถึงการปล่อยดาวเทียมในปี 1957 ที่จุดชนวนให้เกิดการแข่งขันสำรวจอวกาศในช่วงสงครามเย็นระหว่างสหภาพโซเวียตและสหรัฐ

แอนเดรส์เซนซึ่งเคยให้คำแนะนำทรัมป์เกี่ยวกับนโยบายเทคโนโลยี ได้เตือนว่าการควบคุมอุตสาหกรรม AI มากเกินไปโดยรัฐบาลสหรัฐ จะทำให้บริษัทของสหรัฐล้าหลังและช่วยให้จีนก้าวหน้ามากกว่า

ความสนใจที่มีต่อ DeepSeek อาจทำให้กลยุทธ์สำคัญด้านนโยบายต่างประเทศของสหรัฐในช่วงไม่กี่ปีที่ผ่านมา ในการจำกัดการขายเซมิคอนดักเตอร์ AI ที่ออกแบบโดยสหรัฐให้กับจีนพังทลายลง ขณะที่นักวิชาการด้านความสัมพันธ์ระหว่างสหรัฐและจีนบางคนไม่คิดว่ามันเป็นเรื่องบังเอิญ

เกร็กกอรี อัลเลน ผู้อำนวยการศูนย์ Wadhwani AI ของ Center for Strategic and International Studies หรือ CSIS สถาบันคลังสมองชื่อดังของสหรัฐกล่าวว่า นวัตกรรมเทคทางโนโลยีเป็นเรื่องจริง แต่ช่วงเวลาของการเปิดตัวนั้นมีนัยทางการเมือง โดยเปรียบเทียบการประกาศความสำเร็จของ DeepSeek เมื่อสัปดาห์ที่แล้วกับการเปิดตัวโทรศัพท์รุ่นใหม่ของบริษัท Huawei ของจีนซึ่งถูกคว่ำบาตรโดยสหรัฐ ในช่วงที่มีการหารือทางการทูตเกี่ยวกับการควบคุมการส่งออกของรัฐบาลสหรัฐภายใต้การนำของอดีตประธานาธิบดีโจ ไบเดน ในปี 2023

“การพยายามแสดงให้เห็นว่าการควบคุมการส่งออกนั้นไร้ประโยชน์ หรือส่งผลย้อนกลับเป็นเป้าหมายที่สำคัญมากสำหรับนโยบายต่างประเทศจีนในเวลานี้” อัลเลนระบุ

ด้านประธานาธิบดีทรัมป์กล่าวว่า ความก้าวหน้าของ DeepSeek นั้นเป็นข่าวดีหากมันเป็นเรื่องจริง เพราะแสดงให้เห็นว่าคุณไม่จำเป็นต้องใช้เงินมากขนาดนั้น แต่ได้ผลลัพท์ที่เหมือนกัน และการพัฒนาครั้งนี้เป็นการเตือนสติอุตสาหกรรมของเราว่าเราต้องมุ่งเน้นไปที่การแข่งขันเพื่อชัยชนะ

ความก้าวหน้าของ DeepSeek ด้าน AI โดยไม่ต้องใช้เงินจำนวนมาก อาจส่งผลกระทบต่อการลงทุนด้าน AI มูลค่า 5 แสนล้านดอลลาร์ของ OpenAI, Oracle และ SoftBank ที่ทรัมป์เคยโฆษณาไว้ในวันที่เขากลับมายังทำเนียบขาว

ราคาหุ้นของ Nvidia ร่วงลง 17% แต่บริษัทได้ออกแถลงการณ์ชื่นชมผลงานของ DeepSeek ว่าเป็น “ความก้าวหน้าด้าน AI ที่ยอดเยี่ยม” ซึ่งใช้ประโยชน์จาก “โมเดลและการคำนวณที่มีให้ใช้กันอย่างแพร่หลาย และเป็นไปตามข้อกำหนดในการควบคุมการส่งออก”

อะไรที่ทำให้ DeepSeek แตกต่าง ?

สิ่งหนึ่งที่ทำให้ DeepSeek แตกต่างจากคู่แข่งอย่าง OpenAI ก็คือโมเดลของมันเป็น “โอเพ่นซอร์ซ” ซึ่งหมายความว่าทุกคนสามารถเข้าถึงและปรับแต่งได้ฟรี ถึงแม้ว่าบริษัทจะไม่ได้เปิดเผยข้อมูลที่ใช้ในการฝึกอบรมโมเดลก็ตาม

แต่สิ่งที่ทำให้โมเดล R1 ของ DeepSeek ได้รับความชื่นชมมากที่สุดคือสิ่งที่ Nvidia เรียกว่า “ตัวอย่างที่สมบูรณ์แบบการขยายขนาดในช่วงทดสอบ” ซึ่งหมายถึงการที่โมเดล AI แสดงกระบวนการคิดของมันได้อย่างมีประสิทธิภาพ แล้วใช้กระบวนการคิดนั้นในการฝึกฝนเพิ่มเติมต่อไปโดยไม่ต้องป้อนแหล่งข้อมูลใหม่

ลินนาร์ต ไฮม นักวิจัยจาก Rand Corp. กล่าวว่า โดยพื้นฐานแล้ว มันก็คือการคิดออกมาดัง ๆ นั่นเอง และเขาเชื่อว่าโมเดลการใช้เหตุผลของ OpenAI ซึ่งเริ่มต้นด้วย o1 ก็ทำเช่นเดียวกัน และมีแนวโน้มว่าคู่แข่งรายอื่นในสหรัฐ เช่น Anthropic และ Google ก็มีศักยภาพที่คล้ายคลึงกันซึ่งยังไม่ได้เปิดเผยออกมา

“นี่เป็นครั้งแรกที่เราเห็นบริษัทจีนเข้าใกล้เป้าหมายได้ขนาดนั้นภายในระยะเวลาอันสั้น ผมคิดว่านั่นเป็นสาเหตุว่าทำไมผู้คนจำนวนมากจึงให้ความสนใจเรื่องนี้” ไฮมกล่าว “ผมเคยเชื่อว่า OpenAI เป็นผู้นำที่ยอดเยี่ยมที่สุด และไม่มีใครสามารถตามได้ทัน แต่ปรากฏว่ามันไม่จริงเลย”