Skip to content

อาลีบาบา เปิดตัว Qwen3 โมเดล AI รุ่นใหม่ รองรับการใช้งาน 119 ภาษา

02 พ.ค. 2568 | 12:55น.
อาลีบาบา เปิดตัว Qwen3 โมเดล AI รุ่นใหม่ รองรับการใช้งาน 119 ภาษา

อาลีบาบาเปิดตัว “Qwen3” โมเดล LLM โอเพ่นซอร์ซรุ่นใหม่ เทรนจากชุดข้อมูลขนาดใหญ่ 36 ล้านล้านโทเค็น มากกว่ารุ่นก่อนหน้า 2 เท่า ชูจุดเด่นสลับใช้งาน 2 โหมด-รองรับ 119 ภาษา

รายงานข่าวจากอาลีบาบา คลาวด์ เปิดเผยว่า “อาลีบาบา” (Alibaba) เปิดตัว “Qwen3” โมเดลภาษาขนาดใหญ่ (LLM) แบบโอเพ่นซอร์ซรุ่นล่าสุดที่ประกอบด้วย 6 dense model และ 2 Mixture-of-Experts (MoE) model ซึ่งช่วยให้ผู้พัฒนาซอฟต์แวร์สร้างแอปพลิเคชั่นยุคใหม่สำหรับอุปกรณ์เคลื่อนที่ แว่นตาอัจฉริยะ ยานยนต์ไร้คนขับ หุ่นยนต์ และอื่น ๆ อีกมากมาย

Qwen3 เป็น hybrid reasoning models แรกของอาลีบาบา ที่รวมความสามารถของ LLM แบบเดิม เข้ากับการใช้เหตุผลแบบไดนามิก สามารถสลับการใช้งานทั้งสองโหมดไปมา โดยใช้ thinking mode กับงานที่ซับซ้อนหลายขั้นตอน เช่น คณิตศาสตร์ การเขียนโค้ด การอนุมานเชิงตรรกะ และใช้ Nonthinking mode เมื่อต้องการการตอบสนองที่รวดเร็วและตามวัตถุประสงค์ทั่ว ๆ ไป

นักพัฒนาซอฟต์แวร์ที่เข้าใช้งาน Qwen3 ผ่าน API จะสามารถควบคุมระยะเวลาการคิดอย่างละเอียด (สูงสุด 38K โทเค็น) ช่วยให้เกิดสมดุลระหว่างการดำเนินงานและประสิทธิภาพในการประมวลผล โดยเฉพาะ Qwen3-235B-A22B MoE model ที่ช่วยลดต้นทุนการติดตั้งใช้งานเมื่อเทียบกับโมเดลระดับเดียวกันอื่น ๆ

ทั้งนี้ Qwen3 ได้รับการเทรนจากชุดข้อมูลขนาดใหญ่จำนวน 36 ล้านล้านโทเค็น ซึ่งมากกว่า Qwen2.5 ซึ่งเป็นรุ่นก่อนหน้าถึง 2 เท่า จึงมีประสิทธิภาพทั้งด้านการใช้เหตุผล การทำตามคำสั่ง การใช้เครื่องมือและงานที่เป็นภาษาต่าง ๆ หลายภาษา โดยความสามารถสำคัญ ๆ ได้แก่

  • เชี่ยวชาญหลายภาษา : รองรับ 119 ภาษาหลักและภาษาถิ่น มีความสามารถในการแปลและปฏิบัติตามคำสั่งได้หลายภาษาด้วยประสิทธิภาพสูง
  • สามารถผสานรวมเอเจนต์ประสิทธิภาพสูง : รองรับ Model Context Protocol (MCP) และการเรียกใช้ฟังก์ชั่น หรือการเรียกใช้เครื่องมือที่ทรงประสิทธิภาพ นับเป็นโมเดลโอเพ่นซอร์ซระดับแนวหน้า เพื่องานที่ต้องใช้เอเจนต์ที่ซับซ้อน
  • มีการใช้เหตุผลที่เหนือกว่า : เหนือกว่าโมเดล Qwen รุ่นก่อนหน้า (QwQ ใช้ thinking mode และ Qwen2.5 ใช้ Nonthinking mode) ในด้านการวัดประสิทธิภาพทางคณิตศาสตร์ การเขียนโค้ด และการใช้เหตุผลเชิงตรรกะ
  • สอดคล้องกับความคิดและพฤติกรรมของมนุษย์มากขึ้น : สามารถมอบการเขียนเชิงสร้างสรรค์ การแสดงบทบาทสมมติ และการสนทนาโต้ตอบไปมา เพื่อทำให้การสนทนาเป็นธรรมชาติและน่าสนใจมากขึ้น

รายงานระบุด้วยว่า ความก้าวหน้าทางสถาปัตยกรรมของโมเดล ปริมาณข้อมูลการเทรนที่เพิ่มขึ้น และวิธีการเทรนที่มีประสิทธิภาพมากขึ้น ช่วยให้ Qwen3 สามารถทำผลงานได้อย่างโดดเด่นในการทดสอบระดับมาตรฐานอุตสาหกรรมต่าง ๆ เช่น

AIME25 (การให้เหตุผลทางคณิตศาสตร์), LiveCodeBench (ความสามารถในการเขียนโค้ด), BFCL (ความสามารถในการใช้เครื่องมือและการเรียกใช้ฟังก์ชั่น) และ Arena-Hard (เกณฑ์มาตรฐานสำหรับ LLM ที่สามารถปรับแต่งเพื่อให้เข้าใจและทำตามคำสั่งเฉพาะได้)

Qwen3 model
ผลการทดสอบประสิทธิภาพโมเดล Qwen3

นอกจากนี้ ยังมีการนำกระบวนการเทรนสี่ขั้นตอนมาใช้เพื่อพัฒนา hybrid reasoning model ประกอบด้วย การเริ่มต้นการเทรนให้มีความสามารถในการใช้เหตุผลแบบเป็นขั้นตอน โดยใช้ห่วงโซ่การคิดที่เป็นลำดับในปริมาณจำกัดตั้งแต่ระยะแรกของการเทรน (long chain-of-thought cold start)

การเรียนรู้แบบเสริมแรงโดยใช้เหตุผล (reasoning-based reinforcement learning : RL), การผสาน thinking mode (thinking mode fusion) และการเรียนรู้แบบเสริมแรงทั่วไป (general RL)

ทั้งนี้ โมเดล Qwen3 พร้อมให้ดาวน์โหลดฟรีบน Hugging Face, Github, ModelScope และสามารถทดลองใช้ได้ที่ chat.qwen.ai สำหรับการเข้าใช้ผ่าน API บน Model Studio ซึ่งเป็นแพลตฟอร์มสำหรับการพัฒนาโมเดล AI ของอาลีบาบาจะเปิดให้เข้าใช้ได้เร็ว ๆ นี้ รวมถึง Qwen3 ยังเป็นโมเดลที่ขับเคลื่อน Quark ซึ่งเป็นแอปพลิเคชั่นผู้ช่วยอัจฉริยะ AI สำคัญของอาลีบาบาอีกด้วย

แท็กที่เกี่ยวข้อง

AI อาลีบาบา