อาลีบาบา คลาวด์ เปิด Qwen 2.5 มัลติเอไอ 100 โมเดล พร้อมลุย Text to Video

อาลีบาบา คลาวด์ เปิดตัวโมเดล AI ใหม่ โอเพ่นซอร์ซ Qwen 2.5 และปรับปรุงโครงสร้างพื้นฐานรองรับการประมวลผลด้วย AI พร้อมลุยโมเดลแปลงข้อความเป็นวิดีโอ (Text-to-Video AI Model) ใหม่เพื่อยกระดับงานการสร้างสรรค์

วันที่ 19 กันยายน 2567 นายเอ็ดดี้ วู ประธานและซีอีโอของอาลีบาบา คลาวด์ อินเทลลิเจนซ์ กล่าวว่า “อาลีบาบา คลาวด์ ลงทุนด้านการวิจัยและพัฒนาเทคโนโลยี AI และการสร้างโครงสร้างพื้นฐานระดับโลกของบริษัทอย่างจริงจังในครั้งนี้ ด้วยเรามุ่งมั่นสร้างโครงสร้างพื้นฐาน AI แห่งอนาคต เพื่อให้บริการลูกค้าทั่วโลก และให้ลูกค้าของเราได้พบกับโอกาสทางธุรกิจอย่างไม่มีข้อจำกัด

โดยอาลีบาบา คลาวด์ ธุรกิจด้านเทคโนโลยีดิจิทัลและหน่วยงานหลักด้านอินเทลลิเจนซ์ของอาลีบาบา กรุ๊ป ประกาศ ณ งาน Apsara Conference ซึ่งเป็นงานประชุมประจำปีครั้งสำคัญของบริษัทว่าได้นำเสนอ Owen 2.5 ซึ่งเป็นโมเดลด้านภาษาขนาดใหญ่ของบริษัทที่เพิ่งเปิดตัวล่าสุด มากกว่า 100 โมเดลให้กับชุมชนโอเพ่นซอร์ซทั่วโลก

นอกจากนี้ อาลีบาบา คลาวด์ ยังได้เปิดตัวโครงสร้างพื้นฐานที่จำเป็นต่อการสร้าง ทดสอบ และการใช้งานแอปพลิเคชั่นต่าง ๆ (full-stack infrastructure) ที่ออกแบบมาเพื่อให้ตอบโจทย์ความต้องการการประมวลผลที่ทรงพลังเพื่อใช้กับ AI ที่เพิ่มมากขึ้น โดยโครงสร้างพื้นฐานใหม่นี้ประกอบด้วยผลิตภัณฑ์และบริการคลาวด์ล้ำหน้า ที่ช่วยให้การประมวลผล เครือข่าย และสถาปัตยกรรมศูนย์ข้อมูลมีประสิทธิภาพสูงขึ้น โดยมีจุดหมายเพื่อสนับสนุนการพัฒนาที่ประสบความสำเร็จอย่างงดงาม และการใช้โมเดล AI ต่าง ๆ ได้ในวงกว้าง

โมเดลโอเพ่นซอร์ซ 100 โมเดล

โมเดลโอเพ่นซอร์ซต่าง ๆ ของ Owen 2.5 ที่เพิ่งเปิดตัวใหม่ มีพารามิเตอร์ตั้งแต่ขนาด 0.5 ถึง 72 พันล้านพารามิเตอร์ มีความรอบรู้มากขึ้น มีความสามารถด้านคณิตศาสตร์และการเขียนโค้ดอย่างมาก สามารถรองรับได้มากกว่า 29 ภาษา รองรับการใช้ AI ได้หลากหลายทั้งการใช้งานที่ edge หรือบนคลาวด์ ในทุกแวดวง ไม่ว่าจะเป็นวงการยานยนต์ วงการเกม ไปจนถึงการวิจัยทางวิทยาศาสตร์

ซีรีส์โมเดล Owen ซึ่งเป็นพอร์ตโฟลิโอของโมเดลภาษาขนาดใหญ่ที่เป็นเอกสิทธิ์ของอาลีบาบา คลาวด์ ประสบความสำเร็จอย่างงดงามตั้งแต่เปิดตัวครั้งแรกเมื่อเดือนเมษายน 2566 ปัจจุบัน ยอดดาวน์โหลดโมเดลต่าง ๆ ของ Owen ทะลุ 40 ล้านครั้ง จากทุกแพลตฟอร์ม เช่น Hugging Face และ ModelScope ซึ่งเป็นชุมชนโอเพ่นซอร์ซที่ตั้งขึ้นโดยอาลีบาบา ยิ่งไปกว่านั้นโมเดลเหล่านี้ยังเป็นแรงกระตุ้นให้เกิดการสร้างสรรค์โมเดลต่าง ๆ มากกว่า 50,000 รายการบน Hugging Face

ADVERTISMENT

Owen 2.5 จะโอเพ่นซอร์ซโมเดลมากกว่า 100 รายการ กลุ่มผลิตภัณฑ์นี้ประกอบด้วย โมเดลพื้นฐาน (base models) โมเดลคำสั่ง (instruct models) และโมเดลเชิงปริมาณ (quantized models) ที่มีระดับความแม่นยำและวิธีการหลากหลาย ครอบคลุมการใช้งานรูปแบบต่าง ๆ เช่น ภาษา เสียง และภาพ พร้อมด้วยโค้ดเฉพาะทางและโมเดลทางคณิตศาสตร์ต่าง ๆ

อาลีบาบา คลาวด์ ยังได้ประกาศว่าได้อัพเกรด Qwen-Max ซึ่งเป็นโมเดลเรือธงที่บริษัทเป็นเจ้าของโมเดล Qwen-Max ที่ได้รับการเพิ่มประสิทธิภาพ แสดงให้เห็นถึงประสิทธิภาพที่ทัดเทียมกันกับโมเดลที่ล้ำสมัยอื่น ๆ ในด้านต่าง ๆ เช่น ความเข้าใจภาษาและการใช้เหตุผล คณิตศาสตร์ และการเขียนโค้ด
Qwen2.5-Max แสดงให้เห็นถึงความทรงประสิทธิภาพในงานด้านต่าง ๆ เช่น คณิตศาสตร์และการเขียนโค้ด เมื่อเทียบกับโมเดลล้ำสมัยรุ่นอื่น ๆ

ADVERTISMENT

เปลี่ยนข้อความเป็นวิดีโอ

นอกจากชุดโมเดลภาษาขนาดใหญ่ที่แพร่หลายแล้ว อาลีบาบา คลาวด์ ยังได้เปิดตัวโมเดลที่สามารถแปลงข้อความเป็นวิดีโอ (text-to-video) ใหม่ให้เป็นส่วนหนึ่งของโมเดลการสร้างรูปภาพในตระกูลทงอี้ ว่านเซี่ยง (Tongyi Wanxiang) โมเดลใหม่นี้สามารถสร้างวิดีโอคุณภาพสูงในรูปแบบที่หลากหลาย ไม่ว่าจะเป็นฉากสมจริง ไปจนถึงภาพเคลื่อนไหว 3 มิติ (3D animation) ทั้งยังสามารถสร้างวิดีโอจากคำสั่งที่เป็นข้อความภาษาจีนและภาษาอังกฤษ และแปลงภาพนิ่งเป็นวิดีโอที่มีการเคลื่อนไหว โมเดลนี้มีสถาปัตยกรรม diffusion transformer (DiT) ขั้นสูงเพื่อเพิ่มคุณภาพให้กับการสร้างวิดีโอใหม่

บริษัทยังกำลังทำการอัพเดตโมเดลภาษาภาพ (vision language model) ครั้งสำคัญ ด้วยการเปิดตัว Owen2-VL ซึ่งสามารถเข้าใจวิดีโอที่มีความยาวมากกว่า 20 นาที และสามารถตอบคำถามผ่านวิดีโอได้ Owen2-VL มาพร้อมความสามารถในการใช้เหตุผลและการตัดสินใจที่ซับซ้อน ได้รับการออกแบบมาสำหรับใช้ได้ทั้งกับโทรศัพท์มือถือ ยานยนต์ และหุ่นยนต์ ช่วยให้การทำงานเฉพาะทางเป็นไปโดยอัตโนมัติ

อาลีบาบา คลาวด์ ยังได้เปิดตัว AI Developer ซึ่งเป็นผู้ช่วยด้าน AI ที่มี Qwen เป็นเทคโนโลยีหลักอยู่เบื้องหลัง ออกแบบมาสำหรับการเขียนโปรแกรม โดยสนับสนุนการทำงานแบบอัตโนมัติให้กับโปรแกรมเมอร์ เช่น การวิเคราะห์ความต้องการ การเขียนโปรแกรมโค้ด การระบุจุดบกพร่องของซอฟต์แวร์และทำการแก้ไข ความสามารถเหล่านี้ช่วยเพิ่มทักษะให้นักพัฒนา และช่วยให้มุ่งความสนใจกับงานสำคัญอื่น ๆ ได้มากขึ้น

การอัพเกรดโครงสร้างพื้นฐาน AI แบบฟูลสแต็ก

อาลีบาบา คลาวด์ ยังได้ประกาศการอัพเดตใหม่ ๆ จำนวนมากให้กับโครงสร้างพื้นฐาน AI แบบฟลูสแต็ก ครอบคลุมถึง สถาปัตยกรรมดาต้าเซ็นเตอร์ที่เป็นมิตรต่อสิ่งแวดล้อม การบริหารจัดการข้อมูล การเทรนและการอนุมานโมเดล ดังนี้

● สถาปัตยกรรมดาต้าเซ็นเตอร์ยุคใหม่รองรับความต้องการการพัฒนา AI ที่กำลังพุ่งสูงขึ้น : อาลีบาบา คลาวด์ เปิดตัว CUBE DC 5.0 ซึ่งเป็นสถาปัตยกรรมดาต้าเซ็นเตอร์รุ่นใหม่ของบริษัท เพื่อตอบโจทย์ความต้องการและความหลากหลายของการประมวลผลสมรรถนะสูงที่เพิ่มขึ้นจากการเติบโตอย่างรวดเร็วของ AI ทั่วโลก สถาปัตยกรรม CUBE ใหม่นี้ช่วยเพิ่มประสิทธิภาพในการใช้พลังงานและการดำเนินงาน

ด้วยชุดเทคโนโลยีขั้นสูงที่เป็นกรรมสิทธิ์ของบริษัท เช่น ระบบระบายความร้อนแบบไฮบริดด้วยลมและของเหลว (wind-liquid hybrid cooling system) สถาปัตยกรรมกระจายพลังงานกระแสตรงทั้งหมด (all-direct current power distribution architecture) และระบบบริหารจัดการอัจฉริยะ รวมถึงลดเวลาในการนำไปใช้ ได้ถึง 50% เมื่อเทียบกับดาต้าเซ็นเตอร์แบบเดิมที่สร้างด้วยการออกแบบแบบแยกส่วนแล้วนำมาประกอบกัน (prefabricated modular)

● โซลูชั่น Open Lake เพื่อใช้ข้อมูลให้เป็นประโยชน์สูงสุด : การที่องค์กรต่าง ๆ เผชิญความท้าทายด้านการบริหารจัดการข้อมูลมหาศาลท่ามกลางการความต้องการด้าน generative AI ที่เพิ่มมากขึ้น อาลีบาบา คลาวด์ เปิดตัว Alibaba Cloud Open Lake ซึ่งสามารถบูรณาการเอนจิ้นบิ๊กดาต้าไปยัง

โซลูชั่นครบวงจรหนึ่ง ๆ ได้อย่างราบรื่น จึงใช้ประโยชน์จากข้อมูลได้เต็มประสิทธิภาพ โดยเฉพาะการใช้งานกับ generative AI การผสานรวมเวิร์กโฟลว์ ประสิทธิภาพการทำงานที่มากขึ้น และการกำกับดูแลที่รัดกุมไว้บนแพลตฟอร์มเดียว ทำให้ใช้ทรัพยากรได้อย่างมีประสิทธิภาพ ด้วยคอมพิวต์สตอเรจที่แยกกัน การกำกับดูแลข้อมูลที่ชัดเจน และประหยัดค่าใช้จ่ายและเวลาได้อย่างมาก

● AI Scheduler พร้อมการเทรนและอนุมานโมเดลแบบองค์รวม : อาลีบาบา คลาวด์ เปิดตัว PAI AI Scheduler ที่มาพร้อมการเทรนและอนุมานโมเดลแบบบูรณาการ ซึ่งเป็นเอนจิ้นการจัดกำหนดการแบบคลาวด์-เนทีฟที่เป็นกรรมสิทธิ์ของบริษัท ที่ออกแบบมาเพื่อเพิ่มประสิทธิภาพการบริหารจัดการทรัพยากรการประมวลผล การผสานรวมทรัพยากรการประมวลผลหลากหลาย การจัดการการกำหนดทรัพยากรที่ยืดหยุ่น การปรับเปลี่ยนงานได้แบบเรียลไทม์ และการกู้คืนข้อผิดพลาดอัตโนมัติ ไว้ด้วยกันอย่างชาญฉลาด ทำให้สามารถบรรลุอัตราการใช้ประโยชน์การประมวลผลที่มีประสิทธิภาพได้มากกว่า 90%

● DMS สำหรับการบริหารจัดการเมตาดาต้าแบบองค์รวม : อาลีบาบา คลาวด์ เปิดตัว DMS : OneMeta+OneOps ซึ่งเป็นแพลตฟอร์มที่ช่วยให้บริหารจัดการแหล่งข้อมูลมากกว่า 40 ประเภทที่อยู่ในฐานข้อมูล คลังข้อมูล และดาต้าเลก บนสภาพแวดล้อมคลาวด์หลายแห่งได้เป็นหนึ่งเดียว เพื่อช่วยองค์กรบริหารจัดการข้อมูลได้อย่างมีประสิทธิภาพและได้ใช้คุณประโยชน์ของข้อมูลเหล่านั้น แพลตฟอร์มนี้จะเพิ่มความเร็วในการใช้ข้อมูลได้ 10 เท่า เป็นการเพิ่มประสิทธิภาพในการเปลี่ยนข้อมูลให้กลายเป็นความชาญฉลาดที่มีคุณค่าและองค์กรนำไปใช้ประโยชน์ได้อย่างมีนัยสำคัญ

● บริการการประมวลผลแบบยืดหยุ่นที่มีประสิทธิภาพมากขึ้น : อาลีบาบา คลาวด์ เปิดตัวอินสแตนซ์ Elastic Compute Service (ECS) สำหรับองค์กรเป็นรุ่นที่ 9 โดยอินสแตนซ์ ECS รุ่นล่าสุดนี้มีการปรับปรุงประสิทธิภาพอย่างโดดเด่น ซึ่งรวมถึงเพิ่มความเร็วในการแนะนำการค้นหา 30% และเพิ่มประสิทธิภาพการอ่านและเขียน Queries Per Second (QPS) 17% เมื่อใช้กับผลิตภัณฑ์ด้านฐานข้อมูลต่าง ๆ เทียบกับรุ่นก่อนหน้า

การอัพเดตเหล่านี้ได้รับการออกแบบมาเพื่อให้การสนับสนุนที่ครบวงจรแก่ลูกค้าและพันธมิตร เพื่อให้ลูกค้าและพันธมิตรได้รับประโยชน์สูงสุดจากเทคโนโลยีล่าสุดที่ใช้ในการสร้างแอปพลิเคชั่น AI ทรงประสิทธิภาพ อย่างยั่งยืน และครอบคลุมมากขึ้น