Google I/O เปิดตัวฟีเจอร์สเอไอ ตั้งแต่ระดับโมเดล ยันระดับฮาร์ดแวร์ หลัง OpenAI เปิดตัว GPT-4o ปล่อย Android 15 เวอร์ชั่นทดสอบรุ่นที่สอง ลุ้นตัวเต็มอัพเกรดให้ใช้ Gemini ง่ายขึ้น
วันที่ 15 พฤษภาคม 2567 ผู้สื่อข่าว “ประชาชาติธุรกิจ” รายงานว่า เมื่อค่ำคืนที่ผ่านมา บริษัท Google ได้จัดงาน Google I/O Conference 2024 ซึ่งเป็นงานรวบรวมเหล่านักพัฒนาซอฟต์แวร์ และได้ประกาศอัพเดตฟีเจอร์ใหม่ ๆ หลายระดับตั้งแต่ระดับโมเดล GenerativeAI ของ Gemini จนถึงระดับอัพเกรดฮาร์ดแวร์ชิปประมวลผล
อย่างไรก็ตาม ฟีเจอร์หรือเครื่องมือหลายอย่างที่ Google เปิดตัววันงานนี้ อยู่ในขั้นตอนการทดสอบหรือจำกัดเฉพาะนักพัฒนาเท่านั้น
การประกาศดังกล่าวเปิดตัวขึ้นภายหลังบริษัท OpenAI ได้เปิดตัวโมเดล GPT-4o ซึ่งมีความสามารถโต้ตอบกับมนุษย์ได้ไหลลื่นมากขึ้น ด้วยข้อความ เสียง และวิดีโอ (Omni)
สำนักข่าว CNBC มองว่า การขนผลิตภัณฑ์เอไอที่อัพเกรดนี้ สะท้อนให้เห็นว่ายักษ์ใหญ่ด้านเทคโนโลยีกำลังคิดและลงทุนเพื่อสร้างรายได้จากเอไอ ปัจจุบัน Google ทำเงินจากเอไอโดยคิดจากลูกค้าที่จ่ายให้โมเดลภาษา Gemini Advance ซึ่งเป็นคู่แข่งของ ChatGPT ซึ่งมีค่าใช้จ่าย 19.99 ดอลลาร์ต่อเดือน และสามารถช่วยให้ผู้ใช้สรุป PDF กูเกิลด็อก และอื่น ๆ ได้
ผู้สื่อข่าวรวบรวมไฮไลต์สำคัญในงาน Google I/O 2024 ดังนี้
อัพเกรดโมเดลเอไอ Gemini เป็น Gemini 1.5 Pro
โมเดล AI ที่จะสามารถจัดการกับข้อมูลได้มากขึ้นในไม่ช้า ตัวอย่างเช่น เครื่องมือนี้สามารถสรุปข้อความ 1500 หน้าซึ่งอัพโหลดโดยผู้ใช้
ทั้งมีการเพิ่ม Gemini 1.5 Flash รุ่นใหม่ ออกแบบมาสำหรับงานขนาดเล็กกว่า เช่น สรุปการสนทนา คำบรรยายภาพและวิดีโอได้อย่างรวดเร็ว และดึงข้อมูลจากเอกสารขนาดใหญ่จากไฟล์แนบได้ ทั้งมีการปรับปรุงการแปลของ Gemini จะพร้อมใช้งานใน 35 ภาษา ภายใน Gmail
Gemini 1.5 Pro จะวิเคราะห์ PDF และวิดีโอที่แนบมา โดยให้บทสรุปและอื่น ๆ พิชัยกล่าว นั่นหมายความว่าถ้าพลาดการโต้ตอบกลับอีเมล์ยาว ๆ ในวันหยุด Gemini จะสามารถสรุปได้พร้อมแนบไฟล์แนบต่าง ๆ
Google Veo โมเดลเอไอใหม่ใช้งานกับภาพและวิดีโอ
Google Veo เป็นโมเดลล่าสุดสำหรับการสร้างวิดีโอความละเอียดสูง และ Imagen 3 ซึ่งเป็นโมเดล Text to Image ที่มีคุณภาพสูงสุด
Veo น่าจะเป็นโมเดลท้าชิง OpenAI Sora ที่เปิดตัวมาสร้างความฮือฮาไปก่อนหน้านี้ ในการสร้างฟุตเทจภาพยนตร์จาก “Text”

นอกจากนี้ ยังได้โชว์ความสามารถในการสร้างการสนทนาด้วยเสียงตามข้อความ ตัวอย่างเช่น หากผู้ใช้อัพโหลดแผนการเรียน แชตบอตสามารถพูดสรุปได้ หรือถ้าถามตัวอย่างปัญหาวิทยาศาสตร์ในชีวิตจริงก็สามารถทำได้
ซึ่งการพูดคุยสนทนาทำได้ลื่นไหล สามารถพูดแทรกเข้าไปได้ระหว่าง Gen เสียงหรือข้อความ
คล้ายกับการเปิดตัว GPT-4o พอสมควร
ฟีเจอร์สการค้นหาแบบใหม่
New Search Features หรือ “AI Overviews” ใน Google Search แสดงให้เห็นบทสรุปอย่างรวดเร็วของคำตอบสำหรับคำถามค้นหาที่ซับซ้อนที่สุด
ทั้งยังสามารถบูรณาการการค้นหาด้วยภาพและวิดีโอเพิ่มเติมภายในเครื่องมือ ตัวอย่างคือ เราสามารถถ่ายวิดีโอเครื่องเล่นแผ่นเสียงที่เสียหาย แล้วถามว่าทำไมเครื่องเล่นมันถึงไม่ทำงาน
จากนั้น Google Search จะประเมินอาการ และหารูปแบบของเครื่องเล่นแผ่นเสียง แล้วแนะนำว่าอาจทำงานผิดปกติเนื่องจากอะไร
Ask Photo
การพัฒนาฟีเจอร์ค้นหาด้วยภาพจะมีการอัพเกรดแม้ Google Photos มีความสามารถในการรับรู้ข้อความในการภาพถ่ายอยู่แล้ว แต่การค้นหาด้วยภาพ และข้อความล่าสุดต่อยอดด้วย Gemini ใน Google Photos จะช่วยให้ค้นหาภาพที่เฉพาะเจาะจง หรือการค้นหาในแบบส่วนตัว เช่น การค้นหา “เลขทะเบียนรถของฉันคืออะไรนะ ?” ซึ่งให้ผลลัพธ์ที่แน่นอนและเป็นส่วนตัวที่เราเท่านั้นที่มี
AI Teammate
Google อยู่ในช่วงทดสอบ “AI Teammate” ซึ่งจะรวมเข้ากับ Google Workplace สามารถสร้างคอลเล็กชั่นงานที่ค้นหาได้จากข้อความและเทรดอีเมล์ด้วย PDF และเอกสารเพิ่มเติม
ตัวอย่างเช่น สามารถถาม AI Teammate ว่า “เราพร้อมสำหรับการเปิดตัวผลิตภัณฑ์แล้วหรือยัง” และผู้ช่วยจะให้การวิเคราะห์และสรุปตามข้อมูลที่สามารถเข้าถึงใน Gmail Google Docs และแอป Workspace อื่น ๆ
Project Astra
ความก้าวหน้าล่าสุดของ Google ที่มีต่อผู้ช่วย AI ที่สร้างโดยหน่วย AI ของ Google เป็นเพียงต้นแบบสำหรับตอนนี้ พัฒนาโดย Deepmind บริษัทเอไอในเครือ Google
Google มีจุดมุ่งหมายเพื่อพัฒนา J.A.R.V.I.S เวอร์ชั่นโทนี่ สตาร์ค ผู้ช่วยเอไอผู้รอบรู้จากจักรวาลมาร์เวล
Google Tensor หน่วยประมวลผลเอไอ TPU
ในด้านฮาร์ดแวร์ Google พูดถึง Trillium หรือ Tensor Processing Unit รุ่นที่ 6 ฮาร์ดแวร์นี้จะเป็นส่วนประกอบสำคัญสำหรับการดำเนินงาน AI ที่ซับซ้อน ซึ่งจะพร้อมใช้งานสำหรับลูกค้าคลาวด์ในปลายปี 2024
การประมวลผลของชิป Google Tensor จะมีเพื่อ Gemini AI โดยเฉพาะ
นอกจากนี้ ยังมีการปล่อยเวอร์ชั่นทดสอบรุ่นที่ 2 ของระบบปฏิบัติการ Android 15 ซึ่งคาดว่าจะได้เห็นขุมพลังของผู้ช่วยเอไอ Gemini มากขึ้น โดยเฉพาะการใส่เข้าไปในสมาร์ทโฟน Pixel, Samsung และอื่น ๆ