Google ประกาศผลการทดสอบ Gemini 1.0 เหนือชั้นกว่า GPT-4

ความเป็นมาของ Google DeepMind ผู้พัฒนา Gemini 1.0

Google DeepMind เกิดขึ้นจากการประกาศรวมทีม Google Brain และ DeepMind เข้าเป็นทีมเดียวกัน โดยทั้งสองทีมมีความเป็นมาคือ

Google Brain ก่อตั้งขึ้นเมื่อปี 2011 ถือเป็นแพลตฟอร์ม Deep Learning ของ Google และมีส่วนร่วมในโครงการเช่น Google Translate และ TensorFlow ซึ่งเป็น library software แบบ open source ที่เปิดให้ผู้ใช้งานสามารถฝึก machine learning ของตนเองได้

ส่วน DeepMind ก่อตั้งขึ้นเมื่อปี 2010 และ Google ได้เข้าซื้อกิจการเมื่อปี 2014 โดยมีโครงการของ DeepMind เช่น AlphaGo (Deep Learning AI) เป็นต้น

CEO ของ Alphabet และ Google ได้กล่าวถึงการรวมทีมเป็น Google DeepMind ไว้ว่า “การควบรวมทีมวิจัย AI ทั้งสองทีมนี้จะช่วยเร่งประสิทธิภาพและความก้าวหน้าด้าน AI อย่างมีนัยสำคัญ” และยังกล่าวถึง Demis Hassabis ซึ่งเข้ามาเป็น CEO ของ Google DeepMind ว่า “เขาจะมาเป็นผู้นำทีมพัฒนา AI ที่มีความสามารถใหม่ๆ และมาพร้อมกับการรักษาความปลอดภัยของ AI”

Gemini คืออะไร

Gemini คือโมเดล AI ที่เป็นโมเดลภาษาขนาดใหญ่ที่สุดและมีความสามารถมากที่สุดของ Google DeepMind

Google Gemini1.0
Input และ Output ของ Gemini 1.0

Gemini รับข้อมูลอินพุตได้หลากหลายประเภท ไม่ว่าจะเป็นข้อความ (text), code, เสียง, รูปภาพ และวิดีโอ ถือเป็นโมเดลที่ยืดหยุ่นที่สุด สามารถทำงานได้ทั้งบน Data Center ขนาดใหญ่และบนอุปกรณ์เคลื่อนที่อย่างสมาร์ทโฟน โดยทาง Google ได้เผยแพร่คลิปวิดีโอ ในการโต้ตอบกับ Gemini ด้วยการวาดภาพให้ Gemini ทาย

จากคลิปวิดีโอดังกล่าวจะเห็นได้ว่า Gemini สามารถอธิบายภาพที่วาดขึ้นได้ถูกต้อง แถมยังให้ความรู้อย่างละเอียดประกอบอีกด้วย ซึ่งทั้งข้อความที่ Gemini แสดงขึ้นมาและเสียงที่พูดประกอบก็เป็นธรรมชาติมาก

นอกจากภาพวาดแล้ว เมื่อผู้ทดสอบหยิบสิ่งของขึ้นมาเทียบกับภาพวาด Gemini ก็แสดงความตกใจได้อย่างเป็นธรรมชาติ และยังสามารถทำนายถูกอีกด้วยว่าวัตถุที่ผู้ทดสอบหยิบขึ้นมาแสดงนั้นคืออะไร ยิ่งไปกว่านั้น ยังสามารถแสดงและออกเสียงภาษาอื่นๆ สำหรับเรียกวัตถุนั้นให้เราทราบอีกด้วย

แค่เริ่มต้นก็น่าสนใจแล้ว แต่ยังไม่จบเท่านี้ Gemini ยังสามารถสร้างเกมขึ้นมาเล่นกับเราได้อีกด้วย พร้อมทั้งให้ความรู้ และเฉลยเกมได้อย่างถูกต้อง นี่เป็นแค่ส่วนหนึ่งจากในคลิปวิดีโอเท่านั้น หากใครดูจนจบจะต้องทึ่งในความสามารถของ Gemini อย่างแน่นอน

3 รุ่นย่อยของ Gemini มีอะไรบ้าง

3 รุ่นย่อยของ Gemini 1.0
  1. Gemini Ultra: โมเดลขนาดใหญ่ที่สุด สามารถประมวลผลการทำงานที่ซับซ้อนสูงได้
  2. Gemini Pro: โมเดลขนาดกลาง เป็นโมเดลที่ดีที่สุดในการปรับขนาดสำหรับการใช้งานที่หลากหลาย
  3. Gemini Nano: โมเดลรุ่นที่มีประสิทธิภาพที่สุดสำหรับการใช้งานบนอุปกรณ์ เช่น สมาร์ทโฟน โดยมี Google Pixel 8 Pro เป็นสมาร์ทโฟนรุ่นแรกที่สามารถใช้งาน Gemini Nano ได้

ผลการทดสอบ Gemini Ultra เหนือกว่า GPT-4 แทบทุกด้าน

เมื่อเทียบผลการทดสอบของ GPT-4 จาก OpenAI กับ Gemini Ultra ของ Google ปรากฏว่า Gemini เอาชนะ GPT-4 ในหลายๆ ด้าน เช่น MMLU (Measuring Massive Multitask Language Understanding) หรือชุดคำถามความรู้เชิงวิชาการและความเข้าใจภาษาในเรื่องต่างๆ โดย Gemini ทำคะแนนได้ถึง 90% ในขณะที่ GPT-4 ทำคะแนนได้ 86.4%

นอกจากนี้ ผลการทดสอบด้านคณิตศาสตร์และการเขียนโค้ดของ Gemini ก็เอาชนะ GPT-4 ได้เช่นกัน

Gemini Ultra comparing with GPT-4

ในส่วนของการทำความเข้าใจข้อมูลภาพ วิดีโอ และเสียง ก็จะเห็นได้ว่า Gemini มีผลคะแนนสูงกว่า GPT-4 แทบทุกหัวข้อการทดสอบ

Gemini comparing with GPT-4V

ปัจจุบันผลิตภัณฑ์ของ Google ได้นำเสนอ Gemini 1.0 ให้ผู้คนกว่า 170 ประเทศทั่วโลกได้ใช้งานเป็นภาษาอังกฤษ และมีแผนจะพัฒนาให้รองรับภาษาอื่นๆ เพิ่มขึ้นในอนาคต

เตรียมพบกับ Gemini Ultra เร็วๆ นี้

Google กำลังทำการทดสอบความปลอดภัยและความน่าเชื่อถือของ Gemini Ultra โดยมีแผนจะเปิดให้บริการแก่ลูกค้า นักพัฒนาระบบ คู่ค้า และผู้เชี่ยวชาญด้านความปลอดภัยบางส่วนได้ทดลองใช้งานและให้ข้อเสนอแนะในการปรับปรุง ก่อนจะเปิดตัวให้นักพัฒนาทั่วไปและลูกค้าองค์กรได้ใช้งานต่อไป

บทสรุป

AI และ Machine Learning กำลังพัฒนาไปอย่างไม่หยุดยั้ง ทำให้เราเห็นความสามารถของ AI chatbots อย่าง Gemini 1.0 ที่จะนำมาช่วยในการทำงานของมนุษย์ได้อย่างแน่นอน เพราะการโต้ตอบกับมนุษย์อย่างเป็นธรรมชาติและความรอบรู้ที่อาจจะมากกว่ามนุษย์เพราะ Gemini มีแหล่งข้อมูลขนาดใหญ่และสามารถประมวลผลข้อมูลได้อย่างละเอียด ในอนาคตเราคงจะได้เห็น AI ที่มีความเป็นอัจฉริยะมากขึ้นอีก และน่าจะเป็นประโยชน์กับมนุษย์อย่างมหาศาลในหลายๆ ด้าน

ที่มา:

https://deepmind.google/about/

https://deepmind.google/technologies/gemini/#introduction

https://blog.google/technology/ai/google-gemini-ai/?utm_source=gdm&utm_medium=referral#sundar-note

https://goo.gle/GeminiPaper

ภาพจาก Freepik