Google ประกาศ Gemma 4 พร้อมใบอนุญาต Apache 2.0 และเทมเพลตสำหรับอุปกรณ์ในเครื่อง

Gemma 4

Gemma 4 - Google

Google ประกาศเมื่อวันพฤหัสบดีนี้ว่าตระกูล Gemma 4 ซึ่งประกอบด้วยโมเดลปัญญาประดิษฐ์โอเพ่นซอร์สใหม่ที่มีน้ำหนักที่มีอยู่ การอัปเดตนี้ถือเป็นความก้าวหน้าครั้งสำคัญครั้งแรกในกลุ่มผลิตภัณฑ์นับตั้งแต่เปิดตัว Gemma 3 เมื่อกว่าปีที่แล้ว ขณะนี้นักพัฒนามีสิทธิ์ใช้งาน Apache 2.0 ซึ่งจะลบข้อจำกัดทางการค้าที่มีอยู่ในเวอร์ชันก่อนหน้าออก

โมเดลดังกล่าวรองรับการป้อนข้อความ เสียง และรูปภาพ โดยมีหน้าต่างบริบทที่เข้าถึงโทเค็นได้ถึง 256,000 โทเค็นในรูปแบบที่ใหญ่ที่สุด ได้รับการออกแบบมาให้ทำงานบนฮาร์ดแวร์ราคาไม่แพงเป็นหลัก รวมถึง GPU และอุปกรณ์มือถือสำหรับผู้บริโภค การเปลี่ยนแปลงใบอนุญาตอำนวยความสะดวกในการใช้งานเชิงพาณิชย์โดยไม่มีภาระผูกพันเพิ่มเติมที่กำหนดโดย Google

การปรับปรุงทางเทคนิคในด้านการใช้เหตุผลและหลายรูปแบบ

โมเดลใหม่มีความก้าวหน้าอย่างมากในด้านการใช้เหตุผล คณิตศาสตร์ และการปฏิบัติตามคำสั่งเมื่อเปรียบเทียบกับรุ่นก่อน โดยรวมการสนับสนุนการเรียกฟังก์ชันดั้งเดิมและการสร้างเอาต์พุตที่มีโครงสร้าง JSON ซึ่งเป็นประโยชน์ต่อเวิร์กโฟลว์เอเจนต์

ความสามารถในการประมวลผลโค้ดได้รับการปรับให้เหมาะสมสำหรับสภาพแวดล้อมออฟไลน์ โดยบรรลุประสิทธิภาพที่เทียบเท่ากับบริการคลาวด์อย่าง Gemini Pro การสนับสนุนการป้อนข้อมูลด้วยภาพช่วยให้งานต่างๆ เช่น การรู้จำอักขระด้วยแสงและการตีความกราฟมีความแม่นยำมากขึ้น

  • ตัวแปรต่างๆ รวมถึงรุ่น Effective 2B และ 4B ที่ปรับให้เหมาะสมเพื่อความหน่วงต่ำบนสมาร์ทโฟน
  • การทำงานร่วมกันกับ Qualcomm และ MediaTek อำนวยความสะดวกในการรวมเข้ากับอุปกรณ์มือถือ
  • รุ่นขนาดใหญ่กว่าจะใช้ GPU H100 ขนาด 80GB ตัวเดียวโดยไม่มีการกำหนดปริมาณ

ตัวแปรขนาดและประสิทธิภาพการใช้พลังงาน

ตระกูล Gemma 4 มีการกำหนดค่าขนาดหลักสี่แบบ เวอร์ชัน 26B Mixture of Experts และ 31B Dense ให้ประสิทธิภาพสูงและทำงานบนเซิร์ฟเวอร์หรือฮาร์ดแวร์เวิร์กสเตชัน 2B และ 4B ที่มีประสิทธิผลจะจัดลำดับความสำคัญของประสิทธิภาพสำหรับการดำเนินการบนอุปกรณ์ Edge

รุ่น 26B MoE เปิดใช้งานพารามิเตอร์เพียง 3.8 พันล้านพารามิเตอร์ในระหว่างการอนุมาน ซึ่งช่วยลดความหน่วงและการใช้พลังงาน เวอร์ชันทั้งหมดรองรับมากกว่า 140 ภาษา นักพัฒนาสามารถดาวน์โหลดน้ำหนักตัวเต็มได้บนแพลตฟอร์มอย่าง Hugging Face, Kaggle และ Ollama

ความพร้อมใช้งานทันทีบนแพลตฟอร์มต่างๆ

รุ่น 31B และ 26B ที่ใหญ่กว่านั้นมีอยู่ใน AI Studio ของ Google เข้าถึงเวอร์ชัน E4B และ E2B แบบน้ำหนักเบาได้ใน AI Edge Gallery ตุ้มน้ำหนักที่สมบูรณ์พร้อมให้ดาวน์โหลดได้ทันทีจากที่เก็บข้อมูลสาธารณะ

บริษัทและนักวิจัยสามารถรวมโมเดลเข้ากับแอปพลิเคชันภายในเครื่องได้โดยไม่มีค่าใช้จ่าย API ซ้ำ Google ยังระบุด้วยว่ารุ่น 2B และ 4B จะทำหน้าที่เป็นพื้นฐานสำหรับ Gemini Nano 4 ที่กำลังจะมาถึงบนอุปกรณ์ Android

ผลกระทบของการเปลี่ยนไปใช้ใบอนุญาต Apache 2.0

การนำใบอนุญาต Apache 2.0 มาใช้จะช่วยขจัดข้อจำกัดของใบอนุญาตแบบกำหนดเองก่อนหน้านี้ ซึ่งรวมถึงนโยบายการไม่ใช้ที่อัปเดตได้เพียงฝ่ายเดียว นักพัฒนาสามารถควบคุมข้อมูลและการปรับใช้ธุรกิจได้ดียิ่งขึ้น

การเปลี่ยนแปลงนี้ควรสนับสนุนให้มีการสร้างโครงการใหม่ในชุมชน หรือที่เรียกอย่างไม่เป็นทางการว่า Gemmaverse การมุ่งเน้นไปที่การดำเนินการในท้องถิ่นเป็นการตอกย้ำกลยุทธ์ในการนำเสนอทางเลือกที่เปิดกว้างให้กับกลุ่มผลิตภัณฑ์ Gemini รุ่นปิด

การเพิ่มประสิทธิภาพสำหรับฮาร์ดแวร์เฉพาะ

เวอร์ชันน้ำหนักเบาได้รับการพัฒนาร่วมกับผู้ผลิตชิปมือถือ โดยส่งมอบเวลาแฝงที่เกือบเป็นศูนย์ในงานประจำวันโดยยังคงรักษาการใช้แบตเตอรี่ให้ลดลง การทดสอบบ่งชี้ถึงประสิทธิภาพที่ดีบนบอร์ด เช่น Raspberry Pi และ Jetson Nano

รุ่นขนาดใหญ่จะรักษาประสิทธิภาพแม้ในการกำหนดค่าที่หนาแน่นหรือ MoE การลดเวลาแฝงในการประมวลผลภายในเครื่องแสดงถึงประโยชน์ในทางปฏิบัติสำหรับแอปพลิเคชันที่ต้องการความเป็นส่วนตัวและการตอบสนองที่รวดเร็วโดยไม่ต้องเชื่อมต่อกับเซิร์ฟเวอร์อย่างต่อเนื่อง

รองรับการป้อนข้อมูลหลายรูปแบบ

นอกจากข้อความแล้ว โมเดลยังประมวลผลเสียงและรูปภาพโดยธรรมชาติอีกด้วย คุณสมบัติการรู้จำเสียงได้รับการปรับปรุงให้ดีขึ้นกว่า Gemma 3 ความสามารถหลายรูปแบบเปิดความเป็นไปได้สำหรับแอปพลิเคชันที่รวมข้อมูลประเภทต่างๆ แบบเรียลไทม์

นักพัฒนาสามารถสร้างต้นแบบโฟลว์เอเจนต์ได้โดยตรงใน AI Core Developer Preview โดยใช้เวอร์ชันที่มีน้ำหนักเบา การใช้งานเหล่านี้เข้ากันได้กับ Gemini Nano 4 ที่กำลังจะมาถึง

กลุ่มผลิตภัณฑ์ Gemma 4 ตอกย้ำความมุ่งมั่นของ Google ในการนำเสนอโมเดลแบบเปิดที่มีน้ำหนักที่เข้าถึงได้ การผสมผสานระหว่างประสิทธิภาพที่ได้รับการปรับปรุง ใบอนุญาตที่ได้รับอนุญาต และการสนับสนุนฮาร์ดแวร์ที่หลากหลาย ช่วยเพิ่มทางเลือกให้กับผู้ที่ต้องการโซลูชัน AI ที่รันได้ในพื้นที่