Google ประกาศ Gemma 4 พร้อมใบอนุญาต Apache 2.0 และเทมเพลตสำหรับอุปกรณ์ในเครื่อง
Google ประกาศเมื่อวันพฤหัสบดีนี้ว่าตระกูล Gemma 4 ซึ่งประกอบด้วยโมเดลปัญญาประดิษฐ์โอเพ่นซอร์สใหม่ที่มีน้ำหนักที่มีอยู่ การอัปเดตนี้ถือเป็นความก้าวหน้าครั้งสำคัญครั้งแรกในกลุ่มผลิตภัณฑ์นับตั้งแต่เปิดตัว Gemma 3 เมื่อกว่าปีที่แล้ว ขณะนี้นักพัฒนามีสิทธิ์ใช้งาน Apache 2.0 ซึ่งจะลบข้อจำกัดทางการค้าที่มีอยู่ในเวอร์ชันก่อนหน้าออก
โมเดลดังกล่าวรองรับการป้อนข้อความ เสียง และรูปภาพ โดยมีหน้าต่างบริบทที่เข้าถึงโทเค็นได้ถึง 256,000 โทเค็นในรูปแบบที่ใหญ่ที่สุด ได้รับการออกแบบมาให้ทำงานบนฮาร์ดแวร์ราคาไม่แพงเป็นหลัก รวมถึง GPU และอุปกรณ์มือถือสำหรับผู้บริโภค การเปลี่ยนแปลงใบอนุญาตอำนวยความสะดวกในการใช้งานเชิงพาณิชย์โดยไม่มีภาระผูกพันเพิ่มเติมที่กำหนดโดย Google
การปรับปรุงทางเทคนิคในด้านการใช้เหตุผลและหลายรูปแบบ
โมเดลใหม่มีความก้าวหน้าอย่างมากในด้านการใช้เหตุผล คณิตศาสตร์ และการปฏิบัติตามคำสั่งเมื่อเปรียบเทียบกับรุ่นก่อน โดยรวมการสนับสนุนการเรียกฟังก์ชันดั้งเดิมและการสร้างเอาต์พุตที่มีโครงสร้าง JSON ซึ่งเป็นประโยชน์ต่อเวิร์กโฟลว์เอเจนต์
ความสามารถในการประมวลผลโค้ดได้รับการปรับให้เหมาะสมสำหรับสภาพแวดล้อมออฟไลน์ โดยบรรลุประสิทธิภาพที่เทียบเท่ากับบริการคลาวด์อย่าง Gemini Pro การสนับสนุนการป้อนข้อมูลด้วยภาพช่วยให้งานต่างๆ เช่น การรู้จำอักขระด้วยแสงและการตีความกราฟมีความแม่นยำมากขึ้น
- ตัวแปรต่างๆ รวมถึงรุ่น Effective 2B และ 4B ที่ปรับให้เหมาะสมเพื่อความหน่วงต่ำบนสมาร์ทโฟน
- การทำงานร่วมกันกับ Qualcomm และ MediaTek อำนวยความสะดวกในการรวมเข้ากับอุปกรณ์มือถือ
- รุ่นขนาดใหญ่กว่าจะใช้ GPU H100 ขนาด 80GB ตัวเดียวโดยไม่มีการกำหนดปริมาณ
ตัวแปรขนาดและประสิทธิภาพการใช้พลังงาน
ตระกูล Gemma 4 มีการกำหนดค่าขนาดหลักสี่แบบ เวอร์ชัน 26B Mixture of Experts และ 31B Dense ให้ประสิทธิภาพสูงและทำงานบนเซิร์ฟเวอร์หรือฮาร์ดแวร์เวิร์กสเตชัน 2B และ 4B ที่มีประสิทธิผลจะจัดลำดับความสำคัญของประสิทธิภาพสำหรับการดำเนินการบนอุปกรณ์ Edge
รุ่น 26B MoE เปิดใช้งานพารามิเตอร์เพียง 3.8 พันล้านพารามิเตอร์ในระหว่างการอนุมาน ซึ่งช่วยลดความหน่วงและการใช้พลังงาน เวอร์ชันทั้งหมดรองรับมากกว่า 140 ภาษา นักพัฒนาสามารถดาวน์โหลดน้ำหนักตัวเต็มได้บนแพลตฟอร์มอย่าง Hugging Face, Kaggle และ Ollama
ความพร้อมใช้งานทันทีบนแพลตฟอร์มต่างๆ
รุ่น 31B และ 26B ที่ใหญ่กว่านั้นมีอยู่ใน AI Studio ของ Google เข้าถึงเวอร์ชัน E4B และ E2B แบบน้ำหนักเบาได้ใน AI Edge Gallery ตุ้มน้ำหนักที่สมบูรณ์พร้อมให้ดาวน์โหลดได้ทันทีจากที่เก็บข้อมูลสาธารณะ
บริษัทและนักวิจัยสามารถรวมโมเดลเข้ากับแอปพลิเคชันภายในเครื่องได้โดยไม่มีค่าใช้จ่าย API ซ้ำ Google ยังระบุด้วยว่ารุ่น 2B และ 4B จะทำหน้าที่เป็นพื้นฐานสำหรับ Gemini Nano 4 ที่กำลังจะมาถึงบนอุปกรณ์ Android
ผลกระทบของการเปลี่ยนไปใช้ใบอนุญาต Apache 2.0
การนำใบอนุญาต Apache 2.0 มาใช้จะช่วยขจัดข้อจำกัดของใบอนุญาตแบบกำหนดเองก่อนหน้านี้ ซึ่งรวมถึงนโยบายการไม่ใช้ที่อัปเดตได้เพียงฝ่ายเดียว นักพัฒนาสามารถควบคุมข้อมูลและการปรับใช้ธุรกิจได้ดียิ่งขึ้น
การเปลี่ยนแปลงนี้ควรสนับสนุนให้มีการสร้างโครงการใหม่ในชุมชน หรือที่เรียกอย่างไม่เป็นทางการว่า Gemmaverse การมุ่งเน้นไปที่การดำเนินการในท้องถิ่นเป็นการตอกย้ำกลยุทธ์ในการนำเสนอทางเลือกที่เปิดกว้างให้กับกลุ่มผลิตภัณฑ์ Gemini รุ่นปิด
การเพิ่มประสิทธิภาพสำหรับฮาร์ดแวร์เฉพาะ
เวอร์ชันน้ำหนักเบาได้รับการพัฒนาร่วมกับผู้ผลิตชิปมือถือ โดยส่งมอบเวลาแฝงที่เกือบเป็นศูนย์ในงานประจำวันโดยยังคงรักษาการใช้แบตเตอรี่ให้ลดลง การทดสอบบ่งชี้ถึงประสิทธิภาพที่ดีบนบอร์ด เช่น Raspberry Pi และ Jetson Nano
รุ่นขนาดใหญ่จะรักษาประสิทธิภาพแม้ในการกำหนดค่าที่หนาแน่นหรือ MoE การลดเวลาแฝงในการประมวลผลภายในเครื่องแสดงถึงประโยชน์ในทางปฏิบัติสำหรับแอปพลิเคชันที่ต้องการความเป็นส่วนตัวและการตอบสนองที่รวดเร็วโดยไม่ต้องเชื่อมต่อกับเซิร์ฟเวอร์อย่างต่อเนื่อง
รองรับการป้อนข้อมูลหลายรูปแบบ
นอกจากข้อความแล้ว โมเดลยังประมวลผลเสียงและรูปภาพโดยธรรมชาติอีกด้วย คุณสมบัติการรู้จำเสียงได้รับการปรับปรุงให้ดีขึ้นกว่า Gemma 3 ความสามารถหลายรูปแบบเปิดความเป็นไปได้สำหรับแอปพลิเคชันที่รวมข้อมูลประเภทต่างๆ แบบเรียลไทม์
นักพัฒนาสามารถสร้างต้นแบบโฟลว์เอเจนต์ได้โดยตรงใน AI Core Developer Preview โดยใช้เวอร์ชันที่มีน้ำหนักเบา การใช้งานเหล่านี้เข้ากันได้กับ Gemini Nano 4 ที่กำลังจะมาถึง
กลุ่มผลิตภัณฑ์ Gemma 4 ตอกย้ำความมุ่งมั่นของ Google ในการนำเสนอโมเดลแบบเปิดที่มีน้ำหนักที่เข้าถึงได้ การผสมผสานระหว่างประสิทธิภาพที่ได้รับการปรับปรุง ใบอนุญาตที่ได้รับอนุญาต และการสนับสนุนฮาร์ดแวร์ที่หลากหลาย ช่วยเพิ่มทางเลือกให้กับผู้ที่ต้องการโซลูชัน AI ที่รันได้ในพื้นที่
Veja Tambem em Tailandês News
การค้าปลีกแบบดิจิทัลลดมูลค่าของสมาร์ทโฟน Galaxy S25 5G ด้วยโบนัสธนาคารและการแลกเปลี่ยนอุปกรณ์
อะแดปเตอร์ CarPlay ไร้สายของ Amazon มีส่วนลด 50% และคะแนนการอนุมัติสูงจากไดรเวอร์
ส่วนลดที่สำคัญสำหรับ Galaxy S25 Plus ลดมูลค่าลงต่ำกว่า 4,500 เรียลในร้านค้าออนไลน์
การลดราคาของ PlayStation 5 Pro ช่วยเร่งยอดค้าปลีกดิจิทัลและลดสต็อกทั่วโลก
การอัปเดตระบบ Apple ใหม่ช่วยเพิ่มประสิทธิภาพการจัดการงานเร่งด่วนสำหรับผู้ใช้ iPhone
รายละเอียดฮาร์ดแวร์รั่วไหลของ PlayStation แบบพกพารุ่นใหม่พร้อมกราฟิกที่เหนือกว่า Xbox Series S
Oppo เปิดตัว Find X9 Ultra อย่างเป็นทางการทั่วโลกพร้อมเลนส์ Hasselblad และแบตเตอรี่ที่แข็งแกร่ง
สมาร์ทโฟนแบบพับได้รุ่นใหม่นำสีทองมาสู่ผู้เข้าแข่งขัน Winter Games
Tim Cook เผย iPhone และ iPod ต้นแบบใหม่เพื่อเฉลิมฉลองครบรอบ 50 ปีของ Apple
ระบบ Android ได้รับการผสานรวม Gemini Nano 4 สำหรับการประมวลผลแบบออฟไลน์บนสมาร์ทโฟน
Leak เผย Lords of the Fallen และ Sword Art Online ในแค็ตตาล็อก PS Plus Essential ประจำเดือนเมษายน