เครื่องมือของ Google ที่อัปเดตสร้างการเรียบเรียงดนตรีความยาว 3 นาทีในแอป Gemini
Google ได้เปิดตัว Lyria 3 Pro ซึ่งเป็นโมเดลปัญญาประดิษฐ์เวอร์ชันอัปเดตที่มุ่งสร้างเสียงและการเรียบเรียงเสียง การเปลี่ยนแปลงทางเทคนิคหลักของเครื่องมือประกอบด้วยการเพิ่มการจำกัดเวลาสำหรับแต่ละแทร็ก ซึ่งเพิ่มจาก 30 วินาทีในรุ่นก่อนเป็นสูงสุด 3 นาทีต่อเนื่องกัน คุณสมบัติใหม่นี้ตอบสนองความต้องการจากผู้สร้างเนื้อหาและผู้ผลิตดิจิทัลสำหรับเนื้อหาที่ครอบคลุมและครบถ้วนมากขึ้น การเข้าถึงครั้งแรกจะค่อยๆ เกิดขึ้นสำหรับผู้ใช้ที่ชำระค่าสมัครสมาชิกแอป Gemini
ความก้าวหน้าในความยาวแทร็กมาพร้อมกับการปรับปรุงสถาปัตยกรรมของโมเดล ซึ่งขณะนี้ประมวลผลคำสั่งข้อความด้วยความแม่นยำมากขึ้นในการจัดโครงสร้างองค์ประกอบ บริษัทได้บูรณาการเทคโนโลยีเข้ากับแง่มุมต่างๆ ของระบบนิเวศขององค์กร ช่วยให้ผู้เชี่ยวชาญด้านการแก้ไขและนักพัฒนาซอฟต์แวร์สามารถใช้ปัญญาประดิษฐ์ในขั้นตอนการทำงานของตนได้โดยตรง การประมวลผลเกิดขึ้นบนเซิร์ฟเวอร์เฉพาะ ซึ่งรับประกันการส่งมอบไฟล์ด้วยเสียงร้อง เครื่องมือวัด และคุณภาพระดับสตูดิโอภายในไม่กี่วินาทีหลังจากป้อนข้อความแจ้ง
Longer tracks are here with Lyria 3 Pro in Gemini!
From experimenting with different styles to generating tracks with complex transitions, Lyria 3 Pro makes it easier to bring your full vision to life.
Rolling out today to Google AI Plus, Pro, and Ultra users.
Learn more 🧵
— Google Gemini (@GeminiApp) March 25, 2026
ขยายความสามารถในการประมวลผลและโครงสร้างเสียง
การเปลี่ยนจากสามสิบวินาทีเป็นสามนาทีแสดงถึงความก้าวหน้าทางการคำนวณที่สำคัญในส่วนของเสียงเชิงสร้างสรรค์ Lyria 3 Pro จัดการเพื่อรักษาความสอดคล้องกันของฮาร์โมนิคและจังหวะตลอดความยาวของแทร็ก โดยหลีกเลี่ยงการบิดเบือนหรือสูญเสียคุณภาพที่มักจะเกิดขึ้นเมื่อเล่นเป็นเวลานาน ระบบวิเคราะห์คำขอของผู้ใช้และสร้างเพลงทีละชั้น โดยผสมผสานจังหวะ ท่วงทำนองพื้นหลัง และเสียงสังเคราะห์ในลักษณะที่ซิงโครไนซ์
ผู้ใช้สามารถควบคุมโครงสร้างของเพลงผ่านคำสั่งข้อความโดยละเอียด แบบจำลองนี้ประกอบด้วยคำแนะนำเฉพาะสำหรับการแยกการเรียบเรียงออกเป็นบล็อกแบบดั้งเดิม เช่น บทนำ ท่อนร้อง สะพาน และท่อนคอรัส การแบ่งส่วนนี้อำนวยความสะดวกในการสร้างแทร็กที่เป็นไปตามมาตรฐานเชิงพาณิชย์หรือการทดลอง ขึ้นอยู่กับความต้องการของโครงการ ปัญญาประดิษฐ์จะปรับการเปลี่ยนระหว่างส่วนเหล่านี้เพื่อให้การเปลี่ยนจังหวะฟังดูเป็นธรรมชาติสำหรับหูของคุณ
ผู้ผลิตเพลงและผู้ทดสอบเบต้ารายงานว่าเครื่องมือนี้ตอบสนองต่อคำขอที่ซับซ้อนเกี่ยวกับการเรียบเรียงดนตรีและแนวเพลงได้อย่างมีประสิทธิภาพ คุณสามารถขอมิกซ์สไตล์ต่างๆ ในแทร็กเดียวกัน หรือเปลี่ยนความเข้มของเครื่องดนตรีในช่วงเวลาใดเวลาหนึ่งของเพลงได้ การประมวลผลภาษาธรรมชาติของระบบจะแปลคำศัพท์ทางเทคนิคจากทฤษฎีดนตรีไปเป็นผลลัพธ์เสียงที่ใช้งานได้จริง ซึ่งช่วยลดเวลาที่ใช้ในการสร้างภาพร่างหรือเพลงประกอบ
บูรณาการกับระบบนิเวศของแอปพลิเคชันและบริการ
Lyria 3 Pro ได้รับการเผยแพร่ผ่านหลายแพลตฟอร์มที่ดูแลโดย Google ในตลาดผู้บริโภค สมาชิกแผนขั้นสูงของ Gemini เข้าถึงอินเทอร์เฟซการสร้างได้โดยตรงผ่านแอปหรือเบราว์เซอร์ สำหรับภาคองค์กรและการพัฒนา บริษัทได้เปิดตัวโมเดลใน Google AI Studio และผ่าน Gemini API การเปิดกว้างนี้ทำให้โปรแกรมเมอร์สามารถสร้างแอปพลิเคชันบุคคลที่สามที่ใช้ระบบเสียงของ Google เพื่อสร้างเพลงตามต้องการในอินเทอร์เฟซอื่นๆ
องค์กรขนาดใหญ่และสตูดิโอสร้างสรรค์สามารถเข้าถึงได้ผ่าน Vertex AI ซึ่งเป็นแพลตฟอร์มการเรียนรู้ของเครื่องบนคลาวด์ของบริษัท นอกจากนี้ โมเดลดังกล่าวยังรวมอยู่ใน Google Vids ซึ่งเป็นแอปพลิเคชันตัดต่อวิดีโอที่เน้นเดสก์ท็อป และ ProducerAI ซึ่งเป็นสภาพแวดล้อมการทำงานร่วมกันสำหรับการผลิตเพลง การมีอยู่ของเครื่องมือในซอฟต์แวร์เหล่านี้ทำให้ไม่จำเป็นต้องค้นหาเพลงประกอบในคลังเสียงภายนอก
ความอเนกประสงค์ของโมเดลนี้ตอบสนองความต้องการที่แตกต่างกันในตลาดความบันเทิงภาพและเสียงและดิจิทัล การสร้างเสียงที่มีโครงสร้างอย่างรวดเร็วช่วยปรับตารางเวลาให้เหมาะสมสำหรับโปรเจ็กต์ที่ต้องใช้เนื้อหาเสียงต้นฉบับจำนวนมาก
- การสร้างเพลงประกอบพิเศษสำหรับวิดีโอแนะนำและ vlog ขององค์กร
- การพัฒนาบทความสั้นและเพลงเปลี่ยนสำหรับตอนของพอดแคสต์
- การสร้างเอฟเฟกต์และเพลงประกอบแบบไดนามิกสำหรับภาคเกม
- การผลิตสื่อเสียงในวงกว้างสำหรับแคมเปญโฆษณาดิจิทัล
การบูรณาการกับขั้นตอนการทำงานที่กำหนดไว้แล้วแสดงให้เห็นถึงกลยุทธ์ของ Google ในการวางตำแหน่งเครื่องมือสร้างสรรค์ของตนให้เป็นสาธารณูปโภคที่ใช้งานได้จริง นักการตลาดและนักตัดต่อวิดีโอสามารถกำหนดอารมณ์ที่ต้องการให้กับฉากและกำหนดจังหวะให้กับเนื้อหาภาพได้อย่างสมบูรณ์แบบ
กลไกความปลอดภัยและการคุ้มครองลิขสิทธิ์
ความก้าวหน้าของเทคโนโลยีการสร้างเสียงทำให้เกิดข้อถกเถียงเกี่ยวกับลิขสิทธิ์และการใช้ทรัพย์สินทางปัญญาในทางที่ผิด เพื่อลดความเสี่ยงเหล่านี้ Google ได้ใช้ตัวกรองความปลอดภัยที่เข้มงวดใน Lyria 3 Pro ระบบจะบล็อกความพยายามในการโคลนเสียงของนักร้องจริง และป้องกันไม่ให้โมเดลสร้างสำเนาเพลงที่มีลิขสิทธิ์โดยตรง เมื่อผู้ใช้ป้อนชื่อของศิลปินที่มีชื่อเสียงในคำสั่ง ปัญญาประดิษฐ์จะตีความการกล่าวถึงเป็นเพียงการอ้างอิงถึงสไตล์หรือแนวเพลงเท่านั้น โดยไม่เลียนแบบเอกลักษณ์ทางเสียงของบุคคลนั้น
มาตรการรักษาความปลอดภัยอีกประการหนึ่งที่บริษัทนำมาใช้คือการใช้ SynthID กับแทร็กทั้งหมดที่สร้างโดยแพลตฟอร์ม เทคโนโลยีนี้จะฝังลายน้ำดิจิทัลที่มองไม่เห็นและไม่ได้ยินลงในสเปกตรัมเสียงของไฟล์โดยตรง เครื่องหมายต้านทานการแก้ไข การบีบอัด หรือการเปลี่ยนแปลงรูปแบบ ช่วยให้ซอฟต์แวร์ตรวจสอบสามารถระบุแหล่งกำเนิดสังเคราะห์ของวัสดุได้ โครงการริเริ่มนี้มีจุดมุ่งหมายเพื่อส่งเสริมความโปร่งใสในการบริโภคสื่อ และต่อสู้กับข้อมูลที่ไม่ถูกต้องหรือการฉ้อโกงที่เกี่ยวข้องกับเสียงปลอม
การตรวจสอบความปลอดภัยจะเกิดขึ้นแบบเรียลไทม์ระหว่างการประมวลผลพร้อมท์ หากระบบตรวจพบว่าคำขอละเมิดหลักเกณฑ์การใช้งานหรือพยายามหลีกเลี่ยงการคุ้มครองลิขสิทธิ์ การสร้างจะหยุดทันที Google มีทีมงานที่ทุ่มเทในการอัปเดตตัวกรองเหล่านี้อย่างต่อเนื่อง โดยปฏิบัติตามกฎระเบียบปัจจุบันเกี่ยวกับปัญญาประดิษฐ์ในประเทศต่างๆ
ผลกระทบต่อตลาดการสร้างเนื้อหาดิจิทัล
การพัฒนา Lyria 3 Pro เกี่ยวข้องกับการมีส่วนร่วมของนักดนตรีมืออาชีพ วิศวกรเสียง และโปรดิวเซอร์ในระหว่างระยะการฝึกอบรมของโมเดล การทำงานร่วมกันทางเทคนิคนี้ทำให้มั่นใจได้ว่าปัญญาประดิษฐ์จะเข้าใจความแตกต่างของความสามัคคี ความก้าวหน้าของคอร์ด และมิกซ์ ผลลัพธ์ในทางปฏิบัติคือเครื่องมือที่ให้ไฟล์เสียงที่สมดุล โดยที่เสียงร้องไม่ซ้อนทับกับเครื่องดนตรีพื้นฐานอย่างไม่ถูกต้อง
ความพร้อมใช้งานขององค์ประกอบความยาวสามนาทีที่สมบูรณ์จะเปลี่ยนไดนามิกการทำงานของผู้สร้างอิสระ ช่องวิดีโอและโปรไฟล์บนโซเชียลเน็ตเวิร์กได้รับอิสระในการผลิตเพลงของตัวเอง ซึ่งช่วยลดค่าลิขสิทธิ์สำหรับเพลงเชิงพาณิชย์ โมเดลนี้ทำหน้าที่เป็นผู้ช่วยแต่งเพลง ช่วยให้ศิลปินทดสอบความก้าวหน้าและการเรียบเรียงได้อย่างรวดเร็ว ก่อนที่จะบันทึกเวอร์ชันสุดท้ายในสตูดิโอด้วยเครื่องดนตรีจริง
Google รักษาวงจรของการอัปเดตซ้ำๆ ให้กับโมเดล โดยพิจารณาจากปริมาณข้อมูลที่สร้างโดยผู้ใช้และความคิดเห็นจากชุมชนนักพัฒนาซอฟต์แวร์ การขยายความสามารถในการประมวลผลเสียงได้รวมโครงสร้างพื้นฐานของบริษัทในภาคปัญญาประดิษฐ์อัจฉริยะ โดยแข่งขันโดยตรงกับแพลตฟอร์มอื่นๆ ที่เน้นโซลูชันที่สร้างสรรค์สำหรับตลาดองค์กรและผู้บริโภคปลายทาง
Veja Tambem em ข่าวล่าสุด (TH)
แนวคิดยานอวกาศดักแด้เสนอการเดินทาง 400 ปีกับผู้คน 2,400 ไปยัง Proxima Centauri b
อดีตศิลปิน Rockstar รับประกันว่าแม่น้ำ Crimson Desert มีมากกว่า Red Dead Redemption 2
อารีนา ซาบาเลนกา เอาชนะ นาโอมิ โอซากะ 7-5, 6-3 ในรอบที่สี่ของโรลังด์ การ์รอส
ดาวเคราะห์น้อย 2026 FM3 ข้ามวงโคจรโลกคืนนี้ภายใต้การตรวจสอบของ NASA อย่างต่อเนื่อง
กล้องโทรทรรศน์อวกาศเจมส์ เวบบ์ ระบุเคมีอายุ 1 หมื่นล้านปีในดาวหาง 3I/แอตลาส
สมาร์ทโฟน Realme 16 5G รวมกระจกมองหลังสำหรับเซลฟี่และแบตเตอรี่ 7000 mAh ในอินเดีย
มาริลิน มอนโรร่วมมือกับสื่อมวลชนเพื่อเปิดเผยเรื่องอื้อฉาวเกี่ยวกับภาพถ่ายเปลือยของเธอเองในปี 1952
TMZ เปิดห้องข่าวถ่ายทอดสดรายวันกับทีมงานและผู้ชม
CEO Xbox ยอมรับข้อผิดพลาดในการแสดงโลโก้ PS5 และ Switch ในงาน
นักถ่ายภาพดาราศาสตร์บันทึกเนบิวลาหัวม้าในเวลา 115 ชั่วโมงด้วยกล้องโทรทรรศน์หลังบ้าน
Venera 13 ลงจอดบนดาวศุกร์ในปี 1982 และส่งภาพถ่ายสีชุดแรกของพื้นผิวกลับมา