Google อัปเดตปัญญาประดิษฐ์ Lyria 3 Pro เพื่อสร้างเพลงความยาวสามนาทีบน Gemini

Lyria 3 Pro

Lyria 3 Pro - Divulgação

Google ได้เปิดตัวโมเดลปัญญาประดิษฐ์ Lyria 3 Pro เวอร์ชันอัปเดตสำหรับการสร้างเสียงและการเรียบเรียงเสียง การเปลี่ยนแปลงทางเทคนิคหลักจะเพิ่มขีดจำกัดในการสร้างแทร็กเพลงเป็นสามนาทีต่อเนื่องกัน ความจุก่อนหน้านี้ของระบบคืนเพดานการประมวลผลได้ภายในเวลาเพียงสามสิบวินาที สมาชิกแผนการชำระเงินสำหรับแอป Gemini จะได้รับสิทธิ์เข้าถึงฟีเจอร์ใหม่ในบัญชีของตนแบบค่อยเป็นค่อยไป

ความก้าวหน้าในความยาวแทร็กตอบสนองความต้องการโดยตรงจากผู้ผลิตดิจิทัลและผู้สร้างเนื้อหาสำหรับเนื้อหาที่กว้างขวาง สถาปัตยกรรมของโมเดลได้รับการปรับปรุงโครงสร้างเพื่อประมวลผลคำสั่งข้อความด้วยความแม่นยำและรายละเอียดทางเทคนิคที่มากขึ้น การประมวลผลเกิดขึ้นบนเซิร์ฟเวอร์เฉพาะของบริษัท เพื่อให้มั่นใจถึงการส่งมอบไฟล์ด้วยเสียง เครื่องมือวัด และคุณภาพระดับสตูดิโอ เทคโนโลยีนี้ให้แทร็กที่สมบูรณ์ภายในไม่กี่วินาทีหลังจากป้อนข้อความ คุณสมบัตินี้ช่วยลดความจำเป็นในการค้นหาเพลงประกอบในคลังเสียงภายนอกหรือไลบรารีของบุคคลที่สาม

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

ความสามารถในการประมวลผลเสียงและการจัดโครงสร้าง

การเปลี่ยนจากสามสิบวินาทีเป็นสามนาทีถือเป็นก้าวกระโดดด้านการคำนวณที่สำคัญในส่วนของเสียงเชิงสร้างสรรค์ Lyria 3 Pro รักษาความสอดคล้องกันของฮาร์โมนิคและจังหวะตลอดทั้งแทร็กดนตรี ระบบหลีกเลี่ยงการบิดเบือน เสียง หรือการสูญเสียคุณภาพที่มักเกิดขึ้นในปัญญาประดิษฐ์รุ่นที่สืบทอดมายาวนาน แพลตฟอร์มจะวิเคราะห์คำขอของผู้ใช้และสร้างเพลงในเลเยอร์ที่เป็นอิสระ จังหวะ ท่วงทำนองพื้นหลัง และเสียงสังเคราะห์จะทำงานพร้อมกันตั้งแต่วินาทีแรกของการเรียบเรียง

การควบคุมโครงสร้างเพลงเกิดขึ้นผ่านคำสั่งข้อความโดยละเอียดที่แทรกลงในแพลตฟอร์ม แบบจำลองนี้ประกอบด้วยคำแนะนำเฉพาะสำหรับการแยกการเรียบเรียงออกเป็นช่วงอุตสาหกรรมดนตรีแบบดั้งเดิม ผู้ใช้สามารถตั้งเวลาที่แน่นอนสำหรับบทนำ ท่อน สะพาน และท่อนคอรัส การแบ่งส่วนช่วยให้สร้างแทร็กที่มุ่งเป้าไปที่มาตรฐานวิทยุเชิงพาณิชย์หรือโครงการภาพและเสียงทดลองได้ง่ายขึ้น ปัญญาประดิษฐ์จะปรับการเปลี่ยนระหว่างส่วนต่างๆ เพื่อให้มั่นใจว่าเสียงที่เป็นธรรมชาติจะเข้าหูของผู้ฟัง

ผู้ทดสอบเบต้าและผู้ผลิตเพลงรายงานการตอบสนองอย่างมีประสิทธิภาพต่อคำขอที่ซับซ้อนเกี่ยวกับการเรียบเรียงและแนวเพลง ระบบอนุญาตให้มิกซ์สไตล์ดนตรีที่แตกต่างกันในแทร็กสามนาทีเดียวกัน โปรดิวเซอร์สามารถเปลี่ยนความเข้มของเครื่องดนตรีในช่วงเวลาที่กำหนดในเพลงผ่านการปรับแต่งในข้อความ การประมวลผลภาษาธรรมชาติจะแปลคำศัพท์ทางเทคนิคจากทฤษฎีดนตรีไปเป็นผลลัพธ์ที่ใช้งานได้จริงและฟังได้ ความคล่องตัวของซอฟต์แวร์ช่วยลดเวลาที่ใช้ในการร่างภาพหรือติดตามแทร็กสำหรับสตูดิโอได้อย่างมาก

บูรณาการกับระบบนิเวศของแอปพลิเคชันระดับองค์กร

การจัดจำหน่าย Lyria 3 Pro ครอบคลุมหลายแพลตฟอร์มที่รองรับโดยระบบนิเวศของ Google สมาชิกแผนขั้นสูงของ Gemini เข้าถึงอินเทอร์เฟซการสร้างได้โดยตรงผ่านแอพมือถือหรือเว็บเบราว์เซอร์ ภาคธุรกิจและการพัฒนาซอฟต์แวร์มีโมเดลที่มีอยู่ใน Google AI Studio และผ่าน Gemini API ความเปิดกว้างของเทคโนโลยีทำให้สามารถสร้างแอปพลิเคชันบุคคลที่สามโดยใช้ระบบเสียงของบริษัทได้ องค์กรขนาดใหญ่ใช้ Vertex AI ซึ่งเป็นแพลตฟอร์มแมชชีนเลิร์นนิงบนคลาวด์ เพื่อรวมเครื่องมือเข้ากับระบบภายในของตน

โมเดลนี้ยังทำงานได้บน Google Vids โดยเน้นที่การตัดต่อวิดีโอ และในสภาพแวดล้อมการทำงานร่วมกัน ProducerAI ความอเนกประสงค์ของเครื่องมือนี้ตอบสนองความต้องการที่แตกต่างกันในตลาดความบันเทิงด้านภาพและเสียงและการตลาดดิจิทัล การสร้างเสียงที่มีโครงสร้างอย่างรวดเร็วช่วยปรับตารางเวลาให้เหมาะสมสำหรับโปรเจ็กต์ขนาดใหญ่ที่ต้องใช้วัสดุเสียงต้นฉบับ การใช้ปัญญาประดิษฐ์ในทางปฏิบัติครอบคลุมงานประจำวันหลายด้าน:

ดูเพิ่มเติม
  • การสร้างเพลงประกอบพิเศษสำหรับวิดีโอแนะนำและ vlog ขององค์กร
  • การพัฒนาบทความสั้นและเพลงเปลี่ยนสำหรับตอนของพอดแคสต์
  • การสร้างเอฟเฟกต์และเสียงสิ่งแวดล้อมแบบไดนามิกสำหรับภาคเกม
  • การผลิตสื่อเสียงในปริมาณมากสำหรับแคมเปญโฆษณาดิจิทัล

การบูรณาการกับขั้นตอนการทำงานที่จัดตั้งขึ้นเป็นการตอกย้ำกลยุทธ์ของบริษัทในการวางตำแหน่งปัญญาประดิษฐ์ให้เป็นประโยชน์ในชีวิตประจำวัน นักตัดต่อวิดีโอและนักการตลาดสามารถสร้างบรรยากาศที่ต้องการสำหรับฉากใดฉากหนึ่งได้ แทร็กที่สร้างขึ้นจะซิงโครไนซ์กับวัสดุภาพได้อย่างสมบูรณ์แบบโดยไม่ต้องมีความรู้ในการมิกซ์ขั้นสูง กระบวนการนี้จะช่วยลดลิขสิทธิ์เพลงเชิงพาณิชย์ที่มีราคาสูงสำหรับแคมเปญระยะสั้น

กลไกความปลอดภัยและการคุ้มครองลิขสิทธิ์

ความก้าวหน้าของเทคโนโลยีการสร้างเสียงทำให้เกิดการถกเถียงกันทั่วโลกเกี่ยวกับทรัพย์สินทางปัญญาและลิขสิทธิ์ Google ได้ใช้ตัวกรองความปลอดภัยที่เข้มงวดใน Lyria 3 Pro เพื่อลดความเสี่ยงทางกฎหมายและการละเมิด ระบบจะบล็อกความพยายามใดๆ ก็ตามในการโคลนเสียงของนักร้องหรือบุคคลสาธารณะที่แท้จริง โมเดลไม่ได้ผลิตสำเนาเพลงที่ได้รับการคุ้มครองโดยค่ายเพลงหรือศิลปินอิสระโดยตรง การกล่าวถึงศิลปินที่มีชื่อเสียงในคำสั่งมีผลเพียงการอ้างอิงถึงสไตล์ดนตรีหรือแนวเพลงเท่านั้น เอกลักษณ์ทางเสียงของบุคคลนั้นยังคงได้รับการเก็บรักษาไว้อย่างสมบูรณ์และไม่สามารถเข้าถึงได้สำหรับการคัดลอก

การใช้ SynthID กับแทร็กที่สร้างขึ้นทั้งหมดแสดงถึงมาตรการรักษาความปลอดภัยขั้นพื้นฐานอีกประการหนึ่งที่แพลตฟอร์มนำมาใช้ เทคโนโลยีนี้จะฝังลายน้ำดิจิทัลที่มองไม่เห็นและไม่ได้ยินลงในสเปกตรัมเสียงของไฟล์ที่ส่งออกโดยตรง เครื่องหมายทนทานต่อการแก้ไขอย่างหนัก การบีบอัดไฟล์ หรือการเปลี่ยนแปลงรูปแบบในซอฟต์แวร์ของบริษัทอื่น ซอฟต์แวร์ตรวจสอบสามารถระบุแหล่งกำเนิดสังเคราะห์ของวัสดุได้ทันที โครงการริเริ่มนี้ส่งเสริมความโปร่งใสในการบริโภคสื่อ และต่อสู้กับข้อมูลที่ไม่ถูกต้องเกี่ยวกับเสียงปลอมบนอินเทอร์เน็ต

การควบคุมความปลอดภัยทำงานแบบเรียลไทม์ในช่วงวินาทีของการประมวลผลแทร็กเพลง การสร้างจะหยุดทันทีหากระบบตรวจพบการละเมิดหลักเกณฑ์การใช้งานแพลตฟอร์ม ความพยายามซ้ำแล้วซ้ำเล่าเพื่อหลีกเลี่ยงการคุ้มครองลิขสิทธิ์ส่งผลให้คำขอของผู้ใช้ถูกบล็อก ทีมวิศวกรเฉพาะทางจะอัปเดตตัวกรองความปลอดภัยอย่างต่อเนื่อง งานนี้เป็นไปตามกฎระเบียบปัจจุบันเกี่ยวกับปัญญาประดิษฐ์และลิขสิทธิ์ในประเทศต่างๆ ที่ดำเนินงาน

ผลกระทบต่อตลาดการสร้างเนื้อหาดิจิทัล

การพัฒนา Lyria 3 Pro รวมถึงการมีส่วนร่วมอย่างแข็งขันของนักดนตรีมืออาชีพและวิศวกรเสียงในระหว่างการฝึกอบรม การทำงานร่วมกันทางเทคนิคทำให้มีความเข้าใจในเชิงลึกเกี่ยวกับความแตกต่างของความสามัคคี การมิกซ์ และความก้าวหน้าของคอร์ด ผลลัพธ์ที่ใช้งานได้จริงมอบไฟล์เสียงที่สมดุลพร้อมสำหรับการใช้งานระดับมืออาชีพ เครื่องมือนี้ป้องกันการทับซ้อนกันของเสียงและเสียงเครื่องดนตรีพื้นฐาน ซึ่งเป็นปัญหาทั่วไปในรุ่นก่อนหน้า ซอฟต์แวร์นี้ทำหน้าที่เป็นผู้ช่วยแต่งเพลงที่มีประสิทธิภาพสำหรับศิลปินอิสระและโปรดิวเซอร์หน้าใหม่

ความพร้อมใช้งานของการเรียบเรียงความยาวสามนาทีจะเปลี่ยนไดนามิกของการทำงานบนโซเชียลมีเดียและแพลตฟอร์มวิดีโอ ช่องของครีเอเตอร์ได้รับอิสระเต็มที่ในการผลิตเพลงต้นฉบับของตนเองโดยไม่ต้องพึ่งไลบรารีที่จำกัด การลดต้นทุนใบอนุญาตผลักดันให้เกิดการนำเทคโนโลยีมาใช้โดยสตูดิโอขนาดเล็กและเอเจนซี่โฆษณา คุณสมบัตินี้ช่วยให้คุณทดสอบความก้าวหน้าและการจัดเตรียมได้อย่างรวดเร็วก่อนการบันทึกครั้งสุดท้ายในสตูดิโอด้วยเครื่องดนตรีจริง

Google จะรักษาวงจรของการอัปเดตโมเดลซ้ำๆ ตามปริมาณข้อมูลที่สร้างขึ้นในแต่ละวัน เสียงตอบรับจากชุมชนนักพัฒนาและผู้ผลิตเพลงเป็นแนวทางในการปรับปรุงสถาปัตยกรรมระบบที่กำลังจะมีขึ้น การขยายความสามารถในการประมวลผลเสียงได้รวมโครงสร้างพื้นฐานของบริษัทในภาคองค์กรเข้าด้วยกัน เทคโนโลยีดังกล่าวแข่งขันโดยตรงกับแพลตฟอร์มอื่นๆ ที่เน้นโซลูชันที่สร้างสรรค์สำหรับตลาดโสตทัศน์และตลาดผู้บริโภคขั้นสุดท้าย

ดูเพิ่มเติม