Google Update ขยายการสร้างสรรค์เพลงปัญญาประดิษฐ์เป็นเพลงความยาวสามนาที

Lyria 3 Pro

Lyria 3 Pro - Divulgação

Google ได้เปิดตัวเครื่องมือสร้างเสียงที่ใช้ปัญญาประดิษฐ์เวอร์ชันใหม่ ซึ่งถือเป็นความก้าวหน้าที่สำคัญในการผลิตเพลงเต็ม เทคโนโลยีนี้ช่วยให้ผู้ใช้พัฒนาองค์ประกอบที่มีระยะเวลายาวนานขึ้น โดยเอาชนะข้อจำกัดทางเทคนิคที่พบในระบบรุ่นก่อนๆ

การอัปเดตจะขยายความสามารถในการสร้างจากเพียงสามสิบวินาทีเป็นสูงสุดสามนาทีในการประมวลผลเสียงต่อเนื่อง การเปลี่ยนแปลงนี้ตอบสนองความต้องการที่เพิ่มขึ้นจากผู้ผลิตเนื้อหาและมืออาชีพในภาคโสตทัศนอุปกรณ์ที่แสวงหาเพลงประกอบต้นฉบับที่เล่นได้อย่างรวดเร็วสำหรับโปรเจ็กต์ประจำวันของตน

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

การเข้าถึงฟังก์ชันการทำงานใหม่นี้จะค่อยๆ เกิดขึ้น โดยเน้นไปที่สมาชิกของแพลตฟอร์มระดับพรีเมียมของบริษัทเป็นหลัก การบูรณาการระบบครอบคลุมแอปพลิเคชันต่างๆ จากระบบนิเวศของยักษ์ใหญ่ด้านเทคโนโลยี ซึ่งอำนวยความสะดวกในขั้นตอนการทำงานของผู้ที่ใช้เครื่องมือเหล่านี้ในการแก้ไขและพัฒนาความคิดสร้างสรรค์อยู่แล้ว

ความสามารถในการเข้าใจคำสั่งเชิงโครงสร้างและรายละเอียด

โมเดลที่ได้รับการอัปเดตนำเสนอการปรับปรุงอย่างมากในวิธีที่ปัญญาประดิษฐ์ตีความโครงสร้างของการประพันธ์เพลง ผู้ใช้สามารถระบุองค์ประกอบทางเทคนิคที่แม่นยำผ่านคำสั่งข้อความธรรมดา โดยให้รายละเอียดอย่างชัดเจนว่าควรเปลี่ยนจังหวะและทำนองตรงไหน

ฟังก์ชั่นนี้ช่วยให้มีคำจำกัดความที่ชัดเจนของบทนำ คอรัส ข้อร้อง และสะพานเชื่อมภายในแทร็กที่สร้างขึ้นเดียวกัน เครื่องมือจะประมวลผลคำสั่งเหล่านี้เพื่อให้ได้ผลลัพธ์ที่รักษาความสอดคล้องของเสียงตลอดการแสดงทั้งหมด โดยหลีกเลี่ยงการหยุดอย่างกะทันหันหรือการตัดการเชื่อมต่อระหว่างส่วนต่างๆ ของเพลง

ผู้เชี่ยวชาญที่ได้ทดสอบเทคโนโลยีแล้วจะรายงานการตอบสนองที่แม่นยำต่อคำขอที่ซับซ้อนเกี่ยวกับการเรียบเรียงเครื่องดนตรีและสไตล์เสียงร้อง การประมวลผลขั้นสูงทำให้มั่นใจได้ว่าคุณภาพเสียงจะยังคงสูง โดยให้เนื้อร้องและเครื่องดนตรีที่ลื่นไหลอย่างเป็นธรรมชาติและเหมาะกับแนวดนตรีที่ร้องขอในคำสั่งเริ่มต้น

บูรณาการกับระบบนิเวศของแอปพลิเคชันและบริการ

การขยายการเข้าถึงเครื่องมือเกิดขึ้นผ่านแพลตฟอร์มที่จัดตั้งขึ้นแล้วในตลาดเทคโนโลยีและการพัฒนา สมาชิกแบบชำระเงินสำหรับแอปหลักของบริษัทเป็นคนแรกที่ได้สัมผัสประสบการณ์การสร้างแทร็กที่ยาวขึ้นอย่างต่อเนื่องบนอุปกรณ์เคลื่อนที่และคอมพิวเตอร์ส่วนบุคคล

นักพัฒนาซอฟต์แวร์ยังได้รับการสนับสนุนโดยเฉพาะผ่านสภาพแวดล้อมการเขียนโปรแกรมและอินเทอร์เฟซแอปพลิเคชันเฉพาะ การเปิดกว้างทางเทคนิคนี้ทำให้สามารถสร้างโซลูชันที่ปรับแต่งเองได้ และรวมเอ็นจิ้นเสียงเข้ากับแอปพลิเคชันบุคคลที่สามที่ต้องใช้การสร้างเสียงตามความต้องการ

องค์กรขนาดใหญ่และสตูดิโอผลิตภาพยนตร์ได้รับการเข้าถึงองค์กรอย่างมีโครงสร้าง ทำให้สามารถใช้เทคโนโลยีได้ในวงกว้าง แอปพลิเคชันที่มุ่งเป้าไปที่การตัดต่อวิดีโอขององค์กรและแพลตฟอร์มการผลิตเพลงที่ทำงานร่วมกันมีเครื่องมือที่สร้างไว้ในอินเทอร์เฟซการแก้ไขหลักอยู่แล้ว

การเชื่อมต่อโดยตรงเหล่านี้ช่วยลดความจำเป็นในการสลับระหว่างโปรแกรมต่างๆ ในระหว่างกระบวนการสร้างภาพและเสียง ผู้เชี่ยวชาญสามารถเริ่มโปรเจ็กต์วิดีโอ ขอเพลงประกอบที่เหมาะสมที่สุดสำหรับฉาก และตัดต่อให้เสร็จสิ้นภายในสภาพแวดล้อมการทำงานดิจิทัลเดียวกัน ซึ่งช่วยเพิ่มประสิทธิภาพเวลาในการจัดส่ง

เครื่องมือปกป้องความโปร่งใสและลิขสิทธิ์

ความก้าวหน้าในการสร้างเสียงโดยใช้ปัญญาประดิษฐ์นั้นมาพร้อมกับมาตรการทางเทคนิคที่เข้มงวดเพื่อป้องกันการละเมิดทรัพย์สินทางปัญญาและปกป้องผลงานของศิลปินที่เป็นมนุษย์ บริษัทได้ใช้ระบบตัวกรองขั้นสูงที่ทำหน้าที่โดยตรงในขั้นตอนการประมวลผลคำสั่งข้อความ เพื่อป้องกันไม่ให้โมเดลคัดลอกหรือเลียนแบบเสียงและสไตล์เฉพาะของนักร้องและวงดนตรีที่แท้จริง เมื่อผู้ใช้กรอกชื่อของศิลปินที่มีชื่อเสียงในคำขอ ระบบจะบล็อกการจำลองแบบทุกประการ และใช้ข้อมูลดังกล่าวเพื่ออ้างอิงแนวเพลงหรือบรรยากาศทางดนตรีในระยะไกลเท่านั้น เพื่อให้มั่นใจว่าผลลัพธ์ที่ได้จะเป็นผลงานใหม่ทั้งหมดซึ่งปราศจากการลอกเลียนแบบโดยตรง

นอกเหนือจากการบล็อกเชิงป้องกันแล้ว การเรียบเรียงทั้งหมดที่สร้างโดยแพลตฟอร์มนี้จะได้รับลายน้ำดิจิทัลที่มองไม่เห็นซึ่งฝังอยู่ในไฟล์เสียงโดยตรง เทคโนโลยีการติดตามนี้ไม่ส่งผลต่อคุณภาพเสียงหรือประสบการณ์การฟัง แต่ช่วยให้ซอฟต์แวร์ตรวจสอบสามารถระบุแหล่งกำเนิดสังเคราะห์ของวัสดุได้ทันที การนำมาตรฐานการระบุตัวตนนี้ไปใช้ตอบสนองความต้องการที่เพิ่มขึ้นเพื่อความโปร่งใสในตลาดดิจิทัล ทำให้มั่นใจได้ว่าแพลตฟอร์มการเผยแพร่ เครือข่ายโซเชียล และผู้ฟังรู้วิธีแยกแยะความแตกต่างอย่างชัดเจนระหว่างเพลงที่ผลิตโดยมนุษย์และแทร็กที่สร้างโดยอัลกอริธึมการเรียนรู้ของเครื่อง

การใช้งานจริงในตลาดโสตทัศน์

ความสามารถในการสร้างเสียงต่อเนื่องเป็นเวลาสามนาทีจะเปลี่ยนประโยชน์ของเครื่องมือสำหรับผู้สร้างเนื้อหาดิจิทัล ผู้ผลิตวิดีโอทางอินเทอร์เน็ต พอดแคสต์ และผู้พัฒนาเกมอิสระพบว่าเทคโนโลยีเป็นทางเลือกที่รวดเร็วในการตอบสนองความต้องการเพลงประกอบต้นฉบับที่คงที่ โดยปราศจากความยุ่งยากด้านลิขสิทธิ์แบบเดิมๆ

ความคล่องตัวในกระบวนการสร้างทำให้เอเจนซี่โฆษณาสามารถทดสอบจิงเกิลและภูมิหลังทางดนตรีในรูปแบบต่างๆ สำหรับแคมเปญได้ในเวลาไม่กี่นาที ความยืดหยุ่นนี้ช่วยลดต้นทุนก่อนการผลิตล่วงหน้า และมอบตัวเลือกการสร้างสรรค์ที่หลากหลายมากขึ้น ก่อนที่จะได้รับการอนุมัติขั้นสุดท้ายสำหรับโครงการเชิงพาณิชย์หรือความบันเทิง

การพัฒนาด้านเทคนิคและการทำงานร่วมกันอย่างมืออาชีพ

วิวัฒนาการของกลไกปัญญาประดิษฐ์ที่รับผิดชอบความสามารถในการสร้างเพลงใหม่นี้จำเป็นต้องมีกระบวนการฝึกอบรมที่ซับซ้อน โดยอาศัยความร่วมมือโดยตรงกับผู้เชี่ยวชาญจากวงการเพลง วิศวกรซอฟต์แวร์ทำงานอย่างใกล้ชิดกับนักดนตรีมืออาชีพ โปรดิวเซอร์ในสตูดิโอ และนักทฤษฎีดนตรีเพื่อสอนอัลกอริธึมเกี่ยวกับพื้นฐานที่สำคัญของจังหวะ ฮาร์โมนี่ ทำนอง และความก้าวหน้าของคอร์ด ความพยายามร่วมกันนี้ส่งผลให้เกิดแบบจำลองที่สามารถเข้าใจไม่เพียงแต่ทฤษฎีดนตรีพื้นฐานเท่านั้น แต่ยังรวมถึงความแตกต่างทางอารมณ์และโครงสร้างที่ทำให้เพลงฟังสบายหูของมนุษย์ด้วย สถาปัตยกรรมระบบได้รับการออกแบบใหม่เพื่อรองรับการประมวลผลลำดับข้อมูลเสียงที่ยาวโดยไม่สูญเสียการเชื่อมโยงกัน ซึ่งเป็นความท้าทายทางเทคนิคที่สำคัญในด้านปัญญาประดิษฐ์เชิงกำเนิด การประมวลผลอย่างต่อเนื่องช่วยให้มั่นใจได้ว่าเครื่องดนตรีจะรักษาการปรับจูนที่ถูกต้อง และจังหวะจะไม่เกิดการเปลี่ยนแปลงที่ไม่พึงประสงค์ตลอดการเล่นสามนาที ซึ่งถือเป็นการสร้างมาตรฐานใหม่ของความเสถียรสำหรับเครื่องมือสร้างเสียงอัตโนมัติที่มีวางจำหน่ายทั่วไป

คุณสมบัติเด่นของระบบ

อินเทอร์เฟซปฏิบัติการปัญญาประดิษฐ์ใหม่ได้รับการออกแบบมาเพื่อลดความซับซ้อนในการเข้าถึงคุณสมบัติการแต่งเพลงขั้นสูง ช่วยให้ผู้ใช้แม้แต่ผู้ที่ไม่มีความรู้อย่างเป็นทางการเกี่ยวกับทฤษฎีดนตรีก็สามารถบรรลุผลลัพธ์ระดับมืออาชีพได้ ระบบจะประมวลผลชุดพารามิเตอร์โครงสร้างที่รับประกันการปรับแต่งแทร็กที่สร้างขึ้นตามความต้องการเฉพาะของแต่ละโปรเจ็กต์ภาพและเสียง

– คำจำกัดความที่แม่นยำของคำนำ โองการ และคอรัสผ่านคำสั่งข้อความ

– รองรับการเปลี่ยนผ่านที่ซับซ้อนระหว่างส่วนต่างๆ ของเพลงในตัว

– การสร้างแทร็กที่ปรับให้เหมาะสมสำหรับ vlogs พอดแคสต์ และวิดีโอฝึกสอน

– การประมวลผลเสียงร้อง เนื้อเพลง และการเรียบเรียงเครื่องดนตรีไปพร้อมๆ กัน

พร้อมให้บริการแก่ประชาชนทั่วไป

การเข้าถึงเครื่องมือสร้างเพลงเป็นไปตามกำหนดการเผยแพร่แบบค่อยเป็นค่อยไปซึ่งกำหนดโครงสร้างโดยบริษัทเทคโนโลยี ผู้ใช้ที่มีการสมัครสมาชิกแผนขั้นสูงที่สุดในระบบนิเวศปัญญาประดิษฐ์ สามารถใช้ทรัพยากรได้ตามขีดจำกัดการประมวลผลรายวันที่กำหนดสำหรับแต่ละหมวดหมู่บัญชี

การขยายบริการอย่างต่อเนื่องคาดว่าจะมีการรวมคุณสมบัติใหม่และการปรับเปลี่ยนตามการตอบรับโดยตรงจากผู้ใช้รายแรก ทีมพัฒนาจะตรวจสอบประสิทธิภาพของอัลกอริธึมอย่างต่อเนื่องเพื่อปรับปรุงคุณภาพเสียงและเพิ่มประสิทธิภาพเวลาตอบสนองของเซิร์ฟเวอร์ในขณะที่สร้างแทร็กที่สมบูรณ์