ข่าวล่าสุด (TH)

เครื่องมือของ Google ที่อัปเดตสร้างการเรียบเรียงดนตรีความยาว 3 นาทีในแอป Gemini

Lyria 3 Pro
Foto: Lyria 3 Pro - Divulgação

Google ได้เปิดตัว Lyria 3 Pro ซึ่งเป็นโมเดลปัญญาประดิษฐ์เวอร์ชันอัปเดตที่มุ่งสร้างเสียงและการเรียบเรียงเสียง การเปลี่ยนแปลงทางเทคนิคหลักของเครื่องมือประกอบด้วยการเพิ่มการจำกัดเวลาสำหรับแต่ละแทร็ก ซึ่งเพิ่มจาก 30 วินาทีในรุ่นก่อนเป็นสูงสุด 3 นาทีต่อเนื่องกัน คุณสมบัติใหม่นี้ตอบสนองความต้องการจากผู้สร้างเนื้อหาและผู้ผลิตดิจิทัลสำหรับเนื้อหาที่ครอบคลุมและครบถ้วนมากขึ้น การเข้าถึงครั้งแรกจะค่อยๆ เกิดขึ้นสำหรับผู้ใช้ที่ชำระค่าสมัครสมาชิกแอป Gemini

ความก้าวหน้าในความยาวแทร็กมาพร้อมกับการปรับปรุงสถาปัตยกรรมของโมเดล ซึ่งขณะนี้ประมวลผลคำสั่งข้อความด้วยความแม่นยำมากขึ้นในการจัดโครงสร้างองค์ประกอบ บริษัทได้บูรณาการเทคโนโลยีเข้ากับแง่มุมต่างๆ ของระบบนิเวศขององค์กร ช่วยให้ผู้เชี่ยวชาญด้านการแก้ไขและนักพัฒนาซอฟต์แวร์สามารถใช้ปัญญาประดิษฐ์ในขั้นตอนการทำงานของตนได้โดยตรง การประมวลผลเกิดขึ้นบนเซิร์ฟเวอร์เฉพาะ ซึ่งรับประกันการส่งมอบไฟล์ด้วยเสียงร้อง เครื่องมือวัด และคุณภาพระดับสตูดิโอภายในไม่กี่วินาทีหลังจากป้อนข้อความแจ้ง

ขยายความสามารถในการประมวลผลและโครงสร้างเสียง

การเปลี่ยนจากสามสิบวินาทีเป็นสามนาทีแสดงถึงความก้าวหน้าทางการคำนวณที่สำคัญในส่วนของเสียงเชิงสร้างสรรค์ Lyria 3 Pro จัดการเพื่อรักษาความสอดคล้องกันของฮาร์โมนิคและจังหวะตลอดความยาวของแทร็ก โดยหลีกเลี่ยงการบิดเบือนหรือสูญเสียคุณภาพที่มักจะเกิดขึ้นเมื่อเล่นเป็นเวลานาน ระบบวิเคราะห์คำขอของผู้ใช้และสร้างเพลงทีละชั้น โดยผสมผสานจังหวะ ท่วงทำนองพื้นหลัง และเสียงสังเคราะห์ในลักษณะที่ซิงโครไนซ์

ผู้ใช้สามารถควบคุมโครงสร้างของเพลงผ่านคำสั่งข้อความโดยละเอียด แบบจำลองนี้ประกอบด้วยคำแนะนำเฉพาะสำหรับการแยกการเรียบเรียงออกเป็นบล็อกแบบดั้งเดิม เช่น บทนำ ท่อนร้อง สะพาน และท่อนคอรัส การแบ่งส่วนนี้อำนวยความสะดวกในการสร้างแทร็กที่เป็นไปตามมาตรฐานเชิงพาณิชย์หรือการทดลอง ขึ้นอยู่กับความต้องการของโครงการ ปัญญาประดิษฐ์จะปรับการเปลี่ยนระหว่างส่วนเหล่านี้เพื่อให้การเปลี่ยนจังหวะฟังดูเป็นธรรมชาติสำหรับหูของคุณ

ผู้ผลิตเพลงและผู้ทดสอบเบต้ารายงานว่าเครื่องมือนี้ตอบสนองต่อคำขอที่ซับซ้อนเกี่ยวกับการเรียบเรียงดนตรีและแนวเพลงได้อย่างมีประสิทธิภาพ คุณสามารถขอมิกซ์สไตล์ต่างๆ ในแทร็กเดียวกัน หรือเปลี่ยนความเข้มของเครื่องดนตรีในช่วงเวลาใดเวลาหนึ่งของเพลงได้ การประมวลผลภาษาธรรมชาติของระบบจะแปลคำศัพท์ทางเทคนิคจากทฤษฎีดนตรีไปเป็นผลลัพธ์เสียงที่ใช้งานได้จริง ซึ่งช่วยลดเวลาที่ใช้ในการสร้างภาพร่างหรือเพลงประกอบ

บูรณาการกับระบบนิเวศของแอปพลิเคชันและบริการ

Lyria 3 Pro ได้รับการเผยแพร่ผ่านหลายแพลตฟอร์มที่ดูแลโดย Google ในตลาดผู้บริโภค สมาชิกแผนขั้นสูงของ Gemini เข้าถึงอินเทอร์เฟซการสร้างได้โดยตรงผ่านแอปหรือเบราว์เซอร์ สำหรับภาคองค์กรและการพัฒนา บริษัทได้เปิดตัวโมเดลใน Google AI Studio และผ่าน Gemini API การเปิดกว้างนี้ทำให้โปรแกรมเมอร์สามารถสร้างแอปพลิเคชันบุคคลที่สามที่ใช้ระบบเสียงของ Google เพื่อสร้างเพลงตามต้องการในอินเทอร์เฟซอื่นๆ

องค์กรขนาดใหญ่และสตูดิโอสร้างสรรค์สามารถเข้าถึงได้ผ่าน Vertex AI ซึ่งเป็นแพลตฟอร์มการเรียนรู้ของเครื่องบนคลาวด์ของบริษัท นอกจากนี้ โมเดลดังกล่าวยังรวมอยู่ใน Google Vids ซึ่งเป็นแอปพลิเคชันตัดต่อวิดีโอที่เน้นเดสก์ท็อป และ ProducerAI ซึ่งเป็นสภาพแวดล้อมการทำงานร่วมกันสำหรับการผลิตเพลง การมีอยู่ของเครื่องมือในซอฟต์แวร์เหล่านี้ทำให้ไม่จำเป็นต้องค้นหาเพลงประกอบในคลังเสียงภายนอก

ความอเนกประสงค์ของโมเดลนี้ตอบสนองความต้องการที่แตกต่างกันในตลาดความบันเทิงภาพและเสียงและดิจิทัล การสร้างเสียงที่มีโครงสร้างอย่างรวดเร็วช่วยปรับตารางเวลาให้เหมาะสมสำหรับโปรเจ็กต์ที่ต้องใช้เนื้อหาเสียงต้นฉบับจำนวนมาก

  • การสร้างเพลงประกอบพิเศษสำหรับวิดีโอแนะนำและ vlog ขององค์กร
  • การพัฒนาบทความสั้นและเพลงเปลี่ยนสำหรับตอนของพอดแคสต์
  • การสร้างเอฟเฟกต์และเพลงประกอบแบบไดนามิกสำหรับภาคเกม
  • การผลิตสื่อเสียงในวงกว้างสำหรับแคมเปญโฆษณาดิจิทัล

การบูรณาการกับขั้นตอนการทำงานที่กำหนดไว้แล้วแสดงให้เห็นถึงกลยุทธ์ของ Google ในการวางตำแหน่งเครื่องมือสร้างสรรค์ของตนให้เป็นสาธารณูปโภคที่ใช้งานได้จริง นักการตลาดและนักตัดต่อวิดีโอสามารถกำหนดอารมณ์ที่ต้องการให้กับฉากและกำหนดจังหวะให้กับเนื้อหาภาพได้อย่างสมบูรณ์แบบ

กลไกความปลอดภัยและการคุ้มครองลิขสิทธิ์

ความก้าวหน้าของเทคโนโลยีการสร้างเสียงทำให้เกิดข้อถกเถียงเกี่ยวกับลิขสิทธิ์และการใช้ทรัพย์สินทางปัญญาในทางที่ผิด เพื่อลดความเสี่ยงเหล่านี้ Google ได้ใช้ตัวกรองความปลอดภัยที่เข้มงวดใน Lyria 3 Pro ระบบจะบล็อกความพยายามในการโคลนเสียงของนักร้องจริง และป้องกันไม่ให้โมเดลสร้างสำเนาเพลงที่มีลิขสิทธิ์โดยตรง เมื่อผู้ใช้ป้อนชื่อของศิลปินที่มีชื่อเสียงในคำสั่ง ปัญญาประดิษฐ์จะตีความการกล่าวถึงเป็นเพียงการอ้างอิงถึงสไตล์หรือแนวเพลงเท่านั้น โดยไม่เลียนแบบเอกลักษณ์ทางเสียงของบุคคลนั้น

มาตรการรักษาความปลอดภัยอีกประการหนึ่งที่บริษัทนำมาใช้คือการใช้ SynthID กับแทร็กทั้งหมดที่สร้างโดยแพลตฟอร์ม เทคโนโลยีนี้จะฝังลายน้ำดิจิทัลที่มองไม่เห็นและไม่ได้ยินลงในสเปกตรัมเสียงของไฟล์โดยตรง เครื่องหมายต้านทานการแก้ไข การบีบอัด หรือการเปลี่ยนแปลงรูปแบบ ช่วยให้ซอฟต์แวร์ตรวจสอบสามารถระบุแหล่งกำเนิดสังเคราะห์ของวัสดุได้ โครงการริเริ่มนี้มีจุดมุ่งหมายเพื่อส่งเสริมความโปร่งใสในการบริโภคสื่อ และต่อสู้กับข้อมูลที่ไม่ถูกต้องหรือการฉ้อโกงที่เกี่ยวข้องกับเสียงปลอม

การตรวจสอบความปลอดภัยจะเกิดขึ้นแบบเรียลไทม์ระหว่างการประมวลผลพร้อมท์ หากระบบตรวจพบว่าคำขอละเมิดหลักเกณฑ์การใช้งานหรือพยายามหลีกเลี่ยงการคุ้มครองลิขสิทธิ์ การสร้างจะหยุดทันที Google มีทีมงานที่ทุ่มเทในการอัปเดตตัวกรองเหล่านี้อย่างต่อเนื่อง โดยปฏิบัติตามกฎระเบียบปัจจุบันเกี่ยวกับปัญญาประดิษฐ์ในประเทศต่างๆ

ผลกระทบต่อตลาดการสร้างเนื้อหาดิจิทัล

การพัฒนา Lyria 3 Pro เกี่ยวข้องกับการมีส่วนร่วมของนักดนตรีมืออาชีพ วิศวกรเสียง และโปรดิวเซอร์ในระหว่างระยะการฝึกอบรมของโมเดล การทำงานร่วมกันทางเทคนิคนี้ทำให้มั่นใจได้ว่าปัญญาประดิษฐ์จะเข้าใจความแตกต่างของความสามัคคี ความก้าวหน้าของคอร์ด และมิกซ์ ผลลัพธ์ในทางปฏิบัติคือเครื่องมือที่ให้ไฟล์เสียงที่สมดุล โดยที่เสียงร้องไม่ซ้อนทับกับเครื่องดนตรีพื้นฐานอย่างไม่ถูกต้อง

ความพร้อมใช้งานขององค์ประกอบความยาวสามนาทีที่สมบูรณ์จะเปลี่ยนไดนามิกการทำงานของผู้สร้างอิสระ ช่องวิดีโอและโปรไฟล์บนโซเชียลเน็ตเวิร์กได้รับอิสระในการผลิตเพลงของตัวเอง ซึ่งช่วยลดค่าลิขสิทธิ์สำหรับเพลงเชิงพาณิชย์ โมเดลนี้ทำหน้าที่เป็นผู้ช่วยแต่งเพลง ช่วยให้ศิลปินทดสอบความก้าวหน้าและการเรียบเรียงได้อย่างรวดเร็ว ก่อนที่จะบันทึกเวอร์ชันสุดท้ายในสตูดิโอด้วยเครื่องดนตรีจริง

Google รักษาวงจรของการอัปเดตซ้ำๆ ให้กับโมเดล โดยพิจารณาจากปริมาณข้อมูลที่สร้างโดยผู้ใช้และความคิดเห็นจากชุมชนนักพัฒนาซอฟต์แวร์ การขยายความสามารถในการประมวลผลเสียงได้รวมโครงสร้างพื้นฐานของบริษัทในภาคปัญญาประดิษฐ์อัจฉริยะ โดยแข่งขันโดยตรงกับแพลตฟอร์มอื่นๆ ที่เน้นโซลูชันที่สร้างสรรค์สำหรับตลาดองค์กรและผู้บริโภคปลายทาง

Veja Tambem em ข่าวล่าสุด (TH)

แนวคิดยานอวกาศดักแด้เสนอการเดินทาง 400 ปีกับผู้คน 2,400 ไปยัง Proxima Centauri b

แนวคิดยานอวกาศดักแด้เสนอการเดินทาง 400 ปีกับผู้คน 2,400 ไปยัง Proxima Centauri b

อดีตศิลปิน Rockstar รับประกันว่าแม่น้ำ Crimson Desert มีมากกว่า Red Dead Redemption 2

อดีตศิลปิน Rockstar รับประกันว่าแม่น้ำ Crimson Desert มีมากกว่า Red Dead Redemption 2

อารีนา ซาบาเลนกา เอาชนะ นาโอมิ โอซากะ 7-5, 6-3 ในรอบที่สี่ของโรลังด์ การ์รอส

อารีนา ซาบาเลนกา เอาชนะ นาโอมิ โอซากะ 7-5, 6-3 ในรอบที่สี่ของโรลังด์ การ์รอส

ดาวเคราะห์น้อย 2026 FM3 ข้ามวงโคจรโลกคืนนี้ภายใต้การตรวจสอบของ NASA อย่างต่อเนื่อง

ดาวเคราะห์น้อย 2026 FM3 ข้ามวงโคจรโลกคืนนี้ภายใต้การตรวจสอบของ NASA อย่างต่อเนื่อง

กล้องโทรทรรศน์อวกาศเจมส์ เวบบ์ ระบุเคมีอายุ 1 หมื่นล้านปีในดาวหาง 3I/แอตลาส

กล้องโทรทรรศน์อวกาศเจมส์ เวบบ์ ระบุเคมีอายุ 1 หมื่นล้านปีในดาวหาง 3I/แอตลาส

สมาร์ทโฟน Realme 16 5G รวมกระจกมองหลังสำหรับเซลฟี่และแบตเตอรี่ 7000 mAh ในอินเดีย

สมาร์ทโฟน Realme 16 5G รวมกระจกมองหลังสำหรับเซลฟี่และแบตเตอรี่ 7000 mAh ในอินเดีย

มาริลิน มอนโรร่วมมือกับสื่อมวลชนเพื่อเปิดเผยเรื่องอื้อฉาวเกี่ยวกับภาพถ่ายเปลือยของเธอเองในปี 1952

มาริลิน มอนโรร่วมมือกับสื่อมวลชนเพื่อเปิดเผยเรื่องอื้อฉาวเกี่ยวกับภาพถ่ายเปลือยของเธอเองในปี 1952

TMZ เปิดห้องข่าวถ่ายทอดสดรายวันกับทีมงานและผู้ชม

TMZ เปิดห้องข่าวถ่ายทอดสดรายวันกับทีมงานและผู้ชม

CEO Xbox ยอมรับข้อผิดพลาดในการแสดงโลโก้ PS5 และ Switch ในงาน

CEO Xbox ยอมรับข้อผิดพลาดในการแสดงโลโก้ PS5 และ Switch ในงาน

นักถ่ายภาพดาราศาสตร์บันทึกเนบิวลาหัวม้าในเวลา 115 ชั่วโมงด้วยกล้องโทรทรรศน์หลังบ้าน

นักถ่ายภาพดาราศาสตร์บันทึกเนบิวลาหัวม้าในเวลา 115 ชั่วโมงด้วยกล้องโทรทรรศน์หลังบ้าน

Venera 13 ลงจอดบนดาวศุกร์ในปี 1982 และส่งภาพถ่ายสีชุดแรกของพื้นผิวกลับมา

Venera 13 ลงจอดบนดาวศุกร์ในปี 1982 และส่งภาพถ่ายสีชุดแรกของพื้นผิวกลับมา

Apple ออก iOS 26.5.1 พร้อมการแก้ไขการชาร์จสำหรับ iPhone Air และ iPhone 17 line

Apple ออก iOS 26.5.1 พร้อมการแก้ไขการชาร์จสำหรับ iPhone Air และ iPhone 17 line