谷歌發布了 Lyria 3 Pro 人工智慧模型的更新版本,用於創建音訊和聲音作品。主要技術變化將產生音樂曲目的限制提高到連續三分鐘。系統之前的容量在短短三十秒內就恢復了處理上限。 Gemini 應用程式付費方案的訂閱者已經可以在其帳戶中逐步存取新功能。
軌道長度的進步滿足了數位製作人和內容創作者對廣泛材料的直接需求。該模型的架構進行了結構改進,以更高精度和技術細節處理文字命令。處理在公司的專用伺服器上進行,確保交付具有語音、樂器和錄音室品質的文件。該技術在輸入文字後幾秒鐘內即可提供完整的曲目。此功能無需在外部音訊庫或第三方庫中搜尋音軌。
https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw
音訊處理與結構化能力
從三十秒到三分鐘的轉變標誌著生成音訊部分的計算重大飛躍。 Lyria 3 Pro 在整個音樂曲目中保持和諧和節奏的連貫性。該系統避免了人工智慧長時間迭代過程中通常出現的失真、噪音或品質損失。此平台分析用戶的請求並在獨立的層中建立音樂。節奏、背景旋律和合成聲音從樂曲的第一秒開始同步運行。
透過插入平台的詳細文字命令來控制歌曲結構。此模型包含將作品分成傳統音樂產業塊的具體指令。使用者可以設定引子、主歌、過場和副歌的準確時間。分段可以更輕鬆地創建針對商業廣播標準或實驗視聽專案的曲目。人工智慧會調整各個部分之間的過渡,以確保觀眾聽到自然的聲音。
Beta 測試人員和音樂製作人報告稱,他們對有關編曲和流派的複雜請求做出了有效的回應。該系統允許在同一個三分鐘的曲目中混合不同的音樂風格。製作人可以透過調整文字來改變歌曲中特定時刻的樂器強度。自然語言處理將音樂理論中的技術術語轉化為實用、可聽的結果。該軟體的靈活性大大減少了為工作室創建草圖或追蹤軌道所花費的時間。
與企業應用生態系統集成
Lyria 3 Pro 發行版跨越 Google 生態系統支援的多個平台。 Gemini 高級計劃訂閱者直接透過行動應用程式或網頁瀏覽器存取建立介面。商業和軟體開發部門可以透過 Google AI Studio 和 Gemini API 使用該模型。該技術的開放性允許基於該公司的音訊引擎創建第三方應用程式。較大的公司使用雲端機器學習平台 Vertex AI 將該工具整合到其內部系統中。
該模型還可以在專注於影片編輯的 Google Vids 上本地運行,並在 ProducerAI 協作環境中運行。該工具的多功能性服務於視聽娛樂和數位行銷市場的不同領域。快速產生結構化音訊可以優化需要原始聲音材料的大量項目的時間表。人工智慧的實際運用涵蓋了日常工作的幾個面向:
- 為教學影片和企業影片部落格創建獨家配樂。
- 為播客劇集開發小插曲和過渡音樂。
- 為遊戲領域產生效果和動態環境音訊。
- 為數位廣告活動大規模製作聲音材料。
與既定工作流程的整合強化了公司將人工智慧定位為日常實用工具的策略。影片編輯和行銷人員可以準確地營造特定場景所需的氛圍。產生的軌道與視覺材料完美同步,無需高級混合知識。該過程消除了用於短期活動的高成本商業音樂的許可。
安全機制與版權保護
音頻生成技術的進步引發了有關知識產權和版權的全球爭論。 Google 在 Lyria 3 Pro 上實施了嚴格的安全過濾器,以降低法律風險和濫用。該系統阻止任何克隆真實歌手或公眾人物聲音的嘗試。此模型不直接製作受唱片公司或獨立藝術家保護的音樂副本。命令中提及著名藝術家只會導致提及音樂風格或流派。該人的聲音身分仍然完全保留並且無法複製。
將 SynthID 應用於所有產生的曲目代表了該平台採用的另一項基本安全措施。該技術將看不見、聽不見的數位浮水印直接嵌入到匯出檔案的音訊頻譜中。此標記可以承受第三方軟體中的大量編輯、檔案壓縮或格式變更。驗證軟體可以立即辨識材料的合成來源。該倡議旨在提高媒體消費的透明度,並打擊網路上涉及虛假音訊的錯誤訊息。
安全控制在音樂曲目處理的幾秒鐘內即時運行。如果系統偵測到違反平台使用指南的行為,產生將立即停止。多次嘗試規避版權保護會導致使用者請求被封鎖。專門的工程團隊不斷更新安全過濾器。作品遵循不同營運國家現行的人工智慧和版權法規。
對數位內容創作市場的影響
Lyria 3 Pro 的開發包括專業音樂家和音響工程師在培訓過程中的積極參與。技術合作確保了對和聲、混音和和弦進行的細微差別的深入理解。實際結果提供了可供專業使用的平衡音訊檔案。該工具可以防止聲音和基礎樂器的錯誤重疊,這是先前模型中的常見問題。該軟體為獨立藝術家和嶄露頭角的製作人提供了強大的歌曲創作助手。
完整的三分鐘作品的出現改變了社交媒體和視訊平台上的工作動態。創作者頻道獲得完全自主權來製作自己的原創曲目,而無需依賴有限的庫。降低授權成本推動小型工作室和廣告公司採用技術。此功能可讓您在錄音室使用真實樂器進行最終錄音之前快速測試進行和排程。
谷歌根據每天產生的資料量維持一個迭代模型更新周期。來自開發者和音樂製作人社群的回饋指導著即將到來的系統架構改進。音頻處理能力的擴大鞏固了公司在企業部門的基礎設施。該技術與其他專注於視聽和最終消費市場創意解決方案的平台直接競爭。

