更新後的 Google 工具在 Gemini 應用程式中創建三分鐘的音樂作品
谷歌推出了 Lyria 3 Pro,這是其人工智慧模型的更新版本,旨在產生音訊和聲音作品。該工具的主要技術變化包括增加每首曲目的時間限制,從上一代的三十秒增加到連續三分鐘。新功能滿足了內容創作者和數位製作者對更廣泛、更完整的材料的需求。對於已付費訂閱 Gemini 應用程式的用戶來說,初始訪問會逐漸進行。
軌道長度的進步伴隨著模型架構的改進,模型架構現在可以更精確地處理文字指令來建立構圖。該公司已將技術整合到其企業生態系統的不同方面,允許編輯專業人員和軟體開發人員直接在其工作流程中使用人工智慧。處理在專用伺服器上進行,這保證了輸入提示後幾秒鐘內即可交付具有人聲、樂器和錄音室品質的文件。
Longer tracks are here with Lyria 3 Pro in Gemini!
From experimenting with different styles to generating tracks with complex transitions, Lyria 3 Pro makes it easier to bring your full vision to life.
Rolling out today to Google AI Plus, Pro, and Ultra users.
Learn more 🧵
— Google Gemini (@GeminiApp) March 25, 2026
擴展的音訊處理和結構化功能
從三十秒到三分鐘的轉變代表了生成音訊片段中計算的重大飛躍。 Lyria 3 Pro 設法在整個音軌長度上保持和聲和節奏的連貫性,避免長時間生成時容易出現的失真或品質損失。系統分析使用者的請求並逐層建立音樂,以同步方式組合節拍、背景旋律和合成聲音。
使用者可以透過詳細的文字命令來控制歌曲的結構。模型包含將樂曲分成傳統塊的具體說明,例如引子、主歌、橋樑和副歌。這種細分有助於根據專案的需要創建遵循商業或實驗標準的曲目。人工智慧會調整這些部分之間的過渡,使節奏的變化聽起來很自然。
音乐制作人和测试人员报告说,该工具可以有效地响应有关音乐编排和流派的复杂请求。可以要求在同一曲目上混合不同風格,或改變歌曲中特定時刻的樂器強度。該系統的自然語言處理將音樂理論中的技術術語轉化為實際的聲音結果,從而減少了創建草圖或背景音軌所花費的時間。
與應用程式和服務生態系統集成
Lyria 3 Pro 分佈在由 Google 維護的多個平台上。在消費市場,Gemini高級計劃訂戶直接透過應用程式或瀏覽器存取創建介面。對於企業和開發領域,該公司已在 Google AI Studio 中並透過 Gemini API 發布了該模型。這種開放性允許程式設計師建立第三方應用程序,使用谷歌的音訊引擎在其他介面中按需生成音樂。
大型企業和創意工作室可以透過該公司的雲端機器學習平台 Vertex AI 進行存取。此外,該模型已原生融入 Google Vids(專注於桌面的影片編輯應用程式)和 ProducerAI(音樂製作協作環境)。這些軟體中存在該工具,無需在外部音訊庫中搜尋音軌。
該模型的多功能性服務於視聽和數位娛樂市場的不同領域。快速產生結構化音訊可以優化需要大量原始聲音素材的專案的進度。
- 為教學影片和企業影片部落格創建獨家配樂。
- 為播客劇集開發小插曲和過渡音樂。
- 為遊戲領域產生效果和動態背景音樂。
- 為數位廣告活動大規模製作音頻材料。
與已經建立的工作流程的整合展示了谷歌將其生成工具定位為實用工具的策略。行銷人員和影片編輯可以輸入場景所需的情緒,並獲得與視覺材料完美同步的曲目。
安全機制與版權保護
音頻生成技術的進步引發了有關版權和知識產權濫用的爭論。為了降低這些風險,Google 在 Lyria 3 Pro 上實施了嚴格的安全過濾器。該系統會阻止克隆真實歌手聲音的嘗試,並阻止該模型直接複製受版權保護的音樂。當使用者在命令中輸入著名藝術家的名字時,人工智慧只會將提及的內容解釋為風格或流派,而不會模仿該人的聲音身份。
該公司採取的另一項安全措施是將 SynthID 應用於平台生成的所有曲目。該技術將看不見、聽不見的數位浮水印直接嵌入到文件的音頻頻譜中。此標記可以抵抗編輯、壓縮或格式更改,從而允許驗證軟體識別材料的合成來源。該倡議旨在提高媒體消費的透明度,並打擊涉及虛假音訊的錯誤訊息或欺詐行為。
安全检查在提示处理期间实时进行。如果系統偵測到該請求違反了使用準則或試圖規避版權保護,則立即停止產生。谷歌擁有致力於不斷更新這些過濾器的團隊,並遵循不同國家當前的人工智慧法規。
對數位內容創作市場的影響
Lyria 3 Pro 的開發涉及專業音樂家、音響工程師和製作人在模型訓練階段的參與。這種技術合作確保人工智慧能夠理解和聲、和弦進行和混音的細微差別。實際結果是一個可以提供平衡音訊檔案的工具,其中人聲不會與基本樂器錯誤地重疊。
完整的三分鐘作品的出現改變了獨立創作者的工作動力。社群網路上的影片頻道和個人資料獲得了製作自己曲目的自主權,從而降低了商業音樂的授權成本。該模型充當作曲助手,允許藝術家在使用真實樂器在錄音室錄製最終版本之前快速測試進行和安排。
谷歌根據使用者產生的資料量和開發者社群的回饋,維持模型的迭代更新周期。音訊處理能力的擴展鞏固了公司在生成人工智慧領域的基礎設施,與其他專注於企業和最終消費者市場創意解決方案的平台直接競爭。
Veja Tambem em 最新新聞 (TW)
警方調查 Hilde Ann Lynn Helphenstein 在聖保羅瑰麗酒店房間內的死亡事件
阿維·勒布認為暗彗星 1998 KY26 可能是蘇聯探測器火衛一 1
Google發布適用於 Pixel 裝置的 Android 17 Beta 4.1
颱風燦美本週二以強風逼近沖繩和奄美
孩子腳臭有特定原因,家長可以控制
阿維·勒布 (Avi Loeb) 解釋了廣島原子彈 2% 能量震撼馬薩諸塞州的流星爆炸
考特尼·克倫尼的辯方在佛羅裡達州聽證會上檢查謀殺刀具
清單匯集了 11 款舒適的科幻遊戲,讓您在太空中享受輕鬆的體驗;看看它們是什麼
約翰杜蘭與加拉塔薩雷達成一致並重返土耳其足球
馬克斯·多米(Max Domi)在背部手術後面臨併發症,將無限期退出多倫多楓葉隊
威廉·帕喬在兩屆歐冠冠軍後與巴黎聖日耳曼續約