谷歌更新 Lyria 3 Pro 型号并允许在 Gemini 上创建三分钟音乐曲目

Lyria 3 Pro

Lyria 3 Pro - Divulgação

谷歌宣布推出 Lyria 3 Pro。新版本的人工智能模型可生成音频和完整的声音作品。该工具的主要技术进步是增加了每个曲目的时间限制。容量从 30 秒增加到最多连续 3 分钟。此次更新满足了内容创作者和数字制作者对广泛材料的需求。付费 Gemini 应用计划订阅者的初始访问将逐渐进行。该资源的发布标志着科技公司之间关于2026年创作工具主导权之争进入了新阶段。

轨道持续时间的进步伴随着系统架构的改进。该模型现在可以更精确地处理文本命令来构建组合。该公司已将技术集成到其企业生态系统的不同领域。编辑专业人员和软件开发人员可以直接在他们的工作流程中利用人工智能。处理在专用服务器上进行。该基础设施保证在短短几秒钟内交付具有语音、乐器和录音室质量的文件。

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

音频处理和结构化能力

从 30 秒到 3 分钟的转变代表了生成音频片段的计算飞跃。 Lyria 3 Pro 设法在整个曲目中保持和谐和节奏的连贯性。该系统避免了长时间世代中常见的失真或质量损失。该平台分析用户的请求并分层构建歌曲。该过程以同步方式结合节拍、背景旋律和合成声音。服务器基础设施允许在云中进行繁重的处理,而不会对用户的设备造成压力。

用户可以通过详细的文本命令来控制歌曲结构。该模型包含用于将组合物分离成传统块的具体指令。创作者可以定义引子、主歌、桥段和副歌。细分可以轻松创建遵循商业或实验模式的曲目。人工智能调整零件之间的过渡。目标是让节奏的变化听起来自然。精细控制为复杂项目提供了更大的创作自由。

Beta 测试人员和音乐制作人报告说,该工具可以有效地响应复杂的请求。可以要求在同一轨道上混合不同的风格。用户还可以更改歌曲中特定时刻的乐器强度。自然语言处理将音乐理论中的技术术语转化为实际的声音结果。该功能减少了创建草稿或跟踪轨道所花费的时间。该系统的精确性避免了不断返工的需要,优化了那些依赖短期限的人的工作流程。

与应用程序和服务生态系统集成

Lyria 3 Pro 分布在由 Google 维护的多个平台上。在消费市场,Gemini高级计划订阅者通过应用程序或浏览器访问创建界面。该公司在 Google AI Studio 中并通过面向企业部门的 Gemini API 发布了该模型。开放性允许程序员创建第三方应用程序。新工具使用音频引擎在其他界面中按需生成音乐。该公司提供的技术文档指导该工具在不同数字环境中的安全实施。

大型公司和创意工作室通过 Vertex AI 获取技术。该公司的云机器学习平台集中了复杂的操作。该模型也已原生整合到 Google Vids 中。专注于计算机的视频编辑应用程序使创作者的日常工作变得更加轻松。 ProducerAI 是一个音乐制作协作环境,也获得了相同的集成。这些软件中存在该工具,无需在外部音频库中搜索曲目。集中资源可以提高编辑团队的生产力。

该模型的多功能性服务于视听和数字娱乐市场的不同领域。快速生成结构化音频可优化项目调度。团队能够在更短的时间内制作大量原始声音材料。

  • 为教程视频和企业材料创建专属配乐。
  • 为播客剧集开发小插曲和过渡音乐。
  • 为电子游戏领域生成效果和动态环境音乐。
  • 为数字广告活动制作大型音频材料。

与已经建立的工作流程的集成展示了谷歌的战略。该公司寻求将其生成工具定位为实用的日常实用工具。营销人员和视频编辑可以为场景营造所需的氛围。结果是一首与视觉材料完美同步的曲目。易于使用使获得高质量声音作品变得大众化。

安全机制和版权保护

音频生成技术的进步引发了有关版权和知识产权滥用的争论。 Google 在 Lyria 3 Pro 上实施了严格的安全过滤器以降低风险。该系统会阻止克隆真实歌手声音的尝试。该模型也无法直接制作受保护音乐的副本。当用户在命令中输入著名艺术家的名字时,人工智能仅将提及的内容解释为风格参考。在任何情况下都不会模仿该人的声音身份。

该公司采用的另一项安全措施是将 SynthID 应用于所有生成的曲目。该技术将看不见、听不见的数字水印直接嵌入到文件的音频频谱中。该标记无法编辑、压缩或格式更改。该功能允许验证软件识别材料的合成来源。该倡议旨在提高媒体消费的透明度。该机制有助于打击互联网上涉及虚假音频的错误信息和欺诈行为。

安全检查在跟踪处理过程中实时进行。如果系统检测到请求违反了使用指南,生成将立即停止。同样的情况也发生在试图规避版权保护的情况中。 Google 拥有致力于不断更新这些过滤器的团队。该公司遵循不同国家现行的人工智能法规。培训数据使用的透明度也是该平台更新政策的一部分。

对数字内容创作市场的影响

Lyria 3 Pro 的开发包括专业音乐家、音响工程师和制作人的参与。技术合作发生在模型训练阶段。此次合作确保人工智能能够理解和声、和弦进行和混音的细微差别。实际结果是一个提供平衡音频文件的工具。声音不会错误地与基础乐器重叠。音质符合商业录音行业要求的标准。

完整的三分钟作品的出现改变了独立创作者的工作动力。社交网络上的视频频道和个人资料获得自主权来制作自己的曲目。此举降低了商业音乐许可成本。该模板充当合成助手。艺术家可以在录音室用真实乐器录制最终版本之前快速测试进行和安排。节省财务资源使小型工作室可以投资于视听制作的其他领域。

谷歌维持着一个迭代模型更新的周期。该改进基于用户生成的数据量和开发者社区的反馈。音频处理能力的扩大巩固了公司在生成人工智能领域的基础设施。该公司与其他专注于企业和消费者市场创意解决方案的平台直接竞争。算法的不断发展为系统的下一个版本带来了新的功能。

另见