Google、Lyria 3 Pro モデルをアップデートし、Gemini で 3 分間の音楽トラックの作成を可能に

Lyria 3 Pro

Lyria 3 Pro - Divulgação

GoogleはLyria 3 Proの発売を発表した。新しいバージョンの人工知能モデルは、オーディオと完全なサウンド構成を生成します。このツールの主な技術的進歩は、各トラックの制限時間の増加です。容量は 30 秒から連続最大 3 分になりました。このアップデートは、広範な素材に対するコンテンツ クリエーターやデジタル プロデューサーの需要に応えます。初期アクセスは、有料の Gemini アプリ プラン加入者に対して段階的に行われます。このリソースのリリースは、2026 年の作成ツールの優位性をめぐるテクノロジー企業間の紛争の新たな段階を示しています。

トラック持続時間の向上には、システム アーキテクチャの改善が伴います。モデルはテキスト コマンドをより正確に処理して、構成を構造化するようになりました。同社は、企業エコシステムのさまざまな領域にテクノロジーを統合してきました。編集専門家やソフトウェア開発者は、人工知能をワークフローで直接利用できます。処理は専用サーバーで行われます。このインフラストラクチャは、わずか数秒で音声、楽器、スタジオ品質のファイルを配信することを保証します。

https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw

音声処理および構造化機能

30 秒から 3 分への移行は、生成オーディオ セグメントにおける計算の飛躍を表します。 Lyria 3 Pro は、トラック全体を通してハーモニーとリズミカルな一貫性を維持します。このシステムは、長期にわたる世代によく見られる歪みや品質の損失を回避します。プラットフォームはユーザーのリクエストを分析し、レイヤーで曲を構築します。このプロセスでは、ビート、バックグラウンド メロディー、合成音声が同期された方法で結合されます。サーバー インフラストラクチャを使用すると、ユーザーのデバイスに負担をかけることなく、クラウド上で重い処理を実行できます。

ユーザーは詳細なテキストコマンドを通じて曲の構造を制御できます。このモデルは、構成を従来のブロックに分割するための特定の命令で構成されています。クリエイターはイントロ、ヴァース、ブリッジ、コーラスを定義できます。セグメンテーションを使用すると、商用または実験的なパターンに従ったトラックを簡単に作成できます。人工知能がパート間のトランジションを調整します。目標は、リズムの変化を自然に聞こえるようにすることです。きめ細かな制御により、複雑なプロジェクトの創造的な自由度が高まります。

ベータ テスターと音楽プロデューサーは、このツールが複雑なリクエストに効率的に応答すると報告しています。同じトラック上で異なるスタイルのミックスをリクエストすることが可能です。ユーザーは、曲の特定の瞬間で楽器の強さを変更することもできます。自然言語処理は、音楽理論の専門用語を実際の音響結果に変換します。この機能により、ドラフトの作成やトラックの追跡にかかる時間が短縮されます。このシステムの精度により、定期的なやり直しの必要がなくなり、短い納期に依存するユーザーのワークフローが最適化されます。

アプリケーションとサービスのエコシステムとの統合

Lyria 3 Pro は、Google が管理する複数のプラットフォームに分散されています。消費者市場では、Gemini アドバンスト プランの加入者は、アプリまたはブラウザーを介して作成インターフェイスにアクセスします。同社はこのモデルを Google AI Studio および Gemini API を通じてエンタープライズ部門向けにリリースしました。オープン性により、プログラマはサードパーティ アプリケーションを作成できます。新しいツールはオーディオ エンジンを使用して、他のインターフェイスでオンデマンドで音楽を生成します。同社が提供する技術文書は、さまざまなデジタル環境でのツールの安全な実装をガイドします。

大企業やクリエイティブ スタジオは、Vertex AI を通じてテクノロジーにアクセスします。同社のクラウド機械学習プラットフォームは、複雑な操作を一元化します。このモデルは Google Vids にもネイティブに組み込まれています。パソコンを中心とした動画編集アプリケーションでクリエイターの日常業務を楽にします。音楽制作のための共同作業環境であるProducerAIも同様に統合されました。これらのソフトウェアにはこのツールが含まれているため、外部オーディオ バンク内のトラックを検索する必要がなくなります。リソースを一元化すると、編集チームの生産性が向上します。

こちらも参照

このモデルの多用途性は、オーディオビジュアルおよびデジタル エンターテイメント市場のさまざまなニッチ市場に対応します。構造化オーディオの高速生成により、プロジェクトのスケジュールが最適化されます。チームは、より短時間で大量のオリジナルのサウンド素材を作成できます。

  • チュートリアルビデオや企業資料用の専用サウンドトラックの作成。
  • ポッドキャスト エピソードのビネットとトランジション ミュージックの開発。
  • 電子ゲーム分野向けのエフェクトとダイナミックなアンビエント ミュージックの生成。
  • デジタル広告キャンペーン用の大規模な音声素材の制作。

すでに確立されているワークフローとの統合は、Google の戦略を示しています。同社は、自社の生成ツールを実用的な日常ユーティリティとして位置づけようとしています。マーケティング担当者とビデオ編集者は、シーンに望ましい雰囲気を作成できます。その結果、ビジュアル素材と完全に同期したトラックが得られます。使いやすさにより、高品質のサウンド作品へのアクセスが容易になります。

セキュリティメカニズムと著作権保護

オーディオ生成技術の進歩により、著作権と知的財産の悪用に関する議論が生じています。 Google は、リスクを軽減するために、Lyria 3 Pro に厳格なセキュリティ フィルターを実装しました。このシステムは、本物の歌手の声を複製しようとする試みをブロックします。このモデルでは、保護された音楽の直接コピーを作成することもできません。ユーザーがコマンドに有名なアーティストの名前を入力すると、人工知能はその言及をスタイル参照としてのみ解釈します。いかなる状況においても、その人の声のアイデンティティを模倣することはできません。

同社が採用したもう 1 つのセキュリティ対策は、生成されたすべてのトラックに SynthID を適用することです。この技術は、目に見えず、聞こえない電子透かしをファイルの音声スペクトルに直接埋め込みます。マーカーは編集、圧縮、または形式の変更に耐えます。この機能により、検証ソフトウェアが材料の合成起源を特定できるようになります。この取り組みは、メディア消費の透明性を促進することを目的としています。このメカニズムは、インターネット上の偽の音声を含む誤った情報や詐欺と戦うのに役立ちます。

セキュリティチェックはトラック処理中にリアルタイムで行われます。リクエストが使用ガイドラインに違反していることがシステムによって検出されると、生成はただちに停止されます。著作権保護を回避しようとする場合にも同様のことが起こります。 Google は、これらのフィルタを継続的に更新することに専念するチームを維持しています。同社は、各国の人工知能に関する現在の規制に従っています。トレーニング データの使用における透明性も、プラットフォームの更新されたポリシーの一部です。

デジタルコンテンツ制作市場への影響

Lyria 3 Pro の開発には、プロのミュージシャン、サウンド エンジニア、プロデューサーが参加しました。技術協力はモデルのトレーニング段階で行われました。このパートナーシップにより、人工知能がハーモニー、コード進行、ミキシングのニュアンスを確実に理解できるようになりました。実際の結果は、バランスのとれたオーディオ ファイルを配信するツールです。ボイスがベース楽器と誤って重なることはありません。音質は商業録音業界が要求する基準を満たしています。

3 分間の完全な作品が利用可能になると、独立系クリエイターの仕事のダイナミクスが変わります。ソーシャル ネットワーク上のビデオ チャンネルとプロフィールは、独自のトラックを作成する自律性を獲得します。この動きにより、商用音楽のライセンスコストが削減されます。テンプレートは合成アシスタントとして機能します。アーティストは、スタジオで実際の楽器を使用して最終バージョンを録音する前に、進行やアレンジをすばやくテストできます。財政資源を節約することで、小規模スタジオはオーディオビジュアル制作の他の分野に投資できるようになります。

Google は、反復的なモデル更新のサイクルを維持しています。この改善は、ユーザーによって生成されたデータ量と開発者コミュニティからのフィードバックに基づいています。音声処理能力の拡大により、生成人工知能分野における同社のインフラが強化されます。同社は、企業および消費者市場向けのクリエイティブなソリューションに焦点を当てた他のプラットフォームと直接競合しています。アルゴリズムの継続的な進化により、システムの次のバージョンで新しい機能が期待されます。

こちらも参照