최신 뉴스 (KO)

업데이트된 Google 도구로 Gemini 앱에서 3분 길이의 음악 작곡 생성

Lyria 3 Pro
사진: Lyria 3 Pro - Divulgação

Google은 오디오 및 사운드 구성 생성을 목표로 하는 인공 지능 모델의 업데이트 버전인 Lyria 3 Pro를 출시했습니다. 이 도구의 주요 기술 변경 사항은 각 트랙의 시간 제한을 늘리는 것입니다. 이는 이전 세대의 30초에서 연속 최대 3분으로 늘어났습니다. 새로운 기능은 보다 광범위하고 완전한 자료에 대한 콘텐츠 제작자와 디지털 제작자의 요구를 충족합니다. Gemini 앱을 유료 구독한 사용자에게는 초기 액세스가 점진적으로 발생합니다.

트랙 길이의 발전은 모델 아키텍처의 개선을 수반하여 이제 텍스트 명령을 더 정확하게 처리하여 구성을 구성합니다. 이 회사는 기업 생태계의 다양한 측면에 기술을 통합하여 편집 전문가와 소프트웨어 개발자가 작업 흐름에서 직접 인공 지능을 사용할 수 있도록 했습니다. 처리는 프롬프트 입력 후 몇 초 이내에 보컬, 악기 및 스튜디오 품질이 포함된 파일 전달을 보장하는 전용 서버에서 이루어집니다.

확장된 오디오 처리 및 구조화 기능

30초에서 3분으로의 전환은 생성 오디오 세그먼트의 상당한 계산적 도약을 나타냅니다. Lyria 3 Pro는 트랙 전체에 걸쳐 고조파와 리듬의 일관성을 유지하여 장기간에 걸쳐 발생하는 경향이 있는 왜곡이나 품질 손실을 방지합니다. 시스템은 사용자의 요청을 분석하고 비트, 배경 멜로디 및 합성 음성을 동기화된 방식으로 결합하여 계층별로 음악을 구축합니다.

사용자는 상세한 텍스트 명령을 통해 노래의 구조를 제어할 수 있습니다. 이 모델은 작곡을 소개, 절, 브리지 및 코러스와 같은 전통적인 블록으로 분리하기 위한 구체적인 지침으로 구성됩니다. 이러한 세분화를 통해 프로젝트의 필요에 따라 상업적 또는 실험적 표준을 따르는 트랙 생성이 용이해집니다. 인공 지능은 리듬의 변화가 귀에 자연스럽게 들리도록 이러한 부분 간의 전환을 조정합니다.

음악 제작자와 베타 테스터는 이 도구가 음악 편곡 및 장르에 대한 복잡한 요청에 효율적으로 응답한다고 보고했습니다. 동일한 트랙에 다양한 스타일을 믹싱하도록 요청하거나 노래의 특정 순간에 악기의 강도를 변경하는 것이 가능합니다. 시스템의 자연어 처리는 음악 이론의 기술 용어를 실용적인 음향 결과로 변환하여 스케치나 백킹 트랙을 만드는 데 소요되는 시간을 줄여줍니다.

애플리케이션 및 서비스 생태계와의 통합

Lyria 3 Pro는 Google에서 관리하는 여러 플랫폼에 배포됩니다. 소비자 시장에서 Gemini 고급 계획 가입자는 앱이나 브라우저를 통해 직접 생성 인터페이스에 액세스합니다. 기업 및 개발 부문의 경우 회사는 Google AI Studio와 Gemini API를 통해 모델을 출시했습니다. 이러한 개방성 덕분에 프로그래머는 Google의 오디오 엔진을 사용하여 다른 인터페이스에서 주문형 음악을 생성하는 타사 애플리케이션을 구축할 수 있습니다.

대기업과 크리에이티브 스튜디오는 회사의 클라우드 머신러닝 플랫폼인 Vertex AI를 통해 액세스할 수 있습니다. 또한 이 모델은 데스크톱 중심의 비디오 편집 애플리케이션인 Google Vids와 음악 제작을 위한 협업 환경인 ProducerAI에 기본적으로 통합되었습니다. 이러한 소프트웨어에 이 도구가 있으면 외부 오디오 뱅크에서 사운드트랙을 검색할 필요가 없습니다.

모델의 다양성은 시청각 및 디지털 엔터테인먼트 시장의 다양한 틈새 시장에 서비스를 제공합니다. 구조화된 오디오의 신속한 생성은 대량의 원본 사운드 자료가 필요한 프로젝트의 일정을 최적화합니다.

  • 튜토리얼 비디오 및 기업 동영상 블로그를 위한 독점 사운드트랙을 제작합니다.
  • 팟캐스트 에피소드를 위한 비네팅 및 전환 음악 개발.
  • 게임 부문을 위한 효과 및 역동적인 배경 음악 생성.
  • 디지털 광고 캠페인을 위한 대규모 오디오 자료 제작.

이미 확립된 워크플로와의 통합은 생성 도구를 실용적인 유틸리티로 포지셔닝하려는 Google의 전략을 보여줍니다. 마케팅 담당자와 비디오 편집자는 장면에 대해 원하는 분위기를 입력하고 시각적 자료에 완벽하게 맞는 트랙을 얻을 수 있습니다.

보안 메커니즘 및 저작권 보호

오디오 생성 기술의 발전은 저작권 및 지적 재산권의 오용에 대한 논쟁을 불러일으킵니다. 이러한 위험을 완화하기 위해 Google은 Lyria 3 Pro에 엄격한 보안 필터를 구현했습니다. 시스템은 실제 가수의 목소리를 복제하려는 시도를 차단하고 모델이 저작권이 있는 음악을 직접 복사하는 것을 방지합니다. 사용자가 명령어에 유명 아티스트의 이름을 입력하면 인공지능은 그 사람의 보컬 아이덴티티를 모방하지 않고 스타일이나 장르에 대한 언급만 해석한다.

회사가 채택한 또 다른 보안 조치는 플랫폼에서 생성된 모든 트랙에 SynthID를 적용하는 것입니다. 이 기술은 눈에 보이지 않거나 들리지 않는 디지털 워터마크를 파일의 오디오 스펙트럼에 직접 삽입합니다. 마커는 편집, 압축 또는 형식 변경을 방지하므로 검증 소프트웨어가 재료의 합성 출처를 식별할 수 있습니다. 이 계획의 목표는 미디어 소비의 투명성을 높이고 가짜 오디오와 관련된 잘못된 정보나 사기에 맞서 싸우는 것입니다.

신속한 처리 과정에서 보안 점검이 실시간으로 이루어집니다. 시스템에서 요청이 사용 지침을 위반하거나 저작권 보호를 우회하려는 시도를 감지하는 경우 생성이 즉시 중지됩니다. Google은 다양한 국가의 인공 지능에 대한 현재 규정에 따라 이러한 필터를 지속적으로 업데이트하는 전담 팀을 유지하고 있습니다.

디지털 콘텐츠 제작 시장에 미치는 영향

Lyria 3 Pro의 개발에는 모델 교육 단계 동안 전문 음악가, 사운드 엔지니어 및 프로듀서가 참여했습니다. 이러한 기술 협력을 통해 인공 지능이 화음, 코드 진행 및 믹싱의 뉘앙스를 이해할 수 있게 되었습니다. 실용적인 결과는 보컬이 기본 악기와 잘못 겹치지 않는 균형 잡힌 오디오 파일을 제공하는 도구입니다.

3분 분량의 완전한 작곡이 가능해짐에 따라 독립 창작자의 작업 역학이 달라졌습니다. 소셜 네트워크의 비디오 채널과 프로필은 자체 트랙을 생성할 수 있는 자율성을 확보하여 상업용 음악에 대한 라이선스 비용을 줄입니다. 이 모델은 작곡 보조 역할을 하여 아티스트가 실제 악기를 사용하여 스튜디오에서 최종 버전을 녹음하기 전에 진행 및 편곡을 신속하게 테스트할 수 있도록 해줍니다.

Google은 사용자가 생성한 데이터의 양과 개발자 커뮤니티의 피드백을 기반으로 모델에 대한 반복적인 업데이트 주기를 유지합니다. 오디오 처리 용량의 확장은 생성 인공 지능 부문에서 회사의 인프라를 통합하여 기업 및 최종 소비자 시장을 위한 창의적인 솔루션에 초점을 맞춘 다른 플랫폼과 직접 경쟁합니다.