Google випустила Lyria 3 Pro, оновлену версію своєї моделі штучного інтелекту, призначеної для створення аудіо та звукових композицій. Основна технічна зміна інструменту полягає у збільшенні ліміту часу для кожної доріжки, який збільшився з тридцяти секунд у попередньому поколінні до трьох безперервних хвилин. Нова функція відповідає попиту творців контенту та цифрових продюсерів на більш обширні та повні матеріали. Початковий доступ відбувається поступово для користувачів, які мають платну підписку на додаток Gemini.
Збільшення довжини доріжок супроводжується вдосконаленнями в архітектурі моделі, яка тепер обробляє текстові команди з більшою точністю для структурування композицій. Компанія інтегрувала технологію в різні аспекти своєї корпоративної екосистеми, дозволяючи фахівцям із редагування та розробникам програмного забезпечення використовувати штучний інтелект безпосередньо у своїх робочих процесах. Обробка відбувається на виділених серверах, що гарантує доставку файлів з вокалом, інструментівкою та студійної якості протягом декількох секунд після введення підказки.
https://twitter.com/GeminiApp/status/2036836190431711500?ref_src=twsrc%5Etfw
Capacidade розширена обробка та структурування звуку
Перехід від тридцяти секунд до трьох хвилин являє собою значний обчислювальний стрибок у сегменті генеративного аудіо. Lyria 3 Pro вдається підтримувати гармонічну та ритмічну узгодженість по всій довжині треку, уникаючи спотворень або втрати якості, які зазвичай виникають у тривалих поколіннях. Система аналізує запит користувача і будує музику шар за шаром, поєднуючи ритми, фонові мелодії та синтетичні голоси синхронізованим способом.
Користувачі можуть контролювати структуру пісні за допомогою детальних текстових команд. Модель містить спеціальні інструкції для поділу композиції на традиційні блоки, такі як вступ, куплети, бриджі та приспіви. Сегментація Essa полегшує створення доріжок, які відповідають комерційним або експериментальним стандартам, залежно від потреб проекту. Штучний інтелект регулює переходи між цими частинами так, щоб зміна ритму звучала природно для ваших вух.
Музичні та бета-тестери Produtores повідомили, що інструмент ефективно реагує на складні запити щодо музичних аранжувань і жанрів. Можна запросити змішування різних стилів на одному треку або змінити інтенсивність інструментів у певні моменти пісні. Обробка природної мови в системі перетворює технічні терміни з теорії музики на практичні звукові результати, скорочуючи час, витрачений на створення скетчів або мінусовок.
Integração з екосистемою програм і сервісів
Розповсюдження Lyria 3 Pro відбувається на кількох платформах, які підтримує Google. На споживчому ринку передплатники розширених планів Gemini отримують доступ до інтерфейсу створення безпосередньо через програму або браузер. Para у секторі підприємств і розробки, компанія випустила модель Google AI на Studio і через Gemini API. Відкритість Essa дозволяє програмістам створювати програми сторонніх розробників, які використовують аудіосистему Google для створення музики на вимогу в інших інтерфейсах.
Корпорації та творчі студії Grandes мають доступ через Vertex AI, хмарну платформу машинного навчання компанії. Модель Além була вбудована в Google Vids, програму для редагування відео, орієнтовану на робочий стіл, і ProducerAI, середовище для спільної роботи для створення музики. Наявність інструменту в цьому програмному забезпеченні позбавляє від необхідності шукати звукові доріжки в зовнішніх аудіобанках.
Універсальність моделі обслуговує різні ніші на ринку аудіовізуальних і цифрових розваг. Швидка генерація структурованого аудіо оптимізує розклад для проектів, які потребують великого обсягу оригінального звукового матеріалу.
- Criação ексклюзивних саундтреків для навчальних відео та корпоративних відеоблогів.
- Desenvolvimento віньєток і музики переходів для епізодів подкастів.
- Geração ефектів і динамічної фонової музики для ігрового сектора.
- Produção масштабного аудіоматеріалу для цифрових рекламних кампаній.
Інтеграція з уже встановленими робочими процесами демонструє стратегію Google щодо позиціонування своїх генеративних інструментів як практичних утиліт. Маркетингові та відеоредактори Profissionais можуть створити потрібний настрій для сцени та отримати трек, який ідеально відповідає візуальному матеріалу.
Безпека Mecanismos і захист авторських прав
Розвиток технологій генерації аудіо викликає дебати щодо авторського права та зловживання інтелектуальною власністю. Para Щоб зменшити ці ризики, Google реалізував суворі фільтри безпеки в Lyria 3 Pro. Система блокує спроби клонувати голоси справжніх співаків і не дозволяє моделі створювати прямі копії захищеної авторським правом музики. Quando: користувач вводить ім’я відомого артиста в команду, штучний інтелект інтерпретує згадку лише як посилання на стиль чи жанр, не імітуючи вокальної ідентичності людини.
Заходом безпеки Outra, прийнятим компанією, є застосування SynthID на всіх треках, створених платформою. Технологія Essa вбудовує невидимий і нечутний цифровий водяний знак безпосередньо в звуковий спектр файлу. Маркер стійкий до редагування, стиснення або зміни формату, що дозволяє програмному забезпеченню перевірки ідентифікувати синтетичне походження матеріалу. Ініціатива спрямована на сприяння прозорості споживання медіа та боротьбу з дезінформацією чи шахрайством із використанням підробленого аудіо.
Перевірки безпеки відбуваються в режимі реального часу під час швидкої обробки. Якщо система виявляє, що запит порушує правила використання або намагається обійти захист авторських прав, генерація негайно припиняється. Google підтримує команди, які займаються постійним оновленням цих фільтрів, дотримуючись чинних норм щодо штучного інтелекту в різних країнах.
Impacto на ринку створення цифрового контенту
Розробка Lyria 3 Pro передбачала участь професійних музикантів, звукорежисерів і продюсерів на етапі навчання моделі. Технічна співпраця Essa гарантувала, що штучний інтелект розуміє нюанси гармонії, акордової прогресії та мікшування. Практичним результатом є інструмент, який забезпечує збалансовані аудіофайли, де вокал не накладається неправильно на основні інструменти.
Наявність повних трихвилинних композицій змінює динаміку творчості незалежних творців. Відео Canais і профілі в соціальних мережах отримують автономію для створення власних треків, зменшуючи витрати на ліцензування комерційної музики. Модель діє як помічник композиції, дозволяючи виконавцям швидко тестувати прогресії та аранжування перед записом остаточної версії в студії за допомогою справжніх інструментів.
Google підтримує цикл ітераційних оновлень моделі на основі обсягу даних, створених користувачами, і відгуків від спільнот розробників. Розширення потужностей обробки аудіо консолідує інфраструктуру компанії в секторі генеративного штучного інтелекту, безпосередньо конкуруючи з іншими платформами, орієнтованими на креативні рішення для корпоративного та кінцевого споживачів.

