Gemini Live меняет голоса и меняет ритм в последних обновлениях
Пользователи Gemini Live заметили изменения в голосовых настройках помощника Google по искусственному интеллекту. Изменения включают изменения в темпе речи, тоне и даже сочетании региональных акцентов во время взаимодействия в реальном времени. Эти изменения часто происходят после обновлений шаблонов, таких как недавняя версия Flash Live 3.1, и влияют на персонализированные беседы.
Во многих отчетах указывается, что предварительный просмотр голоса в приложении не соответствует реальному звуку при использовании функции Live. Вариант Capella, воспроизводящий британский женский акцент, претерпел более очевидные изменения с момента первого запуска. Другие региональные голоса также демонстрируют аналогичные проблемы с последовательностью.
Изменения ритма и тона голоса.
Изменения в темпе речи представляют собой одну из наиболее распространенных жалоб среди пользователей, использующих различные голосовые параметры в Gemini Live. Речевые модели замедляются при различных настройках, а высокие тона заметно снижаются. В некоторых случаях во время продолжающихся разговоров в ответах чередуются австралийские акценты и более нейтральные варианты американского.
Эти корректировки происходят постепенно после перезагрузки приложения, когда выбранный акцент сохраняется в течение короткого периода времени, прежде чем трансформироваться в гибридную версию. Этот опыт может стать неудобным для тех, кто ожидает последовательности во взаимодействии. Пользователи, которые общаются дольше, чаще замечают эти переходы.
Сравнение предварительного просмотра и фактического использования ресурса
Предварительный просмотр аудио, доступный в настройках Gemini Live, часто отличается от результатов, полученных в активных сеансах чата. Особенно эта разница касается персонализированных голосов, которые со временем теряют первоначальные характеристики. Сообщения, накопленные за последние месяцы, указывают на постепенное ухудшение некоторых доступных вариантов.
- Более медленный ритм влияет на естественный поток ответов.
- Высокие тона смягчаются, меняя индивидуальность голоса.
- В диалогах смешение акцентов происходит непредсказуемо.
- Временный сброс приложения частично восстанавливает исходное поведение.
Эти наблюдения происходят в контексте частых обновлений моделей искусственного интеллекта Google, которые направлены на повышение общей производительности, но создают побочные эффекты на голоса.
Аудиоартефакты в сеансах Gemini Live
Звуковые артефакты, такие как хлопки, хлопки и шипение, время от времени появляются при использовании Gemini Live. Эти шумы не связаны напрямую с изменением голоса, но представляют собой еще одну повторяющуюся жалобу на форумах поддержки компании. Возникновение зависит от выбранного варианта голоса и не всегда повторяется одинаково.
Многим пользователям удается воспроизвести проблему в конкретных тестах, а другие наблюдают артефакты только в определенных условиях. Качество звука остается стабильным при использовании быстрых голосовых команд или в режиме Live, встроенном в Android Auto в автомобилях. Эта разница предполагает, что проблема концентрируется при длительных сеансах разговора или в определенных контекстах использования.
Поведение в различных сценариях взаимодействия
Голоса Gemini Live сохраняют большую стабильность, когда помощник вызывается для выполнения коротких команд или простого голосового управления. Однако во время более глубокого разговорного взаимодействия изменения в темпе и тоне становятся более очевидными. Функция в автомобилях через Android Auto также лучше сохраняет исходные характеристики выбранных опций.
Google получил запросы по поводу такого поведения, хотя официального подтверждения о распознавании или исправлении в настоящее время нет. Пользователи продолжают тестировать различные доступные голоса, включая капеллу, чтобы определить, какие из них со временем меняются меньше всего.
Доступные опции и настройки в приложении
Gemini Live предлагает несколько настраиваемых голосов с различными акцентами и тонами, например варианты, имитирующие британский, нейтральный американский и другие региональные варианты. Пользователи могут изменить выбор непосредственно в настройках приложения, чтобы найти настройку, которая лучше всего соответствует индивидуальным предпочтениям. Изменение голоса не всегда решает проблемы с каденцией навсегда.
- Опции включают голоса с более высокими или более низкими характеристиками.
- Некоторым лучше сохранить акцент, выбранный на первых занятиях.
- Сброс приложения может временно восстановить ожидаемое поведение.
- Обновления шаблонов влияют на общую производительность голосов.
Эти функции допускают большую настройку, но обнаруженные несоответствия подчеркивают необходимость корректировок со стороны компании, ответственной за разработку.
Эволюция голосов на Gemini Live с течением времени
За последние несколько месяцев некоторые голосовые параметры Gemini Live претерпели изменения, которые изменили такие аспекты, как скорость речи и сочетание акцентов. Эти изменения совпадают с улучшениями в других аспектах моделей ИИ, включая скорость реакции и понимание контекста. Эта функция продолжает развиваться, и появляются обновления, призванные сделать взаимодействие более плавным.
Пользователи, которые полагаются на определенные голоса для выполнения повседневных задач или доступности, видят прямое влияние на удобство использования. Согласованность между предварительным просмотром звука и фактическим исполнением остается предметом внимания для тех, кто использует помощника в длительных разговорах. Google продолжает совершенствовать систему, основываясь на полученных отзывах о производительности голоса.
Veja Tambem em News (RU)
Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК
Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы
Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone
Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S
Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором
Новая версия складного смартфона принесет золото участникам Зимних игр
Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple
Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5
Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.
Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.
Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.