News (RU)

Gemini Live меняет голоса и меняет ритм в последних обновлениях

Gemini
Foto: Gemini - Primakov / Shutterstock.com

Пользователи Gemini Live заметили изменения в голосовых настройках помощника Google по искусственному интеллекту. Изменения включают изменения в темпе речи, тоне и даже сочетании региональных акцентов во время взаимодействия в реальном времени. Эти изменения часто происходят после обновлений шаблонов, таких как недавняя версия Flash Live 3.1, и влияют на персонализированные беседы.

Во многих отчетах указывается, что предварительный просмотр голоса в приложении не соответствует реальному звуку при использовании функции Live. Вариант Capella, воспроизводящий британский женский акцент, претерпел более очевидные изменения с момента первого запуска. Другие региональные голоса также демонстрируют аналогичные проблемы с последовательностью.

Изменения ритма и тона голоса.

Изменения в темпе речи представляют собой одну из наиболее распространенных жалоб среди пользователей, использующих различные голосовые параметры в Gemini Live. Речевые модели замедляются при различных настройках, а высокие тона заметно снижаются. В некоторых случаях во время продолжающихся разговоров в ответах чередуются австралийские акценты и более нейтральные варианты американского.

Эти корректировки происходят постепенно после перезагрузки приложения, когда выбранный акцент сохраняется в течение короткого периода времени, прежде чем трансформироваться в гибридную версию. Этот опыт может стать неудобным для тех, кто ожидает последовательности во взаимодействии. Пользователи, которые общаются дольше, чаще замечают эти переходы.

Близнецы
Близнецы – mundissima/ Shutterstock.com

Сравнение предварительного просмотра и фактического использования ресурса

Предварительный просмотр аудио, доступный в настройках Gemini Live, часто отличается от результатов, полученных в активных сеансах чата. Особенно эта разница касается персонализированных голосов, которые со временем теряют первоначальные характеристики. Сообщения, накопленные за последние месяцы, указывают на постепенное ухудшение некоторых доступных вариантов.

  • Более медленный ритм влияет на естественный поток ответов.
  • Высокие тона смягчаются, меняя индивидуальность голоса.
  • В диалогах смешение акцентов происходит непредсказуемо.
  • Временный сброс приложения частично восстанавливает исходное поведение.

Эти наблюдения происходят в контексте частых обновлений моделей искусственного интеллекта Google, которые направлены на повышение общей производительности, но создают побочные эффекты на голоса.

Аудиоартефакты в сеансах Gemini Live

Звуковые артефакты, такие как хлопки, хлопки и шипение, время от времени появляются при использовании Gemini Live. Эти шумы не связаны напрямую с изменением голоса, но представляют собой еще одну повторяющуюся жалобу на форумах поддержки компании. Возникновение зависит от выбранного варианта голоса и не всегда повторяется одинаково.

Многим пользователям удается воспроизвести проблему в конкретных тестах, а другие наблюдают артефакты только в определенных условиях. Качество звука остается стабильным при использовании быстрых голосовых команд или в режиме Live, встроенном в Android Auto в автомобилях. Эта разница предполагает, что проблема концентрируется при длительных сеансах разговора или в определенных контекстах использования.

Поведение в различных сценариях взаимодействия

Голоса Gemini Live сохраняют большую стабильность, когда помощник вызывается для выполнения коротких команд или простого голосового управления. Однако во время более глубокого разговорного взаимодействия изменения в темпе и тоне становятся более очевидными. Функция в автомобилях через Android Auto также лучше сохраняет исходные характеристики выбранных опций.

Google получил запросы по поводу такого поведения, хотя официального подтверждения о распознавании или исправлении в настоящее время нет. Пользователи продолжают тестировать различные доступные голоса, включая капеллу, чтобы определить, какие из них со временем меняются меньше всего.

Доступные опции и настройки в приложении

Gemini Live предлагает несколько настраиваемых голосов с различными акцентами и тонами, например варианты, имитирующие британский, нейтральный американский и другие региональные варианты. Пользователи могут изменить выбор непосредственно в настройках приложения, чтобы найти настройку, которая лучше всего соответствует индивидуальным предпочтениям. Изменение голоса не всегда решает проблемы с каденцией навсегда.

  • Опции включают голоса с более высокими или более низкими характеристиками.
  • Некоторым лучше сохранить акцент, выбранный на первых занятиях.
  • Сброс приложения может временно восстановить ожидаемое поведение.
  • Обновления шаблонов влияют на общую производительность голосов.

Эти функции допускают большую настройку, но обнаруженные несоответствия подчеркивают необходимость корректировок со стороны компании, ответственной за разработку.

Эволюция голосов на Gemini Live с течением времени

За последние несколько месяцев некоторые голосовые параметры Gemini Live претерпели изменения, которые изменили такие аспекты, как скорость речи и сочетание акцентов. Эти изменения совпадают с улучшениями в других аспектах моделей ИИ, включая скорость реакции и понимание контекста. Эта функция продолжает развиваться, и появляются обновления, призванные сделать взаимодействие более плавным.

Пользователи, которые полагаются на определенные голоса для выполнения повседневных задач или доступности, видят прямое влияние на удобство использования. Согласованность между предварительным просмотром звука и фактическим исполнением остается предметом внимания для тех, кто использует помощника в длительных разговорах. Google продолжает совершенствовать систему, основываясь на полученных отзывах о производительности голоса.

Veja Tambem em News (RU)

Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК

Платформа Epic Games выпускает двенадцать высокобюджетных игр бесплатно для пользователей ПК

Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы

Падение цен на PlayStation 5 Pro ускоряет цифровые розничные продажи и устраняет глобальные запасы

Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone

Новое обновление системы Apple оптимизирует управление срочными задачами для пользователей iPhone

Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S

Утечка подробностей об оборудовании новой портативной PlayStation с графикой, превосходящей Xbox Series S

Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором

Oppo официально представляет Find X9 Ultra по всему миру с линзами Hasselblad и надежным аккумулятором

Новая версия складного смартфона принесет золото участникам Зимних игр

Новая версия складного смартфона принесет золото участникам Зимних игр

Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple

Тим Кук представляет новые прототипы iPhone и iPod на праздновании пятидесятилетия Apple

Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5

Samsung обновляет модуль QuickStar и расширяет визуальное управление панелью в интерфейсе One UI 8.5

Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.

Система Android получает встроенную интеграцию Gemini Nano 4 для автономной обработки на смартфонах.

Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.

Утечка раскрывает Lords of the Fallen и Sword Art Online в апрельском каталоге PS Plus Essential.

Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.

Новый смартфон Xiaomi 18 Pro Max объединяет две камеры по 200 Мп и процессор последнего поколения.

Apple разрабатывает новый складной iPhone и готовит специальную версию в честь 20-летия бренда

Apple разрабатывает новый складной iPhone и готовит специальную версию в честь 20-летия бренда