Gemini Live променя гласовете и ритъма в последните актуализации

Gemini

Gemini - Primakov / Shutterstock.com

Gemini Live потребителите забелязват промени в гласовите опции на асистента с изкуствен интелект Google. Промените включват вариации в ритъма на речта, тона и дори комбинацията от регионални акценти по време на взаимодействия в реално време. Essas промените често възникват след актуализации на шаблони, като най-новата версия 3.1 Flash Live, и засягат персонализираното изживяване на разговорите.

Много доклади показват, че гласовите визуализации в приложението не съответстват на действителния звук при използване на функцията Live. Опцията Capella, която възпроизвежда женски британски акцент, има по-очевидни промени от първоначалното издание. Outras Регионалните гласове също показват подобни проблеми с последователността.

Промени в ритъма и тона на гласовете

Промените в ритъма на говора представляват едно от най-честите оплаквания сред потребителите, използващи различни гласови опции на Gemini Live. Моделите на говора се забавят при различни настройки, докато високите тонове са забележимо намалени. В някои случаи отговорите се редуват между австралийски акценти и по-неутрални варианти на американски по време на текущи разговори.

Тези корекции се извършват постепенно след нулиране на приложението, когато избраният акцент остава за кратък период от време, преди да се трансформира в хибридна версия. Опитът може да стане неудобен за тези, които очакват последователност във взаимодействията. Usuários Тези, които водят по-дълги разговори, забелязват тези преходи по-често.

Близнаци – mundissima/ Shutterstock.com

Сравнение между визуализация и реално използване на ресурса

Аудио визуализацията, налична в настройките Gemini Live, често се различава от резултатите, получени в активни разговорни сесии. Essa разликата засяга особено персонализираните гласове, които губят оригиналните характеристики с течение на времето. Relatos, натрупани през последните месеци, показват прогресивно влошаване на няколко налични опции.

  • По-бавният каданс влияе върху естествения поток от отговори.
  • Високите тонове се омекотяват, променяйки индивидуалността на гласа.
  • В диалозите непредвидимо се появяват смеси от акценти.
  • Временното нулиране на приложението частично възстановява първоначалното поведение.

Тези наблюдения идват в контекста на чести актуализации на AI моделите на Google, които имат за цел да подобрят цялостната производителност, но генерират странични ефекти върху гласовете.

Аудио артефакти в Gemini Live сесии

Звукови артефакти като пукане, пукане и съскане се появяват спорадично по време на използване на Gemini Live. Шумовете Esses не са пряко свързани с промените в гласа, но представляват друго повтарящо се оплакване във форумите за поддръжка на компанията. Появата варира в зависимост от избраната гласова опция и не винаги се повтаря идентично.

Много потребители са в състояние да възпроизведат проблема в конкретни тестове, докато други наблюдават артефакти само при определени условия. Качеството на звука остава стабилно при бързи гласови команди или в режим Android Auto, интегриран с Android Auto в превозни средства. Essa разлика предполага, че проблемът е концентриран в по-дълги разговори или в определени контексти на употреба.

Поведение при различни сценарии на взаимодействие

Гласовете на Gemini Live поддържат по-голяма стабилност, когато асистентът е активиран за кратки команди или прости гласови контроли. Въпреки това, по време на по-дълбоки разговорни взаимодействия, промените в ритъма и тона стават по-очевидни. Функцията за автомобили чрез Android Auto също запазва по-добре оригиналните характеристики на избраните опции.

Google получи запитвания за тези поведения, въпреки че в момента няма официално потвърждение за разпознаване или корекции. Usuários продължава да тества различни налични гласове, включително Capella, за да идентифицира кои от тях показват най-малко вариации във времето.

Налични опции и корекции в приложението

Gemini Live предлага множество персонализирани гласове с различни акценти и тонове, като опции, които симулират британски, неутрални американски и други регионални вариации. Потребителите могат да променят избора си директно в настройките на приложението, за да намерят настройката, която най-добре отговаря на индивидуалните предпочитания. Промяната на гласовете не винаги решава проблемите с ритъма за постоянно.

  • Опциите включват гласове с по-високи или по-ниски характеристики.
  • Някои по-добре запазват акцента, избран в първоначалните сесии.
  • Нулирането на приложението може временно да възстанови очакваното поведение.
  • Актуализациите на шаблона влияят върху цялостната производителност на гласовете.

Тези функции позволяват по-голяма персонализация, но отчетените несъответствия подчертават необходимостта от корекции от компанията, отговорна за разработката.

Еволюция на гласовете в Gemini Live с течение на времето

През последните няколко месеца няколко гласови опции за Gemini Live претърпяха модификации, които променят аспекти като скорост на говора и комбинация от акценти. Essas промени съвпадат с подобрения в други аспекти на AI моделите, включително скорост на реакция и разбиране на контекста. Функцията продължава да се развива с актуализации, които имат за цел да направят взаимодействията по-плавни.

Потребителите, които разчитат на конкретни гласове за ежедневни задачи или достъпност, виждат пряко въздействие върху използваемостта. Съгласуваността между аудио визуализацията и действителното изпълнение остава точка на внимание за тези, които използват асистента в продължителни разговори. Google продължава да подобрява системата въз основа на обратна връзка, получена за представянето на гласовете.