News (KK)

Google Gemini Live қолданбасындағы дауыс жүйесін өзгертеді және аймақтық екпіндердің каденциясын өзгертеді

Gemini
Foto: Gemini - Primakov / Shutterstock.com

Google виртуалды көмекшісінің пайдаланушылары нақты уақыттағы өзара әрекеттесу кезінде дыбыс параметрлеріндегі елеулі тұрақсыздықтар туралы хабарлай бастады. Өзгерістер қолданбада таңдалған опциялардың негізгі сипаттамаларын өзгерте отырып, пайдаланушы тәжірибесіне тікелей әсер етеді.

Мәселе негізінен сөйлеу ырғағында, жауаптар реңкінде және аймақтық екпіндердің жүйелілігінде көрінеді. Essas Үздіксіз диалогтар кезінде жасанды интеллект жүйесінің байланыс үлгісін өзгертетін вариациялар күтпеген жерден пайда болады.

Егіздер
Егіздер – mundissima/ Shutterstock.com

Кемшіліктер компанияның тіл үлгілеріне соңғы жаңартуларды енгізгеннен кейін анық болды. Параметрлерде ұсынылған аудио үлгісі мен іс жүзінде шығарылған дыбыс арасындағы сәйкессіздік мобильді құрылғыларға бағытталған технологиялық форумдардағы шағымдардың негізгі нысанасына айналды.

Дыбыс сәйкессіздіктері және пайдаланушы тәжірибесі

Британдық әйел акцентімен сипатталатын Capella деп аталатын дауыс опциясы іске қосылғаннан бері ең айқын бұрмалануларға ие. Тұтынушылар алғашқы бірнеше пәрмендерден кейін дыбыстың бастапқы сипатының тез жоғалатынын байқайды.

Ұзақ сөйлесулер кезінде жүйе адам таңдаған аймақтық үлгіні сақтауда қиындықтарды көрсетеді. Көмекшінің жауаптары австралиялық екпіндер мен американдық ағылшын тілінің бейтарап нұсқалары арасында автономды түрде кезектесе бастайды, бұл күнделікті тапсырмалар немесе оқу үшін құралға сенетіндер үшін үзінді және шатастыратын тыңдау тәжірибесін жасайды.

Қолданбаның әрекеті жасанды интеллект үлгісінің жаңа нұсқалары талап ететін күрделі дауыстық модуляцияны қолдауға тырысқанда нақты уақыттағы өңдеу қиыншылықтарға тап болады деп болжайды. Quando пайдаланушы бағдарламалық құралды мәжбүрлеп қайта іске қосады, бастапқы екпін қалпына келтірілді, бірақ бұл түзету уақытша ғана әсер етеді. Após Бірнеше минут үздіксіз әрекеттесуден кейін дауыс қайтадан гибридті нұсқаға айналады, бұл сөйлеу синтезі жүйесі көбірек мәтінмәндік өңдеуді және ұзақ жауаптарды қажет ететін сеанстарда тұрақтылықты сақтай алмайтынын көрсетеді.

  • Күрделі жауаптарда сөйлеу жылдамдығы айтарлықтай төмендейді.
  • Қолдану кезінде бастапқы жоғары дыбыстар айтарлықтай төмендейді.
  • Бір сөйлемде әртүрлі екпіндер байқаусызда араласады.
  • Қолданбаны қайта іске қосу тек мәселені шешуді ұсынады.

Кеңейтілген сеанстардағы аудио артефактілер

Дауысты сәйкестіктің өзгеруінен басқа, ассистент жауаптарды жаңғырту кезінде қажетсіз шуларды көрсете бастады. Жүйе сұралған ақпаратты өңдеп, жеткізіп жатқанда, Artefatos дыбыстар, мысалы, қалқымалы дыбыстар, кішігірім қалқымалар және фондық ысқырықтар кездейсоқ пайда болады.

Бұл акустикалық кедергілердің акценттердің өзгеруімен тікелей байланысы жоқ, бірақ олар қызмет көрсету сапасының төмендеуін қабылдауды нашарлатады. Шуылдардың жиілігі қосылған дауыс опциясына және платформаға кіру үшін пайдаланылатын құрылғыға байланысты айтарлықтай өзгереді.

Платформа бойынша өнімділік нұсқалары

Практикалық сынақтар дыбыс тұрақтылығының пайдалану контекстіне және аппараттық құрал ортасына қатты тәуелді екенін көрсетеді. Comandos Қысқа жауаптарды қажет ететін жылдам және объективті, тұтынушылар хабарлаған ырғақ аралықтарын немесе екпін араласуларын сирек тудырады.

Көмекшінің Android Auto сияқты автомобиль жүйелерімен интеграциясы өте жоғары мінез-құлықты көрсетеді. Nesses орталарында таңдалған дауыстардың бастапқы сипаттамалары ұзақ өңдеу уақытын қажет ететін өзара әрекеттесулерде де тиімдірек сақталады.

Өнімділіктегі бұл айырмашылық мобильді қолданбаның ресурстарын басқару дыбысты көрсетуге әсер етуі мүмкін екенін көрсетеді. Смартфондардағы деректерді қысу немесе жадты бөлу модельдің дауыс дәлдігін сақтау қабілетіне тікелей кедергі келтіретін сияқты.

Теңшеу опциялары мен реттеулер қол жетімді

Көмекшінің параметрлер тақтасы теңшеуге арналған вокалдық профильдердің әртүрлі каталогын ұсынады. Компанияның мақсаты – әрбір адамға құрылғымен әрекеттесуді табиғи және жағымды ететін тон, ырғақ және екпінді табуға мүмкіндік беру.

Профильдер неғұрлым байсалды және ресми тембрлерден жоғары дыбысты және еркін опцияларға дейін ауытқиды. Таңдау тұтынушыға таңдауға көмектесу үшін қысқаша аудио үлгісі ойнатылатын негізгі мәзір арқылы ғана жасалады.

Соңғы проблемаларды ескере отырып, көптеген пайдаланушылар сәтсіздікке бейім емес опцияны табуға тырысып, осы профильдер арасында үнемі ауысу стратегиясын қабылдады. Дегенмен, дауысты ауыстыру тек жүйе тұрақсыздығына уақытша шешім ретінде әрекет етеді.

Мәселенің түбірі бағдарламалық жасақтаманың нақты уақытта табиғи тілді өңдеу әдісіне байланысты болып қала береді. Компания серверлеріндегі үздіксіз жаңартулар таңдалған үнге қарамастан каталогта қолжетімді барлық опциялардың әрекетіне әсер етеді.

Жасанды интеллект жаңартуларының әсері

Дыбыс әрекетіндегі қажетсіз өзгерістер Google тіл үлгілерінің жаңа нұсқаларын іске асыру кезеңімен, атап айтқанда Flash Live нұсқасы сияқты жылдамдыққа бағытталған архитектураға көшумен сәйкес келеді. Бұл жаңартулардың негізгі мақсаты пайдаланушының сұрағы мен машинаның жауабы арасындағы кідіріс уақытын қысқарту болып табылады, бұл адамның диалогы мен диалогын шынайырақ етеді.

Дегенмен, жылдамдықты арттыру үшін оңтайландыру сөйлеу синтезін көрсетуде жанама әсерлерді тудырған сияқты. Жасалған мәтінді жылдам жеткізуге басымдық берген кезде, аудио жүйе деректер пакеттерін фрагменттелген түрде қабылдауы мүмкін, бұл каденцияның жоғалуын, жоғары тондардың төмендеуін және өте ұзақ абзацтар кезінде күрделі аймақтық екпіндерді сақтай алмауын түсіндіреді.

Қолжетімділік және дәйекті стандарттарға тәуелділік

Синтетикалық дауыстарды жаңғыртудағы жүйелілік эстетикалық артықшылық мәселесінен шығып, цифрлық қолжетімділік саласына тікелей әсер етеді. Indivíduos көру қабілеті бұзылған, оқуда қиындықтары бар немесе нақты неврологиялық жағдайы бар адамдар интернетті шолу, құжаттарды оқу және күнделікті істерді ұйымдастыру үшін жиі виртуалды көмекшілерге жүгінеді. Para Бұл аудитория үшін ақпаратты тиімді түсіну үшін таңдалған дауыстың үнімен, жылдамдығымен және анықтығымен танысу өте маңызды. Quando жүйе өз ырғағын кенет өзгертеді, шулар енгізеді немесе сөйлемнің ортасына екпінді өзгертеді, хабарды түсіндіруге қажетті когнитивтік жүктеме айтарлықтай артады. Essa Күтулерді бұзу пайдалы құралды ренжіту көзіне айналдырады, бұл технология компанияларының жасанды интеллект жаңартуларын көпшілікке жарияламас бұрын дыбыс тұрақтылығына бағытталған неғұрлым қатаң сынақ процедураларын енгізудің маңызды қажеттілігін көрсетеді.

Үздіксіз позициялау және бақылау

Осы уақытқа дейін бағдарламалық жасақтаманы әзірлеуші ​​осы дауыстық ауытқуларды түпкілікті түзетуге арналған уақыт кестесін егжей-тегжейлі көрсететін ресми мәлімдемелер жасаған жоқ. Технологиялық қауымдастық құрылғыларға жіберілген әрбір жаңа шағын үнсіз жаңартумен қолданба әрекетін бақылауды жалғастыруда.

Табиғи тілді өңдеудің эволюциясы

Нақты уақыттағы сөйлеу синтезінің артындағы инженерия бүгінгі таңда машиналық оқыту саласындағы ең үлкен қиындықтардың бірі болып табылады. Жүйе жасалған мәтінді түсіндіруі, контекст негізінде дұрыс интонацияны қолдануы және дыбысты лезде көрсетуі керек.

Каденс пен екпіндегі қазіргі кемшіліктерге қарамастан, тікелей сөйлесу технологиясы қарқынды дамып келеді. Ajustes дыбысты қысу және өңдеу алгоритмдерінде барлық мобильді платформалардағы реттелетін дауыстардың өнімділігін тұрақтандыру керек.

Veja Tambem em News (KK)

Жаңа Apple жүйесінің жаңартуы iPhone пайдаланушылары үшін шұғыл тапсырмаларды басқаруды оңтайландырады

Жаңа Apple жүйесінің жаңартуы iPhone пайдаланушылары үшін шұғыл тапсырмаларды басқаруды оңтайландырады

Apple компаниясы жаңа жиналмалы iPhone жасап шығарды және брендтің 20 жылдығын тойлауға арнайы шығарылым дайындайды

Apple компаниясы жаңа жиналмалы iPhone жасап шығарды және брендтің 20 жылдығын тойлауға арнайы шығарылым дайындайды

Жаңа Xiaomi 18 Pro Max смартфоны екі 200 МП камера мен соңғы буын процессорын біріктіреді

Жаңа Xiaomi 18 Pro Max смартфоны екі 200 МП камера мен соңғы буын процессорын біріктіреді

Уолт Дисней цифрлық ойындар нарығындағы үстемдікті кеңейту үшін Epic Games-ті толық сатып алуды зерттейді

Уолт Дисней цифрлық ойындар нарығындағы үстемдікті кеңейту үшін Epic Games-ті толық сатып алуды зерттейді

Xiaomi TV Stick HD 2 шығарылымы Google TV және теледидарларды түрлендіру үшін жоғары өнімділікті ұсынады

Xiaomi TV Stick HD 2 шығарылымы Google TV және теледидарларды түрлендіру үшін жоғары өнімділікті ұсынады

Жаңа жаһандық навигациялық модель Жердің магниттік полюсінің 36 км жыл сайынғы жылжуын түзетеді

Жаңа жаһандық навигациялық модель Жердің магниттік полюсінің 36 км жыл сайынғы жылжуын түзетеді

NVIDIA бета қолданбасын жаңарту RTX 50 үшін динамикалық жақтау генерациясы бар DLSS 4.5 нұсқасын ұсынады

NVIDIA бета қолданбасын жаңарту RTX 50 үшін динамикалық жақтау генерациясы бар DLSS 4.5 нұсқасын ұсынады

Nintendo Switch 2 тегін GameChat қызметін аяқтайды және сәуір айында онлайн қызметке жазылуды талап етеді

Nintendo Switch 2 тегін GameChat қызметін аяқтайды және сәуір айында онлайн қызметке жазылуды талап етеді

Актерлар Казунари Ниномия мен Элиза Икеда Маругаме Сейменнің жаңа тағамының науқанына кіріседі

Актерлар Казунари Ниномия мен Элиза Икеда Маругаме Сейменнің жаңа тағамының науқанына кіріседі

Хабар таратушы Паапа Эссиедудың жаңа Гарри Поттер сериясындағы нәсілшілдік шабуылдардан қорғауын күшейтеді

Хабар таратушы Паапа Эссиедудың жаңа Гарри Поттер сериясындағы нәсілшілдік шабуылдардан қорғауын күшейтеді

Xbox Series S үшін жоғары графикасы бар жаңа портативті PlayStation жабдығы туралы мәліметтердің ағып кетуі

Xbox Series S үшін жоғары графикасы бар жаңа портативті PlayStation жабдығы туралы мәліметтердің ағып кетуі

Жиналмалы смартфонның жаңа шығарылымы Қысқы ойындардың бәсекелестеріне алтын әрлеу әкеледі

Жиналмалы смартфонның жаңа шығарылымы Қысқы ойындардың бәсекелестеріне алтын әрлеу әкеледі