Gemini Live는 최근 업데이트에서 음성을 변경하고 케이던스를 변경합니다.
Gemini Live 사용자는 Google 인공 지능 도우미의 음성 옵션 변경 사항을 확인했습니다. 변경 사항에는 음성 억양, 톤, 심지어 실시간 상호 작용 중 지역 악센트 혼합까지의 변화가 포함됩니다. 이러한 변경 사항은 최신 Flash Live 버전 3.1과 같은 템플릿 업데이트 후에 자주 발생하며 개인화된 대화 경험에 영향을 미칩니다.
많은 보고서에 따르면 라이브 기능을 사용할 때 앱의 음성 미리보기가 실제 사운드와 일치하지 않는 것으로 나타났습니다. 영국 여성 억양을 재현한 카펠라 옵션은 초기 출시 이후 더욱 확연한 변화를 보여준다. 다른 지역의 목소리도 비슷한 일관성 문제를 나타냅니다.
목소리의 억양과 톤의 변화
음성 케이던스의 변화는 Gemini Live에서 다양한 음성 옵션을 사용하는 사용자들 사이에서 가장 일반적인 불만 사항 중 하나입니다. 다양한 설정에서 음성 패턴이 느려지는 반면, 고음은 눈에 띄게 감소합니다. 어떤 경우에는 대화가 진행되는 동안 호주식 억양과 좀 더 중립적인 미국식 억양 사이에서 응답이 번갈아 나옵니다.
이러한 조정은 애플리케이션을 재설정한 후 하이브리드 버전으로 전환되기 전에 선택한 악센트가 짧은 기간 동안 유지될 때 점진적으로 발생합니다. 상호 작용의 일관성을 기대하는 사람들에게는 경험이 불편할 수 있습니다. 대화가 긴 사용자는 이러한 전환을 더 자주 알아차립니다.
리소스의 미리보기와 실제 사용 비교
Gemini Live 설정에서 사용할 수 있는 오디오 미리보기는 활성 채팅 세션에서 얻은 결과와 종종 다릅니다. 이러한 차이는 특히 시간이 지남에 따라 원래의 특성을 잃는 개인화된 음성에 영향을 미칩니다. 최근 몇 달 동안 축적된 보고서는 사용 가능한 여러 옵션이 점진적으로 악화되고 있음을 지적합니다.
- 느린 케이던스는 자연스러운 반응 흐름에 영향을 미칩니다.
- 고음이 부드러워지면서 목소리의 개성이 달라집니다.
- 대화에서 예상치 못한 악센트 혼합이 발생합니다.
- 앱을 일시적으로 재설정하면 초기 동작이 부분적으로 복원됩니다.
이러한 관찰은 전반적인 성능을 향상시키는 것을 목표로 하지만 음성에 부작용을 일으키는 Google의 AI 모델에 대한 빈번한 업데이트의 맥락에서 이루어집니다.
Gemini Live 세션의 오디오 아티팩트
Gemini Live를 사용할 때 팝, 팝, 히스 같은 사운드 아티팩트가 산발적으로 나타납니다. 이러한 소음은 음성 변경과 직접적인 관련이 없지만 회사 지원 포럼에서 반복되는 또 다른 불만 사항을 나타냅니다. 발생은 선택한 음성 옵션에 따라 다르며 항상 동일하게 반복되지는 않습니다.
많은 사용자가 특정 테스트에서 문제를 재현할 수 있는 반면, 다른 사용자는 특정 조건에서만 아티팩트를 관찰합니다. 빠른 음성 명령이나 차량용 Android Auto에 내장된 라이브 모드를 통해 오디오 품질이 안정적으로 유지됩니다. 이러한 차이는 문제가 더 긴 대화 세션이나 특정 사용 상황에 집중되어 있음을 나타냅니다.
다양한 상호 작용 시나리오에서의 동작
Gemini Live 음성은 간단한 명령이나 간단한 음성 제어를 위해 보조자가 호출될 때 더 큰 안정성을 유지합니다. 그러나 더 깊은 대화 상호 작용 중에는 억양과 어조의 변화가 더욱 뚜렷해집니다. Android Auto를 통한 자동차 기능은 선택한 옵션의 원래 특성을 더 잘 보존합니다.
Google은 이러한 행위에 대한 문의를 받았지만 현재로서는 인식에 대한 공식 확인이나 진행 중인 수정 사항은 없습니다. 사용자는 Capella를 포함하여 사용 가능한 다양한 음성을 계속 테스트하여 시간이 지남에 따라 가장 변화가 적은 음성을 식별합니다.
사용 가능한 옵션 및 인앱 조정
Gemini Live는 영국식, 중립적인 미국식 및 기타 지역적 변형을 시뮬레이션하는 옵션과 같이 뚜렷한 악센트와 톤으로 사용자 정의 가능한 여러 가지 음성을 제공합니다. 사용자는 앱 설정에서 직접 선택 사항을 변경하여 개인 취향에 가장 적합한 설정을 찾을 수 있습니다. 목소리를 바꾸는 것이 항상 케이던스 문제를 영구적으로 해결하는 것은 아닙니다.
- 옵션에는 높거나 낮은 피치 특성을 가진 음성이 포함됩니다.
- 일부는 초기 세션에서 선택한 악센트를 더 잘 보존합니다.
- 앱을 재설정하면 예상된 동작이 일시적으로 복원될 수 있습니다.
- 템플릿 업데이트는 음성의 전반적인 성능에 영향을 미칩니다.
이러한 기능을 사용하면 더 많은 사용자 정의가 가능하지만 보고된 불일치는 개발을 담당하는 회사의 조정 필요성을 강조합니다.
시간에 따른 Gemini Live의 목소리 진화
지난 몇 달 동안 Gemini Live의 여러 음성 옵션은 말하기 속도 및 악센트 혼합과 같은 측면을 변경하는 수정을 거쳤습니다. 이러한 변화는 응답 속도 및 상황별 이해를 포함하여 AI 모델의 다른 측면의 개선과 일치합니다. 이 기능은 상호 작용을 보다 유연하게 만드는 것을 목표로 하는 업데이트를 통해 계속 발전하고 있습니다.
일상적인 작업이나 접근성을 위해 특정 음성에 의존하는 사용자는 사용성에 직접적인 영향을 미칩니다. 오디오 미리보기와 실제 실행 사이의 일관성은 장시간 대화에서 어시스턴트를 사용하는 사람들의 관심 사항으로 남아 있습니다. Google은 음성 성능에 관해 받은 피드백을 바탕으로 시스템을 지속적으로 개선하고 있습니다.
Veja Tambem em News (KR)
디지털 소매점, 은행 보너스와 기기 교환으로 갤럭시 S25 5G 스마트폰 가치 하락
Galaxy S25 Plus에 대한 대폭 할인으로 온라인 상점에서 가치가 4500 레알 미만으로 감소합니다.
Zach Cregger의 새로운 Resident Evil은 게임을 무시하고 새로운 캐릭터로 전례 없는 스토리에 중점을 둡니다.
Epic Games 플랫폼은 PC 사용자를 위해 영구적인 비용 없이 12개의 고예산 게임을 출시합니다.
PlayStation 5 Pro 가격 하락으로 디지털 소매 판매 가속화 및 글로벌 재고 제거
새로운 Apple 시스템 업데이트로 iPhone 사용자를 위한 긴급 작업 관리 최적화
Xbox Series S에 뛰어난 그래픽을 갖춘 새로운 휴대용 PlayStation의 하드웨어 세부 정보 유출
Oppo는 Hasselblad 렌즈와 강력한 배터리를 갖춘 Find X9 Ultra를 전 세계적으로 공식 출시합니다.
팀 쿡(Tim Cook)이 Apple 창립 50주년을 기념하여 새로운 iPhone 및 iPod 프로토타입을 공개했습니다.
폴더블 스마트폰의 새 버전, 동계 올림픽 참가자들에게 골드 마감 제공
Android 시스템은 스마트폰에서 오프라인 처리를 위해 기본 Gemini Nano 4 통합을 수신합니다.