News (KR)

Google, Gemini Live 업데이트에서 Gemini 3.1 Flash Live 발표

Gemini
Gemini - Mehaniq/shutterstock.com

Google은 목요일에 Gemini 3.1 Flash Live를 현재까지 최고 품질의 오디오 및 음성 모델로 발표했습니다. 이번 릴리스에서는 Gemini Live 및 Search Live에 여러 가지 중요한 개선 사항이 적용되었습니다. 이제 이 모델은 Google AI Studio의 Gemini Live API를 통해 미리보기로 제공됩니다. 이전 버전에 비해 낮은 레이턴시를 제공하고 톤, 리듬 등 어쿠스틱 뉘앙스를 인식하는 데 더 뛰어난 효율성을 제공하는 것이 돋보입니다.

개발자는 새 모델을 즉시 테스트하여 실시간 다중 모드 대화를 통해 애플리케이션을 구축할 수 있습니다. Gemini 3.1 Flash Live는 배경 소음을 더 정확하게 필터링하고 교통 소리나 텔레비전과 같은 환경 소리 속에서 관련 음성을 더 잘 식별할 수 있습니다. 또한 이 시스템은 90개 이상의 언어를 지원하므로 실시간 상호 작용 범위가 확장됩니다.

  • 피치 및 리듬과 같은 음향적 뉘앙스에 대한 인식이 향상되었습니다.
  • 실시간 대화의 대기 시간 감소
  • 배경 소음 및 환경 소리를 더욱 효과적으로 필터링합니다.
  • 다중 모드 상호 작용을 위해 90개 이상의 언어 지원

오디오 모델의 기술적 개선

새로운 모델은 실시간 대화 중에 외부 도구를 실행하는 기능을 크게 향상시켰습니다. 또한 복잡한 지침에 대한 후속 조치가 향상되어 대화가 예상치 못한 방향으로 흘러가는 경우에도 에이전트를 작동 제한 내에서 유지합니다. 이러한 변화로 인해 더욱 안정적이고 자연스러운 반응이 가능해졌습니다.

Android 및 iOS 장치용 Gemini Live에서 Flash Live 3.1은 일시 중지 횟수를 줄이고 더 빠른 응답을 제공합니다. 시스템은 이전보다 두 번 대화의 추론을 따를 수 있습니다. 이를 통해 생각의 흐름을 잃지 않고 브레인스토밍 세션을 더 길게 진행할 수 있습니다.

Gemini Live는 순간의 맥락에 맞게 응답의 길이와 톤을 동적으로 조정합니다. 사용자들은 일상적인 사용 중에 상호 작용이 더 원활해지고 중단이 줄어들었다고 보고합니다. 새로운 모델과의 통합은 더욱 일관된 전반적인 경험에 기여합니다.

Search Live의 글로벌 확장

Google은 Gemini 3.1 Flash Live를 사용하여 전 세계 200개 이상의 국가에서 Search Live를 출시합니다. 확장팩에는 현재 AI 모드를 사용할 수 있는 모든 언어와 위치가 포함됩니다. 이 기능을 사용하면 Google Lens를 통한 오디오 및 비디오를 포함하여 Google 검색과 대화형 대화가 가능합니다.

이제 사용자는 다양한 지역에서 더욱 정확하게 실시간 대화 검색을 수행할 수 있습니다. 시스템은 다양한 환경에서 다중 모드 쿼리를 보다 효율적으로 처리합니다. 이 가용성은 전 세계적으로 음성 정보에 대한 액세스를 확장합니다.

Search Live는 음성 인식 및 대기 시간 감소 개선으로 직접적인 이점을 얻습니다. 검색과의 대화가 더욱 자연스럽고 상황에 맞게 표현됩니다. 오디오 및 비디오 통합은 실제적인 일상 시나리오에서 상호 작용을 촉진합니다.

Google
구글 – daily_creativity/shutterstock.com

언어 및 다중 모드 지원에 대한 세부정보

90개 이상의 언어를 지원하여 고품질의 실시간 다중 모달 대화가 가능합니다. 이 모델은 발음과 액센트의 지역적 차이를 더 잘 처리합니다. 이를 통해 다양한 국가의 사용자가 Gemini Live에 더 쉽게 접근할 수 있습니다.

개발자는 새로운 모델을 기반으로 개인화된 경험을 만들 수 있는 도구를 얻습니다. API를 사용하면 풍부한 음성 상호 작용이 필요한 애플리케이션에 쉽게 통합할 수 있습니다. 낮은 대기 시간에 초점을 맞추면 대화가 자연스럽게 흘러가는 데 도움이 됩니다.

매일 사용하는 실제 응용

일상생활에서 새로운 모델을 탑재한 Gemini Live는 복잡한 명령과 질문에 더욱 빠르게 응답합니다. 시스템은 추론을 다시 시작하지 않고도 더 오랜 기간 동안 컨텍스트를 유지합니다. 사용자는 확장된 세션 동안 지속적으로 아이디어를 탐색할 수 있습니다.

환경 소음을 필터링하는 기능은 바쁜 장소나 배경 소리에서 성능을 향상시킵니다. 거리나 TV가 있는 방 등의 환경에서 대화가 더욱 선명해집니다. 어조와 응답 지속 시간을 동적으로 조정하여 상호 작용 스타일에 맞춰 조정합니다.

외부 도구와의 통합 향상

개선된 모델은 대화 중에 외부 도구를 더욱 효과적으로 트리거합니다. 분기 대화 상자에서도 시스템 지침을 보다 일관되게 따릅니다. 이러한 안정성은 실제 응용 분야에서 보다 예측 가능한 결과를 제공하는 데 기여합니다.

개발자와 최종 사용자는 더욱 강력한 상호 작용의 이점을 누릴 수 있습니다. Gemini Live는 여러 단계가 포함된 작업을 위한 더욱 안정적인 도구가 되었습니다. 고급 오디오와 확장된 추론 기능의 결합으로 사용 가능성이 확대됩니다.

Google은 AI 상호작용을 더욱 자연스럽게 만들기 위해 오디오 모델에 계속 투자하고 있습니다. Gemini 3.1 Flash Live의 출시는 이러한 방향으로 나아가는 중요한 단계를 나타냅니다. Android 및 iOS 사용자는 Gemini Live 앱에서 직접 새로운 기능을 경험할 수 있습니다.

Gemini 생태계 관련 업데이트

이번 발표에는 Android의 Gemini Live 플로팅 패널에 대한 보완적인 개선 사항이 포함되어 있습니다. 이러한 변경 사항은 음성 기능에 대한 빠른 액세스를 촉진하는 것을 목표로 합니다. 일련의 업데이트는 고급 대화 경험에 대한 약속을 강화합니다.

Search Live는 이제 통합된 오디오 및 비디오 기능을 통해 더 많은 청중에게 다가갑니다. 글로벌 확장으로 대화형 음성 검색에 대한 액세스가 민주화되었습니다. 다양한 지역의 사용자는 실시간 쿼리를 위한 더욱 강력한 도구를 얻을 수 있습니다.

Gemini 3.1 Flash Live는 Google 모델의 오디오 및 음성 품질이 눈에 띄게 발전했습니다. 지연 시간, 노이즈 필터링 및 지침이 개선되어 실시간 상호 작용의 기준이 높아졌습니다. 미리보기 릴리스를 통해 개발자는 이제 새로운 애플리케이션을 탐색할 수 있습니다.

To Top