News (DA)

Google annoncerer Gemini 3.1 Flash Live i Gemini Live-opdatering

Gemini
Gemini - Mehaniq/shutterstock.com

Google annoncerede denne torsdag Gemini 3.1 Flash Live som den hidtil højeste lyd- og stemmemodel. Essa-versionen booster en række væsentlige forbedringer i forhold til Gemini Live og Search Live. Modellen er nu tilgængelig i preview via Gemini Live API på Google AI Studio. Ele skiller sig ud for at tilbyde lavere latenstid sammenlignet med den tidligere version og større effektivitet i genkendelse af akustiske nuancer såsom tone og rytme.

Udviklere kan teste den nye model med det samme for at bygge applikationer med multimodale samtaler i realtid. Gemini 3.1 Flash Live filtrerer baggrundsstøj mere præcist og kan bedre skelne relevant tale midt i miljølyde som trafik eller tv. Além Desuden understøtter systemet mere end 90 sprog, hvilket udvider rækkevidden af ​​live-interaktioner.

  • Forbedret genkendelse af akustiske nuancer som tonehøjde og rytme
  • Reduceret latens i realtidssamtaler
  • Mere effektiv filtrering af baggrundsstøj og miljølyde
  • Understøtter over 90 sprog til multimodale interaktioner

Tekniske forbedringer af lydmodellen

Den nye model forbedrer markant muligheden for at udløse eksterne værktøjer under live samtaler. Ele giver også bedre opfølgning på komplekse instruktioner og holder agenten inden for operationelle grænser, selv når samtaler tager uventede drejninger. Essas ændringer resulterer i mere pålidelige og naturlige svar.

På Gemini Live til Android og iOS-enheder leverer Flash Live 3.1 hurtigere svar med færre pauser. Systemet kan følge samtalens ræsonnement for to gange den foregående gang. Isso giver mulighed for længere brainstormsessioner uden at miste din tankegang.

Gemini Live justerer dynamisk varigheden og tonen af ​​svarene, så de passer til øjeblikkets kontekst. Usuários rapporterer jævnere interaktioner og færre afbrydelser under daglig brug. Integration med den nye model bidrager til en mere ensartet helhedsoplevelse.

Global udvidelse af Search Live

Google bruger Gemini 3.1 Flash Live til at lancere Search Live globalt i over 200 lande. Udvidelsen dækker alle sprog og steder, hvor Modo IA i øjeblikket er tilgængelig. Funktionen giver mulighed for interaktive samtaler med Busca fra Google, inklusive lyd og video gennem Google Lens.

Brugere kan nu udføre samtalesøgninger i realtid med større nøjagtighed på tværs af forskellige regioner. Systemet behandler multimodale forespørgsler mere effektivt i forskellige miljøer. Essa tilgængelighed udvider adgangen til stemmeinformation på globalt plan.

Search Live drager direkte fordel af forbedringer i talegenkendelse og reduktion af latens. Conversas med søgningen bliver mere naturlig og kontekstualiseret. Audio- og videointegration letter interaktion i praktiske hverdagsscenarier.

Google
Google – daily_creativity/shutterstock.com

Detaljer om sprog og multimodal support

Understøttelse af mere end 90 sprog giver mulighed for multimodale samtaler i høj kvalitet i realtid. Modellen håndterer bedre regionale variationer i udtale og accenter. Isso gør Gemini Live mere tilgængelig for brugere i forskellige lande.

Udviklere får værktøjer til at skabe personlige oplevelser baseret på den nye model. API’et gør det nemt at integrere i applikationer, der kræver omfattende stemmeinteraktioner. Fokus på lav latenstid hjælper med at holde samtaler flydende naturligt.

Praktiske anvendelser i daglig brug

I hverdagen reagerer Gemini Live med den nye model hurtigere på komplekse kommandoer og spørgsmål. Systemet bevarer konteksten i længere perioder uden at genstarte ræsonnementet. Usuários kan udforske ideer kontinuerligt under udvidede sessioner.

Evnen til at bortfiltrere støj fra omgivelserne forbedrer ydeevnen på travle steder eller med baggrundslyde. Conversas i miljøer såsom gader eller rum med et fjernsyn bliver de lysere. Dynamisk justering af tone og varighed af svar tilpasser sig interaktionsstilen.

Fremskridt i integration med eksterne værktøjer

Den forbedrede model udløser eksterne værktøjer mere effektivt under samtaler. Ele følger systeminstruktioner mere konsekvent selv i forgrenede dialoger. Essa stabilitet bidrager til mere forudsigelige resultater i praktiske applikationer.

Udviklere og slutbrugere drager fordel af mere robuste interaktioner. Gemini Live bliver et mere pålideligt værktøj til opgaver, der involverer flere trin. Kombinationen af ​​avanceret lyd og udvidede ræsonneringsmuligheder udvider brugsmulighederne.

Google fortsætter med at investere i lydmodeller for at gøre AI-interaktioner mere naturlige. Udgivelsen af ​​Gemini 3.1 Flash Live repræsenterer et vigtigt skridt i denne retning. Usuários af Android og iOS kan prøve de nye funktioner direkte i Gemini Live-appen.

Atualizações relateret i økosystemet Gemini

Annonceringen inkluderer yderligere forbedringer til Gemini Live flydende panel på Android. Essas ændringer sigter mod at lette hurtig adgang til stemmefunktioner. Sættet af opdateringer forstærker forpligtelsen til avancerede samtaleoplevelser.

Search Live når nu ud til et bredere publikum med integrerede lyd- og videofunktioner. Global ekspansion demokratiserer adgangen til interaktive stemmesøgninger. Usuários i forskellige regioner får et mere kraftfuldt værktøj til realtidsforespørgsler.

Gemini 3.1 Flash Live markerer en bemærkelsesværdig udvikling i lyd- og stemmekvaliteten for Google-modellerne. Forbedringer i latency, støjfiltrering og instruktion efter hæver barren for live-interaktioner. Preview-udgivelse giver udviklere mulighed for at udforske nye applikationer nu.

To Top