News (NO)

Google kunngjør Gemini 3.1 Flash Live i Gemini Live-oppdatering

Gemini
Gemini - Mehaniq/shutterstock.com

Google kunngjorde denne torsdagen Gemini 3.1 Flash Live som den høyeste lyd- og stemmemodellen til dags dato. Essa-versjonen øker en rekke betydelige forbedringer i forhold til Gemini Live og Search Live. Modellen er nå tilgjengelig i forhåndsvisning via Gemini Live API på Google AI Studio. Ele skiller seg ut for å tilby lavere ventetid sammenlignet med forrige versjon og større effektivitet i å gjenkjenne akustiske nyanser som tone og rytme.

Utviklere kan teste den nye modellen umiddelbart for å bygge applikasjoner med sanntids, multimodale samtaler. Gemini 3.1 Flash Live filtrerer bakgrunnsstøy mer nøyaktig og kan bedre skille relevant tale blant miljølyder som trafikk eller TV. Além Videre støtter systemet mer enn 90 språk, noe som utvider rekkevidden til live interaksjoner.

  • Forbedret gjenkjennelse av akustiske nyanser som tonehøyde og rytme
  • Redusert ventetid i sanntidssamtaler
  • Mer effektiv filtrering av bakgrunnsstøy og miljølyder
  • Støtte over 90 språk for multimodale interaksjoner

Tekniske forbedringer av lydmodellen

Den nye modellen forbedrer muligheten til å utløse eksterne verktøy under direkte samtaler betydelig. Ele gir også bedre oppfølging av komplekse instruksjoner, og holder agenten innenfor operasjonelle grenser selv når samtaler tar uventede vendinger. Essas endringer resulterer i mer pålitelige og naturlige svar.

På Gemini Live for Android og iOS-enheter gir Flash Live 3.1 raskere svar med færre pauser. Systemet kan følge begrunnelsen for samtalen for to ganger forrige gang. Isso gir mulighet for lengre idédugnad uten å miste tankegangen.

Gemini Live justerer dynamisk varigheten og tonen til svarene for å passe øyeblikkets kontekst. Usuários rapporterer jevnere interaksjoner og færre avbrudd under daglig bruk. Integrasjon med den nye modellen bidrar til en mer konsistent totalopplevelse.

Global utvidelse av Search Live

Google bruker Gemini 3.1 Flash Live for å lansere Search Live globalt i over 200 land. Utvidelsen dekker alle språk og steder der Modo IA er tilgjengelig for øyeblikket. Funksjonen tillater interaktive samtaler med Busca fra Google, inkludert lyd og video gjennom Google Lens.

Brukere kan nå utføre samtalesøk i sanntid med større nøyaktighet på tvers av forskjellige regioner. Systemet behandler multimodale spørringer mer effektivt i varierte miljøer. Essa tilgjengelighet utvider tilgangen til taleinformasjon på global skala.

Search Live drar direkte nytte av forbedringer i talegjenkjenning og reduksjon av ventetid. Conversas med søket blir mer naturlig og kontekstualisert. Lyd- og videointegrasjon letter interaksjon i praktiske hverdagsscenarier.

Google
Google – daily_creativity/shutterstock.com

Detaljer om språk og multimodal støtte

Støtte for mer enn 90 språk muliggjør multimodale samtaler av høy kvalitet i sanntid. Modellen håndterer bedre regionale variasjoner i uttale og aksenter. Isso gjør Gemini Live mer tilgjengelig for brukere i forskjellige land.

Utviklere får verktøy for å skape personlige opplevelser basert på den nye modellen. API-en gjør det enkelt å integrere i applikasjoner som krever rike stemmeinteraksjoner. Fokuset på lav ventetid bidrar til å holde samtalene flytende naturlig.

Praktiske bruksområder i daglig bruk

I hverdagen svarer Gemini Live med den nye modellen raskere på komplekse kommandoer og spørsmål. Systemet opprettholder konteksten i lengre perioder uten å starte resonnementet på nytt. Usuários kan utforske ideer kontinuerlig under lengre økter.

Evnen til å filtrere ut miljøstøy forbedrer ytelsen på travle steder eller med bakgrunnslyder. Conversas i miljøer som gater eller rom med TV blir de lysere. Dynamisk justering av tone og varighet av svar tilpasser seg stilen for interaksjon.

Fremskritt i integrasjon med eksterne verktøy

Den forbedrede modellen utløser eksterne verktøy mer effektivt under samtaler. Ele følger systeminstruksjonene mer konsekvent selv i forgreningsdialoger. Essa stabilitet bidrar til mer forutsigbare resultater i praktiske applikasjoner.

Utviklere og sluttbrukere drar nytte av mer robuste interaksjoner. Gemini Live blir et mer pålitelig verktøy for oppgaver som involverer flere trinn. Kombinasjonen av avansert lyd og utvidede resonneringsmuligheter utvider bruksmulighetene.

Google fortsetter å investere i lydmodeller for å gjøre AI-interaksjoner mer naturlig. Utgivelsen av Gemini 3.1 Flash Live representerer et viktig skritt i denne retningen. Usuários av Android og iOS kan prøve de nye funksjonene direkte i Gemini Live-appen.

Atualizações relatert i økosystemet Gemini

Kunngjøringen inkluderer ytterligere forbedringer av Gemini Live flytende panel på Android. Essas endringer tar sikte på å lette rask tilgang til talefunksjoner. Settet med oppdateringer forsterker forpliktelsen til avanserte samtaleopplevelser.

Search Live når nå et bredere publikum med integrerte lyd- og videofunksjoner. Global ekspansjon demokratiserer tilgang til interaktive talesøk. Usuários i forskjellige regioner får et kraftigere verktøy for sanntidsspørringer.

Gemini 3.1 Flash Live markerer en bemerkelsesverdig utvikling i lyd- og stemmekvaliteten til Google-modellene. Forbedringer i latens, støyfiltrering og instruksjoner etterpå hever baren for live-interaksjoner. Forhåndsvisning lar utviklere utforske nye applikasjoner nå.

To Top