News (SV)

Google tillkännager Gemini 3.1 Flash Live i Gemini Live-uppdatering

Gemini
Gemini - Mehaniq/shutterstock.com

Google tillkännagav i torsdags Gemini 3.1 Flash Live som den högsta ljud- och röstmodellen hittills. Essa-versionen ökar ett antal betydande förbättringar jämfört med Gemini Live och Search Live. Modellen är nu tillgänglig i förhandsvisning via Gemini Live API på Google AI Studio. Ele utmärker sig för att erbjuda lägre latens jämfört med den tidigare versionen och större effektivitet när det gäller att känna igen akustiska nyanser som ton och rytm.

Utvecklare kan testa den nya modellen omedelbart för att bygga applikationer med multimodala samtal i realtid. Gemini 3.1 Flash Live filtrerar bakgrundsljud mer exakt och kan bättre urskilja relevant tal bland miljöljud som trafik eller tv. Além Dessutom stöder systemet mer än 90 språk, vilket utökar räckvidden för live-interaktioner.

  • Förbättrad igenkänning av akustiska nyanser som tonhöjd och rytm
  • Minskad latens i realtidskonversationer
  • Effektivare filtrering av bakgrundsljud och miljöljud
  • Stöd över 90 språk för multimodala interaktioner

Tekniska förbättringar av ljudmodellen

Den nya modellen förbättrar avsevärt möjligheten att trigga externa verktyg under livekonversationer. Ele ger också bättre uppföljning av komplexa instruktioner, och håller agenten inom operativa gränser även när konversationer tar oväntade vändningar. Essas förändringar resulterar i mer tillförlitliga och naturliga svar.

På Gemini Live för Android och iOS-enheter ger Flash Live 3.1 snabbare svar med färre pauser. Systemet kan följa samtalets resonemang för två gånger föregående gång. Isso tillåter längre brainstormingsessioner utan att tappa tankarna.

Gemini Live justerar dynamiskt varaktigheten och tonen för svaren för att passa ögonblickets kontext. Usuários rapporterar smidigare interaktioner och färre avbrott under daglig användning. Integration med den nya modellen bidrar till en mer konsekvent helhetsupplevelse.

Global expansion av Search Live

Google använder Gemini 3.1 Flash Live för att lansera Search Live globalt i över 200 länder. Expansionen täcker alla språk och platser där Modo IA för närvarande är tillgänglig. Funktionen möjliggör interaktiva konversationer med Busca från Google, inklusive ljud och video genom Google Lens.

Användare kan nu utföra konversationssökningar i realtid med större noggrannhet i olika regioner. Systemet bearbetar multimodala frågor mer effektivt i olika miljöer. Tillgängligheten med Essa utökar tillgången till röstinformation i global skala.

Search Live drar direkt nytta av förbättringar av taligenkänning och minskning av latens. Conversas med sökningen blir mer naturlig och kontextualiserad. Ljud- och videointegrering underlättar interaktion i praktiska vardagsscenarier.

Google
Google – daily_creativity/shutterstock.com

Detaljer om språk och multimodalt stöd

Stöd för mer än 90 språk möjliggör multimodala konversationer av hög kvalitet i realtid. Modellen hanterar bättre regionala variationer i uttal och accenter. Isso gör Gemini Live mer tillgänglig för användare i olika länder.

Utvecklare får verktyg för att skapa personliga upplevelser baserat på den nya modellen. API:et gör det enkelt att integrera i applikationer som kräver rik röstinteraktion. Fokus på låg latens hjälper till att hålla konversationer flytande naturligt.

Praktiska applikationer i dagligt bruk

I vardagen svarar Gemini Live med den nya modellen snabbare på komplexa kommandon och frågor. Systemet upprätthåller kontexten under längre perioder utan att resonemang återupptas. Usuários kan utforska idéer kontinuerligt under längre sessioner.

Möjligheten att filtrera bort omgivningsljud förbättrar prestandan på livliga platser eller med bakgrundsljud. Conversas i miljöer som gator eller rum med TV blir de ljusare. Dynamisk justering av ton och varaktighet för svar anpassar sig till interaktionsstilen.

Framsteg i integration med externa verktyg

Den förbättrade modellen triggar externa verktyg mer effektivt under samtal. Ele följer systeminstruktioner mer konsekvent även i förgreningsdialoger. Essa stabilitet bidrar till mer förutsägbara resultat i praktiska tillämpningar.

Utvecklare och slutanvändare drar nytta av mer robust interaktion. Gemini Live blir ett mer tillförlitligt verktyg för uppgifter som involverar flera steg. Kombinationen av avancerat ljud och utökade resonemangsmöjligheter utökar användningsmöjligheterna.

Google fortsätter att investera i ljudmodeller för att göra AI-interaktioner mer naturliga. Utgivningen av Gemini 3.1 Flash Live representerar ett viktigt steg i denna riktning. Usuários av Android och iOS kan prova de nya funktionerna direkt i Gemini Live-appen.

Atualizações relaterad i ekosystemet Gemini

Tillkännagivandet inkluderar ytterligare förbättringar av Gemini Live flytande panel på Android. Essas ändringar syftar till att underlätta snabb åtkomst till röstfunktioner. Uppsättningen av uppdateringar förstärker engagemanget för avancerade samtalsupplevelser.

Search Live når nu en bredare publik med integrerade ljud- och videofunktioner. Global expansion demokratiserar tillgången till interaktiva röstsökningar. Usuários i olika regioner får ett kraftfullare verktyg för realtidsfrågor.

Gemini 3.1 Flash Live markerar en anmärkningsvärd utveckling av ljud- och röstkvaliteten för Google-modellerna. Förbättringar i latens, brusfiltrering och instruktioner efter höjer ribban för liveinteraktioner. Förhandsversionen låter utvecklare utforska nya applikationer nu.

To Top