Google je ovog četvrtka najavio Gemini 3.1 Flash Live kao najkvalitetniji audio i glasovni model do sada. Essa verzija pojačava brojna značajna poboljšanja u odnosu na Gemini Live i Search Live. Model je sada dostupan u pregledu preko Gemini Live API-ja na Google AI Studio. Ele ističe se po tome što nudi manje kašnjenje u odnosu na prethodnu verziju i veću efikasnost u prepoznavanju akustičnih nijansi kao što su ton i ritam.
Programeri mogu odmah testirati novi model kako bi napravili aplikacije sa multimodalnim razgovorima u realnom vremenu. Gemini 3.1 Flash Live preciznije filtrira pozadinsku buku i može bolje razlikovati relevantan govor usred zvukova iz okoline kao što su saobraćaj ili televizija. Além Nadalje, sistem podržava više od 90 jezika, što proširuje domet interakcije uživo.
- Poboljšano prepoznavanje akustičnih nijansi poput visine tona i ritma
- Smanjeno kašnjenje u razgovorima u realnom vremenu
- Efikasnije filtriranje pozadinske buke i zvukova iz okoline
- Podržava preko 90 jezika za multimodalne interakcije
Tehnička poboljšanja audio modela
Novi model značajno poboljšava mogućnost pokretanja eksternih alata tokom razgovora uživo. Ele takođe omogućava bolje praćenje složenih uputstava, držeći agenta u operativnim granicama čak i kada razgovori poprime neočekivane promene. Essas promjene rezultiraju pouzdanijim i prirodnijim odgovorima.
Na Gemini Live za Android i iOS uređaje, Flash Live 3.1 daje brže odgovore sa manje pauza. Sistem može pratiti obrazloženje razgovora dva puta prethodnog puta. Isso omogućava duže sesije razmišljanja bez gubljenja toka misli.
Gemini Live dinamički prilagođava trajanje i ton odgovora kako bi odgovarao kontekstu trenutka. Usuários izvještava o glatkijim interakcijama i manje prekida tokom svakodnevne upotrebe. Integracija sa novim modelom doprinosi konzistentnijem ukupnom iskustvu.
Globalna ekspanzija Search Live
Google koristi Gemini 3.1 Flash Live za lansiranje Search Live globalno u preko 200 zemalja. Proširenje pokriva sve jezike i lokacije na kojima je trenutno dostupan Modo IA. Ova funkcija omogućava interaktivne razgovore sa Busca od Google, uključujući audio i video preko Google Lens.
Korisnici sada mogu obavljati konverzacijske pretrage u realnom vremenu s većom preciznošću u različitim regijama. Sistem efikasnije obrađuje multimodalne upite u različitim okruženjima. Dostupnost Essa proširuje pristup glasovnim informacijama na globalnoj razini.
Search Live ima direktne koristi od poboljšanja u prepoznavanju govora i smanjenju kašnjenja. Conversas sa pretragom postaju prirodniji i kontekstualiziraniji. Audio i video integracija olakšava interakciju u praktičnim svakodnevnim scenarijima.
Detalji o jezičnoj i multimodalnoj podršci
Podrška za više od 90 jezika omogućava visokokvalitetne multimodalne razgovore u realnom vremenu. Model se bolje nosi s regionalnim varijacijama u izgovoru i akcentima. Isso čini Gemini Live pristupačnijim za korisnike u različitim zemljama.
Programeri dobijaju alate za kreiranje personalizovanih iskustava zasnovanih na novom modelu. API olakšava integraciju u aplikacije koje zahtijevaju bogatu glasovnu interakciju. Fokus na malo kašnjenje pomaže da razgovori teče prirodno.
Praktične primjene u svakodnevnoj upotrebi
U svakodnevnom životu, Gemini Live sa novim modelom brže odgovara na složene komande i pitanja. Sistem održava kontekst duži period bez ponovnog pokretanja razmišljanja. Usuários može kontinuirano istraživati ideje tokom produženih sesija.
Mogućnost filtriranja buke iz okoline poboljšava performanse na prometnim lokacijama ili uz zvukove u pozadini. Conversas u okruženjima kao što su ulice ili sobe s televizorom postaju svjetlije. Dinamičko prilagođavanje tona i trajanja odgovora prilagođava se stilu interakcije.
Napredak u integraciji sa eksternim alatima
Poboljšani model efikasnije pokreće vanjske alate tokom razgovora. Ele prati sistemske instrukcije dosljednije čak iu dijalozima grananja. Essa stabilnost doprinosi predvidljivijim rezultatima u praktičnim aplikacijama.
Programeri i krajnji korisnici imaju koristi od snažnije interakcije. Gemini Live postaje pouzdaniji alat za zadatke koji uključuju više koraka. Kombinacija naprednog zvuka i proširenih mogućnosti zaključivanja proširuje mogućnosti korištenja.
Google nastavlja ulagati u audio modele kako bi AI interakcije učinili prirodnijim. Izdanje Gemini 3.1 Flash Live predstavlja važan korak u ovom pravcu. Usuários od Android i iOS mogu isprobati nove funkcije direktno u aplikaciji Gemini Live.
Atualizações povezan u ekosistemu Gemini
Najava uključuje dodatna poboljšanja Gemini Live plutajućeg panela na Android. Essas promjene imaju za cilj olakšati brz pristup glasovnim funkcijama. Skup ažuriranja pojačava posvećenost naprednim iskustvima razgovora.
Search Live sada doseže širu publiku sa integrisanim audio i video mogućnostima. Globalna ekspanzija demokratizuje pristup interaktivnim glasovnim pretragama. Usuários u različitim regionima dobija moćniji alat za upite u realnom vremenu.
Gemini 3.1 Flash Live označava značajnu evoluciju u kvalitetu zvuka i glasa Google modela. Poboljšanja latencije, filtriranja šuma i instrukcija koje slijede podižu ljestvicu za interakcije uživo. Preview izdanje omogućava programerima da istraže nove aplikacije sada.

