Google lanserer Gemini-oppdatering med sprang i logikk og etablering av autonome visuelle systemer

    Categories: News (NO)
Gemini

Gemini - Mehaniq/shutterstock.com

Google DeepMind-divisjonen offentliggjorde denne torsdagen (19) ankomsten av en ny iterasjon for hovedfamilien av kunstig intelligens-modeller. Oppdateringen, kalt Gemini 3.1 Pro, ble utviklet med et prioritert fokus på å utvide komplekse resonneringsevner, og lovet å overvinne begrensningene til tidligere versjoner i oppgaver som krever datasyntese og avansert logikk.

Lanseringen skjer på et strategisk tidspunkt for teknologisektoren, hvor enkel tekstgenerering viker for etterspørselen etter agenter som er i stand til å utføre komplette arbeidsflyter. Det nye verktøyet er nå tilgjengelig i forhåndsvisningsfasen for utviklere og avanserte planabonnenter, og introduserer betydelige forbedringer i multimodal prosessering som spenner fra programmeringskoder til video- og lydtolkning.

Gemini Inteligência Artificial – Ju Jae-young/ Shutterstock.com

Eksperter påpeker at forskjellen i denne versjonen ligger i dens optimaliserte arkitektur for å løse nye problemer, og beveger seg bort fra den eksklusive avhengigheten av mønstre som er lagret under trening. Teknologien ble designet for å betjene både sluttbrukere, gjennom selskapets proprietære applikasjon, og bedriftsmiljøer som krever robust automatisering via API.

Interne valideringstester viste at modellen kan opprettholde sammenheng i lange tankekjeder, en vesentlig egenskap for utvikling av funksjonelle autonome agenter. Den umiddelbare tilgjengeligheten tar sikte på å akselerere integreringen av disse egenskapene i tredjepartsprodukter og selskapets skyplattformer.

Ytelseshopp i logikktester

Den viktigste beregningen som ble presentert under kunngjøringen, refererer til ytelse på ARC-AGI-2 benchmark, en streng test designet for å evaluere en AIs evne til å løse tidligere usynlige logiske mønstre. Gemini 3.1 Pro oppnådde en poengsum på 77,1 % i denne forbindelse, et resultat som representerer mer enn det dobbelte av ytelsen oppnådd av forgjengeren,

I tillegg til utviklingen innen abstrakt logikk, ble modellen utsatt for direkte komparative evalueringer med andre banebrytende teknologier tilgjengelig på markedet. I testen kjent som “Humanity’s Last Exam” oppnådde den nye versjonen 44,4 % suksess, og overgikk konkurrerende løsninger utviklet av

Denne konsistensen i logisk resonnement gjør at verktøyet kan brukes i situasjoner der enkel informasjonsinnhenting ikke er nok. Fokuset for oppdateringen er å sikre at systemet kan navigere i mangefasetterte problemer uten å miste kontekst eller hallusinerende svar, noe som hever standarden for pålitelighet for profesjonell og akademisk bruk.

Autonomi i navigasjon og virtuelle agenter

Muligheten til å operere som en autonom agent har blitt kraftig utvidet i denne oppdateringen, med imponerende resultater i benchmarks som simulerer ekte profesjonelle aktiviteter. I APEX-Agents-testen, som måler effektivitet i oppgaver med lang horisont, nådde modellen 33,5 %-merket, noe som indikerer en overlegen evne til å håndtere mål som krever flere trinn for å fullføres.

Et annet høydepunkt var ytelsen i BrowseComp, en vurdering fokusert på agentisk internettsøk kombinert med bruk av programmeringsverktøy som Python. Gemini 3.1 Pro oppnådde 85,9 % effektivitet, og demonstrerte evnen til å søke, filtrere og trekke ut relevant informasjon fra nettet autonomt, og integrere disse dataene direkte i arbeidsflyter.

For å illustrere de forbedrede egenskapene til det nye systemet, fremhevet selskapet tre grunnleggende pilarer som støtter driften av agenter i denne versjonen:

  • Evne til å opprettholde fokus på komplekse mål gjennom omfattende utførelse, uten å avvike fra formålet.
  • Jevn integrasjon mellom nettsøk og kodekjøring for sanntidsdatavalidering.
  • Prioritering av arbeidsflyter som krever koordinert bruk av flere digitale verktøy samtidig.

Lage visuelle systemer og koding

Modellens allsidighet strekker seg til syntese av komplekse visuelle systemer fra enkle tekstkommandoer. Durante tekniske demonstrasjoner, kunstig intelligens var i stand til å generere animasjoner i SVG-format som er skalerbare og lette, og tilbyr et effektivt alternativ til tradisjonelle videoformater for nettgrensesnitt og mobilapplikasjoner.

Et av de praktiske eksemplene som ble vist var å sette opp et sanntids telemetri-dashbord. Modellen behandlet offentlige APIer og rådata for å bygge, fra bunnen av, et funksjonelt grensesnitt som visualiserer banen til Estação Espacial Internacional. Prosessen innebar alt fra å tolke inndataene til å kode det endelige grafiske grensesnittet.

Innenfor kreativ tolkning transformerte systemet klassiske litterære beskrivelser til moderne digitale produkter. Ved å behandle utdrag fra “The Morro of the Ventos Uivantes”, fanget AI den narrative atmosfæren i boken og designet et moderne porteføljenettsted, og oversatte abstrakte og kunstneriske konsepter til kjørbar kode og funksjonell design.

Verktøyet demonstrerte også kompetanse i å skape interaktive opplevelser i tre dimensjoner. Foi presenterte en simulering der en flokk virtuelle fugler reagerte dynamisk på sporingen av brukerens hender, og beviste modellens evne til å integrere datasyn med kompleks animasjonslogikk.

Detaljer om bedriftstilgang og integrasjon

Distribusjonen av Gemini 3.1 Pro følger en forskjøvet modell, og prioriterer utviklere og bedriftskunder på dette første stadiet. Versjonen er tilgjengelig gjennom plattformer som AI Studio og Vertex AI, slik at bedrifter kan teste teknologien i sine egne miljøer og tilpasse produktene sine til å bruke den nye resonneringsmotoren.

For individuelle brukere ble tilgang gitt til abonnenter av Google AI Pro og Ultra planene, som har økte bruksgrenser. Verktøyet ble også integrert med NotebookLM, og forbedret dokumentsyntese og innsiktsgenereringsfunksjoner for betalende brukere som bruker plattformen til forskning og studier.

Et relevant teknisk poeng er vedlikeholdet av kontekstvinduet på 1 million tokener, en funksjon som er arvet fra tidligere generasjoner av serie 3.