Ny generation af Gemma 4 kunstig intelligens anvender Apache 2.0-licens på lokale enheder

Gemma 4

Gemma 4 - Google

Teknologigiganten, der er ansvarlig for den mest brugte søgemaskine i verden, har stillet en ny familie af open source-sprogmodeller til rådighed rettet mod udviklere og forskere. Den seneste opdatering bringer værktøjer, der understøtter tekst-, lyd- og billedinput, med kontekstvinduer, der når mærket 256 tusind tokens i de mest robuste versioner. Den vigtigste differentiator i denne generation er fjernelse af tidligere kommercielle restriktioner, hvilket giver virksomheder mulighed for at bruge teknologien mere frit på deres egen hardware, fra servere til mobiltelefoner.

Ændring af retningslinjer for kommerciel brug

Vedtagelsen af ​​et nyt licensformat fjerner de barrierer, der eksisterede i tidligere versioner af værktøjet. Udviklere har nu større kontrol over behandlede data og kommercielle implementeringer, uden at det er nødvendigt at følge politikker for forbudt brug, der ensidigt kan opdateres af systemskaberen.

Denne strukturelle ændring har til formål at fremme oprettelsen af ​​nye projekter inden for programmeringsfællesskabet. Fokus på offline eksekvering forstærker strategien med at tilbyde åbne og fleksible alternativer, hvilket giver startups og store virksomheder mulighed for at integrere teknologi uden tilbagevendende omkostninger til applikationsprogrammeringsgrænseflader.

Tekniske fremskridt inden for logisk ræsonnement

De nye systemer præsenterer væsentlige forbedringer i evnen til at løse matematiske problemer og følge komplekse instruktioner. Den opdaterede arkitektur inkorporerer indbygget understøttelse af funktionskald og generering af struktureret output i specifikke dataformater, hvilket optimerer arbejdsgangen for autonome agenter.

Programmeringskodebehandlingskapaciteten er også blevet forbedret for at fungere korrekt i miljøer uden internetforbindelse. Ydelsen opnået under disse forhold er tæt på resultaterne opnået af efterretningstjenester, der udelukkende er afhængige af cloud-behandling.

Multimodal informationsbehandling

Ud over traditionel tekstfortolkning behandler den nye generation lydfiler og billeder indbygget. Talegenkendelsessystemet demonstrerer overlegen nøjagtighed sammenlignet med modeller lanceret i det foregående år, hvilket letter transskription og analyse af stemmekommandoer i realtid.

Understøttelse af visuel input giver dig mulighed for at udføre avancerede opgaver såsom optisk tegngenkendelse i scannede dokumenter. Værktøjet kan også fortolke komplekse grafer og tabeller og udtrække relevante data med et niveau af nøjagtighed, der opfylder kravene fra erhvervslivet.

Kombinationen af ​​disse forskellige inputmodaliteter åbner op for en række muligheder for at skabe interaktive applikationer. Udviklere kan strukturere løsninger, der samtidig analyserer, hvad brugeren siger, og hvad enhedens kamera fanger, og behandler alt uden at sende dataene til eksterne servere.

Størrelses- og effektivitetsvarianter

Modelfamilien er blevet opdelt i fire hovedkonfigurationer for at imødekomme forskellige hardwarebehov. De mere robuste versioner, kendt som Mixture af Experts og Dense, er rettet mod højtydende servere og professionelle arbejdsstationer, der håndterer massiv databehandling.

På den anden side var de lettere varianter specielt designet til at prioritere energieffektivitet. Esses mindre modeller er ideelle til at køre på kanten af ​​netværket, det vil sige direkte på slutbrugernes udstyr, hvilket minimerer batteriforbruget og behovet for ekstern behandling.

Den ekspertarkitekturbaserede version aktiverer kun en brøkdel af sine milliarder af parametre under inferensprocessen. Essa teknisk tilgang reducerer responsforsinkelse og energiforbrug drastisk, samtidig med at evnen til at forstå og generere tekster på mere end hundrede og fyrre forskellige sprog bevares.

De komplette filer med de neurale netværksvægte er nu frigivet til offentligheden. Profissionais fra teknologiområdet kan straks downloade materialet på anerkendte kodehostingplatforme og repositories med fokus på maskinlæring.

Optimering til mobile enheder

Udviklingen af ​​de kompakte versioner fandt sted i samarbejde med de største producenter af processorer til mobile enheder på det globale marked. Essa Teknisk samarbejde resulterede i systemer, der var i stand til at levere svar med praktisk talt nul latens i daglige opgaver, såsom simultanoversættelse og opsummering af lange tekster. Praktiske test viser, at teknologien opretholder en stabil ydeevne selv på billige udviklingstavler og enkeltkortscomputere, der er meget brugt i uddannelses- og industriprojekter.

Opretholdelse af effektivitet på tværs af forskellige hardwarekonfigurationer repræsenterer en betydelig praktisk gevinst for applikationens økosystem. Reduktion af svartid i lokal behandling er afgørende for tjenester, der kræver et højt niveau af privatliv, såsom sundheds- og finansapplikationer. Ved at behandle oplysninger direkte på brugerens enhed eliminerer teknologien de risici, der er forbundet med transmission af følsomme data over internettet, og sikrer, at personlige oplysninger forbliver beskyttet mod aflytning af tredjeparter.

Integration med udviklingsøkosystemet

Den umiddelbare tilgængelighed af værktøjer på officielle platforme letter adgangen for forskere og softwareingeniører til nye kunstig intelligens-teknologier. Modeller med højere kapacitet kan testes og implementeres gennem cloud-udviklingsstudier, mens mobiloptimerede versioner findes i dedikerede gallerier til kantbehandling. Virksomheder, der ønsker at modernisere deres interne systemer, kan integrere disse løsninger i deres lokale infrastrukturer uden at bekymre sig om at betale månedlige omkostninger for at bruge tredjepartsgrænseflader. Ydermere vil arkitekturen af ​​de lettere varianter tjene som et grundlæggende grundlag for fremtidige opdateringer til mobile operativsystemer, hvilket indikerer en klar tendens til, at generativ kunstig intelligens vil blive en standard og allestedsnærværende komponent i mobiltelefoner, der vil ramme markedet i de kommende år, og transformere den måde, brugerne interagerer med deres enheder på daglig basis.

Udvidelse af brugen af ​​åben kunstig intelligens

Ved at kombinere forbedret ydeevne med eftergivende licenser udvides rækken af ​​muligheder for teknologisektoren. Bevægelsen mod lokalt eksekverbare open source-modeller styrker udviklerens uafhængighed og fremmer skabelsen af ​​et mere mangfoldigt digitalt miljø, hvor innovation ikke udelukkende er afhængig af store cloud computing-infrastrukturer.