Senaste Nytt (SV)

Google lanserar Gemini Nano 4 för Android med offlinebearbetning och fokus på datasekretess

gemini
Foto: gemini - Primakov / Shutterstock.com

Teknikföretaget Google har meddelat ankomsten av Gemini Nano 4, den senaste generationen av sin artificiella intelligensmodell som utvecklats specifikt för det mobila ekosystemet. Den tekniska uppdateringen markerar en djupgående förändring i hur smartphones hanterar databehandling, och överför arbetsbelastningen från molnservrar direkt till enhetens hårdvara. Systemet kommer att integreras i AICore av Android, vilket gör att komplexa uppgifter kan utföras helt autonomt och utan behov av en internetanslutning.

Utvecklingen av denna nya arkitektur prioriterar smidighet när det gäller att svara på användarkommandon och optimera telefonens fysiska resurser. Genom att eliminera steget att skicka och ta emot datapaket via mobilnätverk eller Wi-Fi, sjunker latenstiden drastiskt, vilket ger en mycket mer flytande interaktion. Tekniken arbetar tyst bakom kulisserna i operativsystemet och hanterar allt från bildredigering till transkription av omfattande ljud.

Tvillingarna
Gemini – Mehaniq/shutterstock.com

De viktigaste innovationerna integrerade i systemets offlinedrift inkluderar:

– Leitura och inbyggd tolkning av högupplösta bildfiler och komplex grafik.

– Processamento omedelbart ljud för transkription och simultan översättning utan att använda mobildata.

– Reconhecimento Avancerad handstil, optimerad för pekskärmar och smarta pennor.

– Execução av textkommandon och automatisering av rutiner utan något beroende av externa servrar.

Förnyad arkitektur säkerställer energieffektivitet i mobila enheter

Programvarutekniken som tillämpades på Gemini Nano 4 krävde sofistikerad komprimering av språkmodellens parametrar så att den kunde fungera inom de fysiska begränsningarna för ett smarttelefonchip. Optimeringsarbetet som utfördes i samarbete med halvledartillverkare resulterade i ett system som extraherar den maximala potentialen hos samtida Unidades och Processamento Neural (NPU). Som ett resultat upptar datorseende och naturliga språkbehandlingsuppgifter en betydligt mindre del av RAM-minnet, vilket säkerställer att enhetens multitasking fortsätter att fungera utan hinder, även under beräkningsstress.

Termisk effektivitet representerar ytterligare ett grundläggande framsteg i denna version. Kontinuerlig AI-bearbetning genererar ofta överdriven värme, vilket försämrar batteritiden och minskar processorns totala prestanda. Genom att förfina hur matematiska instruktioner fördelas över chipets kärnor, förhindrar den nya modellen att telefonen överhettas under långvariga användningssessioner. Essa termisk stabilitet är avgörande för proffs som använder sin smartphone som sitt främsta verktyg för att spela in videor, redigera media eller delta i videokonferenser med AI-funktioner aktiverade samtidigt.

Multimodala möjligheter förvandlar mediainteraktion

Konceptet multimodalitet når en ny nivå med enhetens förmåga att förstå olika medieformat isolerat från world wide web. Systemet har tränats för att analysera texter, ljudfiler och visuella element på ett integrerat sätt, så att användaren kan korsreferenser information från olika källor direkt. En användare kan till exempel begära att artificiell intelligens extraherar specifik data från ett bildformaterat diagram och konverterar det till en formaterad texttabell.

Det visuella igenkänningssystemet fick uppdateringar som förbättrar läsningen av texter som infogats i täta grafiska sammanhang, såsom bruksanvisningar och tekniska tekniska diagram. Noggrannhet i att identifiera visuella element minskar felmarginalen i tillgänglighetsapplikationer, som förlitar sig på mobilkameran för att beskriva den omgivande miljön för personer med synnedsättning.

Förbättringar av handskriftsigenkänning underlättar arbetsflödet för användare som föredrar att göra snabba anteckningar med digitala pennor. Modellen kan tolka svår handstil och konvertera streck till redigerbar digital text i realtid, organisera information i produktivitetsapplikationer utan att dokumentet behöver bearbetas av en extern server för att validera tecknen.

Lokal bearbetning sätter ny standard för cybersäkerhet

Att underhålla data på telefonens egen hårdvara representerar lanseringens största konkurrensfördel när det gäller informationssäkerhet. Bearbetning på enheten säkerställer att känslig information, såsom konfidentiella företagsrapporter, lösenord som skrivits in i bilder eller privata ljudkonversationer, inte flödar genom tredje parts datacenter. Esta Decentraliserad arkitektur eliminerar risken för dataavlyssning under nätverkstrafik.

Tillvägagångssättet uppfyller ett allt strängare krav från företag och regeringar när det gäller efterlevnad av personuppgiftslagar. Genom att hålla analysflödet begränsat till enheten minskar tillverkaren riskerna förknippade med storskaliga läckor som ofta påverkar molnservrar. Slutanvändaren har absolut kontroll över livscykeln för den information som genereras.

Hanteringen av dessa behörigheter görs genom AICore-systemet, som fungerar som ett digitalt kassaskåp inom Android. Ele isolerar grundmodellerna för artificiell intelligens från resten av applikationerna installerade på mobiltelefonen. En applikation från tredje part kan bara komma åt AI-resurser om den har uttrycklig auktorisation från operativsystemet och enhetsägaren.

Denna arkitektoniska barriär förhindrar skadlig programvara eller skadliga appar från att använda telefonens processorkraft för att extrahera data i bakgrunden. Säkerhetsinfrastrukturen har utformats så att artificiell intelligens fungerar som ett aktivt skyddsverktyg och identifierar avvikande beteendemönster vid användning av enheten utan att utsätta användarens rutin för extern analys.

Betydande framsteg inom logik och komplexa matematiska beräkningar

Gemini Nano 4 introducerar ett kvalitetssprång i förmågan att logiskt resonera och utföra villkorliga uttalanden under användarinteraktion. Modellen kan nu bearbeta kedjekommandon på ett mycket sammanhängande sätt och leverera korrekta resultat i dialoger som kräver att man behåller historiska sammanhang eller analyserar flera variabler samtidigt. Essa Teknisk utveckling uppfattas tydligt i användningen av virtuella assistenter, som börjar utföra komplexa sekventiella uppgifter utan att förlora tråden i den ursprungliga begäran. Além Dessutom har noggrannheten i uppgifter som involverar beräkningar och matematisk logik omkalibrerats för att undvika hallucinationer och fel som är vanliga i tidigare versioner. Systemet visar överlägsen prestanda när de svarar på frågor som kräver numerisk noggrannhet, och blir ett pålitligt konsultationsverktyg för studenter, forskare och yrkesverksamma inom finanssektorn som behöver snabba och säkra kontroller direkt i handflatan, med samma tillförlitlighet som webbaserade system.

Implementering på premium smartphones och ekosystemexpansion

Den officiella debuten av tekniken kommer att äga rum i nästa lanseringar av smartphones i flaggskeppskategorin, som har hårdvara som är tillräckligt robust för att stödja den nya arkitekturen. Integration kommer att ske automatiskt på enheter som uppfyller de minimikrav för RAM-minne och neural bearbetningskapacitet som krävs av operativsystemstillverkaren.

Expansionsstrategin förutser att tekniken kommer att gå utanför mobiltelefonernas gränser och påverka utvecklingen av högpresterande surfplattor och underhållningssystem för bilar. Enandet av intelligent bearbetning syftar till att skapa ett ekosystem där digital assistans är konstant och oberoende av kvaliteten på internetsignalen som finns tillgänglig på platsen.

Hårdvaruoptimering och svarsgenereringshastighet

Preliminära prestandatester indikerar att tokengenereringshastigheten har ökat avsevärt jämfört med den tidigare generationen av modellen. Essa Snabbhet i att formulera svar är det som säkerställer att röstinteraktion känns som en naturlig konversation, vilket eliminerar de tekniska förseningar som tidigare frustrerade användare av offline virtuella assistenter.

Företaget investerade i utvecklingen av avancerade kvantiseringsalgoritmer. Esses algoritmer minskar storleken på filerna som behövs för att installera den artificiella intelligensmodellen på enheten, vilket bevarar noggrannheten i svaren. Resultatet är ett lätt, snabbt system som inte äventyrar smarttelefonens interna lagringsutrymme.

Utvecklarverktyg ökar skapandet av appar

Tillgången till nya API:er kommer att tillåta oberoende utvecklare att skapa innovativa applikationer med hjälp av motorn Gemini Nano 4 utan att stå för de höga kostnaderna för att underhålla molnservrar. Essa Teknologisk öppenhet bör driva fram framväxten av en ny generation av utbildningsverktyg, professionell redigeringsprogram och tillgänglighetsfunktioner som körs helt på enheten, vilket demokratiserar tillgången till banbrytande teknologier på marknaden för mobila applikationer.