Uit het lek blijkt dat mobiele telefoons van Google Pixel de dagelijkse audio van gebruikers kunnen opnemen en transcriberen

Google Pixel 11

Google Pixel 11 - Reprodução Youtube

Google Pixel-smartphones staan ​​op het punt een update te ontvangen die de manier waarop gebruikers omgaan met hun omgeving en hun eigen persoonlijke gegevens radicaal kan veranderen. Onderzoekers van het gespecialiseerde portaal 9to5Google voerden een grondige scan uit van interne bestanden van testversies van het besturingssysteem en ontdekten sporen van een ongekende tool die voorlopig Audio Memory heette. Het belangrijkste doel van deze applicatie zou zijn om het apparaat in een constante staat van alertheid te houden om de geluidsgebeurtenissen die plaatsvinden tijdens de routine van de apparaateigenaar vast te leggen, te verwerken en te organiseren.

De ontdekking vond plaats na het analyseren van coderegels die waren ingebed in de meest recente versie van Android System Intelligence, de kern die verantwoordelijk is voor het beheer van de intelligente functies van de apparaten van de zoekgigant. In tegenstelling tot traditionele voicerecorders die handmatige activering vereisen, zou het nieuwe ontwerp op de achtergrond werken, waardoor een soort auditieve tijdlijn ontstaat. Met deze akoestische database kan de gebruiker gedurende de dag verloren informatie ophalen, waardoor de telefoon een meedogenloze geheugenassistent wordt.

Google Pixel Buds – Reyanaska / Shutterstock.com

Evolutie van muzikale herkenning en omgevingsopname

De fabrikant heeft al een geconsolideerde geschiedenis met passieve luisterhulpmiddelen, maar het nieuwe voorstel tilt het concept naar een veel complexer niveau. Momenteel gebruiken eigenaren van de apparaten van het merk de Now Playing-functie, die nummers die in de omgeving worden afgespeeld volledig offline identificeert en de naam van de artiest direct op het vergrendelscherm weergeeft. De nieuw ontdekte code geeft aan dat Audio Memory deze functie zal overnemen en het Music Recognition zal noemen, maar de bruikbaarheid ervan zal uitbreiden door deze nummers te catalogiseren in een gedetailleerde geschiedenis binnen een speciale applicatie.

Hardware-experts wijzen erop dat de haalbaarheid om een ​​microfoon altijd actief te houden zonder de batterij van de mobiele telefoon snel leeg te laten lopen, te danken is aan de door het bedrijf zelf ontwikkelde Tensor-processors. Deze chips hebben kernen die uitsluitend gericht zijn op machinaal leren met laag vermogen. Dit betekent dat het apparaat urenlang naar de omgeving kan luisteren, waarbij irrelevante ruis wordt gescheiden van nuttige informatie, zonder de autonomie van de apparatuur in gevaar te brengen of een constante internetverbinding nodig te hebben voor de eerste verwerking.

Dialogen transcriberen en automatische herinneringen creëren

De meest ambitieuze technologische sprong van het project verplaatst zich echter van muzikaal entertainment naar het gebied van persoonlijke productiviteit. Fragmenten uit de programmering geven aan dat de intelligentie van het systeem zal worden getraind om menselijke spraak te herkennen en fragmenten van gesprekken te isoleren die cruciale informatie kunnen bevatten. Het idee is dat de software een informeel gesprek kan onderscheiden van een belangrijke instructie, zoals het plannen van een vergadering of het vermelden van een specifiek adres.

Om deze gegevens bruikbaar te maken, zou het besturingssysteem een ​​automatische transcriptielaag met hoge precisie toepassen. Gesproken woorden kunnen onmiddellijk worden omgezet in tekst, waardoor geschreven notities in het notitieboekje van de gebruiker worden gegenereerd of agendawaarschuwingen worden gecreëerd. Als iemand tijdens de lunch vermeldt dat hij uiterlijk vrijdag een rapport moet inleveren, begrijpt de mobiele telefoon in theorie de context en stelt voor een alarm te genereren, waardoor handmatig typen niet meer nodig is.

Hoe de nieuwe Android-systeemtool in de praktijk zou moeten werken

Hoewel de officiële aankondiging nog niet heeft plaatsgevonden, heeft reverse engineering van de applicatie de centrale pijlers onthuld van hoe de nieuwe functie zal werken in het dagelijks leven van consumenten. De codestructuur suggereert een ecosysteem dat zich richt op het automatiseren van op audio gebaseerde taken.

  • Continue monitoring van geluidsfrequenties om muziek en media te identificeren die op openbare plaatsen worden afgespeeld.
  • Onmiddellijke conversie van gesproken gesprekken naar doorzoekbare tekstblokken in de opslag van uw telefoon.
  • Extraheer contextuele gegevens, zoals datums, tijden en locaties, voor directe integratie met agenda- en productiviteitstoepassingen.
  • Lokale verwerking van audio-informatie om het massaal uploaden van onbewerkte opnames naar cloudservers te voorkomen.

Deze kenmerken tonen een duidelijke poging van de ontwikkelaar om een ​​virtuele assistent te creëren die proactief is en anticipeert op de behoeften van het individu voordat deze zelfs maar een traditioneel spraakcommando hoeft te formuleren. De unieke applicatie-interface zou dienen als controlepaneel, waar de geluidsgeschiedenis met een paar tikken op het scherm kon worden bekeken, bewerkt of verwijderd.

De privacy-uitdaging en de noodzaak van expliciete toestemming

De implementatie van technologie die het dagelijks leven kan vastleggen, roept diepgaande debatten op over informatiebeveiliging en digitale ethiek. Uit de gelekte bestanden is nog niet duidelijk of voice capture alleen zal werken tijdens telefoongesprekken of dat het face-to-face dialogen met derden zal omvatten. Het opnemen van mensen zonder hun medeweten stuit in verschillende landen op strenge wetgeving, die een aanzienlijke juridische barrière opwerpt voor de wereldwijde lancering van de functionaliteit.

Om dit obstakel te overwinnen, zal het vereisen van expliciete toestemming het centrale stukje van de puzzel zijn. Gebruikers zullen waarschijnlijk gedetailleerde installatieschermen moeten doorlopen, de gebruiksvoorwaarden moeten accepteren en onbeperkte microfoontoegang moeten autoriseren. De publieke acceptatie zal rechtstreeks afhangen van de transparantie van het bedrijf bij het bewijzen dat derden, hackers of zelfs overheidsinstanties geen toegang zullen hebben tot deze intieme en continue database.

Integratie met Gemini kunstmatige intelligentie en de toekomst van het merk

De ontwikkeling van audiogeheugen vindt niet op zichzelf plaats, maar eerder als onderdeel van een bredere strategie waarbij kunstmatige intelligentie van Gemini betrokken is. Het taalmodel van het bedrijf beschikt al over geavanceerde geheugenmogelijkheden, waarbij gebruik wordt gemaakt van zoekgeschiedenis, uitgewisselde e-mails en opgeslagen foto’s om zeer gepersonaliseerde antwoorden te leveren. Door de audiodimensie aan dit profiel toe te voegen, ontstaat een digitale assistent met een vrijwel volledig inzicht in het leven van de gebruiker.

Tot op heden blijft de tool opgesloten in onderzoeks- en ontwikkelingslaboratoria, zonder dat wordt voorspeld dat deze de consumentenmarkt zal bereiken. Als het bestuur besluit om verder te gaan met de uitrol, verwacht de tech-industrie de introductie van extreem robuuste privacydashboards. De bescherming van deze gevoelige gegevens zal de huidige normen moeten overtreffen en ervoor zorgen dat het gemak van een onfeilbaar digitaal geheugen niet ten koste gaat van de fundamentele privacy van degenen die hun smartphones in hun zak dragen.

Zie Ook