Seneste Nyheder (DA)

Apple tester ny Siri-funktion til at udføre flere stemmekommandoer samtidigt på enheder

Siri
Foto: Siri - sdx15 / Shutterstock.com

Teknologigiganten har startet testfasen af ​​en ny funktionalitet til sin virtuelle assistent, der tillader udførelse af flere kommandoer fra en enkelt stemmeinstruktion. Værktøjet ændrer den måde, brugerne interagerer med mærkets enheder på, og eliminerer behovet for at pause mellem forskellige anmodninger. Ressourcen behandler komplekse sætninger og identificerer forskellige handlinger inden for den samme anmodning, og udfører dem sekventielt og automatisk.

Denne opdatering er en del af en større pakke til modernisering af operativsystemet, der fokuserer på generativ kunstig intelligens og naturlig sprogbehandling. Softwarearkitekturen undergik en omstrukturering for at forstå konteksten af ​​samtaler, hvilket gjorde det muligt for assistenten at gemme tidligere anmodninger i hukommelsen og anvende disse oplysninger i efterfølgende interaktioner. Ændringen repræsenterer overgangen fra en rigid kommandomodel til en mere flydende samtalegrænseflade.

buh
सिरी एप्पल – sdx15 / शटरस्टॉक.कॉम

Virksomhedens udviklere arbejder på at kalibrere algoritmerne for at sikre, at simultantolkning ikke resulterer i udførelseskonflikter. Evnen til at sammenkæde opgaver kræver overlegen processorkraft, som styrer tilgængeligheden af ​​denne funktion til producentens nyeste hardware.

Implementering sker gradvist i testversioner af operativsystemer til mobile enheder og computere. Hovedformålet er at forfine semantisk forståelse før den officielle udgivelse til offentligheden.

Ny visuel grænseflade transformerer interaktion med systemet

Redesignet af den virtuelle assistent omfatter en væsentlig visuel ændring af enhedernes grafiske grænseflade. Det gamle sfæriske ikon, der dukkede op i bunden af ​​skærmen, da værktøjet blev aktiveret, er blevet erstattet af en lysende ramme, der omgiver hele skærmen. Essa visuel signalering indikerer, at systemet lytter og behandler information, integreres på en mere organisk måde med brugen af ​​enheden uden at afbryde visningen af ​​den applikation, der i øjeblikket er åben.

Ud over den æstetiske ændring tillader den nye grænseflade tekstinteraktion på en naturlig måde, med kun to tryk på bunden af ​​skærmen for at åbne et dedikeret tastatur. Brugeren kan skifte mellem stemmekommandoer og skrive problemfrit, afhængigt af det miljø, de befinder sig i. Lyskanten reagerer dynamisk på tonefald og behandlingskompleksitet, hvilket giver øjeblikkelig visuel feedback på status for den igangværende anmodning.

Udførelse af kædeopgaver i brugernes rutine

Kædet udførelse af kommandoer tillader en enkelt sætning at udløse forskellige applikationer og systemfunktioner. Brugeren kan bede assistenten om at tage et billede og i samme sætning beordre, at billedet skal sendes til en bestemt kontakt i en beskedapplikation.

Behandling deler sætningen op i separate hensigter: udløser kameraet, fanger mediet, åbner messengeren, lokaliserer kontakten og bekræfter afsendelsen. Todo Dette flow sker i baggrunden, hvilket kræver minimal manuel indgriben.

Et andet praktisk eksempel involverer håndtering af personlige oplysninger, såsom at bede om at finde en bestemt adresse nævnt i en e-mail og tilføje den direkte til en begivenhed i kalenderen. Assistenten overfører data mellem e-mail-applikationen og kalenderen selvstændigt.

Hardwarekrav til avanceret behandling

At køre avancerede sprogmodeller direkte på enheden kræver specifikke hardwarekomponenter, hvilket begrænser nyheden til mærkets seneste processorer. Chips skal indeholde neurale behandlingsenheder, der er i stand til at udføre billioner af operationer i sekundet, hvilket sikrer, at fortolkningen af ​​flere kommandoer sker uden mærkbar latens.

Kravet om RAM-hukommelse fungerer også som en afgørende faktor for værktøjets funktion, da kunstig intelligens-modeller skal indlæses i midlertidig hukommelse for øjeblikkelig adgang. Aparelhos af tidligere generationer vil ikke modtage fuld kædekommandofunktionalitet på grund af disse fysiske arkitektoniske begrænsninger.

Lokal behandling er afgørende for at opretholde den forventede responshastighed i stemmeinteraktioner. Quando brugeren dikterer en sekvens af handlinger, systemet skal afkode lyden, konvertere den til tekst, identificere hensigter og aktivere de tilsvarende programmeringsgrænseflader på brøkdele af et sekund.

Afhængigheden af ​​avanceret hardware afspejler den beregningsmæssige kompleksitet ved at håndtere ustruktureret naturligt sprog. Virksomheden har optimeret sine processorer til specifikt at håndtere disse kunstige intelligens-arbejdsbelastninger på en strømeffektiv måde.

On-premises datasikkerhed og privatlivsarkitektur

Systemarkitekturen prioriterer lokal behandling af information, hvilket sikrer, at stemmedata og personlige oplysninger, der tilgås under flere kommandoer, ikke forlader enheden. Semantisk indeksering og opgaveudførelse foregår isoleret på hovedchippen. Essa teknisk tilgang forhindrer følsom information, såsom indholdet af beskeder eller kalenderaftaler, i at blive eksponeret på eksterne servere under fortolkning af ordrer.

Til anmodninger, der kræver større computerkraft, har virksomheden udviklet en dedikeret cloud computing-infrastruktur. De data, der sendes til disse servere, behandles uden permanent lagring og med ende-til-ende-kryptering, hvilket blokerer adgang for tredjeparter eller producenten selv. Overgangen mellem lokal behandling og skyen sker usynligt for brugeren og opretholder sikkerhedsprotokoller uanset kompleksiteten af ​​den anmodede kommando.

Algoritmekalibrering og nøjagtighedstest

Softwareingeniører udfører et udtømmende batteri af interne tests for at evaluere assistentens succesrate, når de håndterer tvetydige instruktioner eller dobbeltkommandoer formuleret med kompleks syntaks. Valideringsprocessen involverer simulering af tusindvis af daglige scenarier, hvor kunstig intelligens skal bestemme den korrekte rækkefølge for at udføre opgaver og identificere mulige logiske fejl, før handlingen fuldføres. Udviklingsteamet overvåger præstationsmålinger, såsom responstiden mellem slutningen af ​​brugerens tale og begyndelsen af ​​den første handling, samt flydigheden i overgangen mellem aktiverede applikationer. Det centrale formål med denne testfase er at eliminere tilfælde, hvor systemet kun udfører den første halvdel af kommandoen og ignorerer den anden, et almindeligt problem i tidligere versioner af naturlig sprogbehandling. Kalibreringen af ​​hensigtsalgoritmer justeres dagligt baseret på nedbrudsrapporter genereret af testenheder, hvilket sikrer, at den endelige version leverer en ensartet oplevelse fri for driftsafbrydelser.

Værktøjer til uafhængige udviklere

Udvidelsen af ​​flere kommandoer afhænger af vedtagelsen af ​​nye applikationsprogrammeringsgrænseflader af uafhængige udviklere. Producenten udgav specifikke værktøjer, der giver softwareskabere mulighed for at kortlægge funktionerne i deres applikationer, hvilket gør dem tilgængelige for assistenten og i stand til at blive kombineret med handlinger fra andre programmer installeret på enheden.

Semantisk forståelse og korrektion i realtid

Det teknologiske grundlag for den nye assistent hviler på en fuldstændig omskrevet naturlig sprogbehandlingsmotor. Este-systemet er ikke længere afhængigt af forudprogrammerede sætninger eller ordspecifikke udløsere for at starte en handling. Semantisk forståelse giver brugeren mulighed for at tale i daglig tale, stamme, rette sig selv midt i sætningen eller ændre mening, og systemet kan stadig udtrække den endelige hensigt og udføre de mange anmodede kommandoer korrekt.

Essa Kognitiv fleksibilitet repræsenterer et betydeligt teknisk spring i menneske-computer-interaktion. Anteriormente, krævede en fejl i kommandoformuleringen brugeren at annullere handlingen og starte forfra. Agora, kunstig intelligens analyserer konteksten af ​​hele sætningen, før kæden af ​​handlinger startes, og identificerer, hvilken del af instruktionen, der annullerer den forrige. Denne evne til at tilpasse sig i realtid bringer interaktion med maskinen tættere på en naturlig menneskelig samtale, hvilket reducerer behovet for robotkommandoer og øger effektiviteten i brugen af ​​operativsystemets værktøjer.

Teknologisk tvist i den virtuelle assistent sektor

Udviklingen af ​​disse nye kapaciteter reagerer direkte på fremskridt præsenteret af konkurrerende virksomheder i teknologisektoren. Markedet for virtuelle assistenter har gennemgået en hurtig udvikling med introduktionen af ​​store sprogmodeller, hvilket gør gamle interaktioner forældede og tvinger en strukturel opdatering på mobilsystemer.

Producenten søger at genvinde plads i stemmeautomatiseringssegmentet ved at tilbyde dyb integration, som tredjepartsapplikationer ikke kan opnå på grund af operativsystemrestriktioner. Konkurrencefordel er baseret på fuld kontrol over hardware og software, hvilket muliggør optimering, der resulterer i hurtigere og mere præcise svar under daglig brug.