News (DA)

Apple tester ny Siri-funktion til at udføre flere kommandoer samtidigt på enheder

Siri
Foto: Siri - sdx15 / Shutterstock.com

Teknologivirksomheden har startet en testfase for en ny funktion i sin virtuelle assistent, der gør det muligt at udføre flere kommandoer i en enkelt stemmeinstruktion. Værktøjet ændrer den måde, brugerne interagerer med mærkets enheder på, og eliminerer behovet for pauser mellem forskellige anmodninger. Ressourcen behandler komplekse sætninger og identificerer forskellige handlinger inden for den samme anmodning, og udfører dem sekventielt og automatisk.

Denne opdatering er en del af en større pakke til modernisering af operativsystemet, der fokuserer på generativ kunstig intelligens og naturlig sprogbehandling. Softwarearkitekturen blev omstruktureret for at forstå konteksten af ​​samtaler, hvilket gjorde det muligt for assistenten at bevare hukommelsen om tidligere anmodninger og anvende disse oplysninger i efterfølgende interaktioner. Ændringen repræsenterer en overgang fra en rigid kommandomodel til en mere flydende samtalegrænseflade.

सिरी एप्पल
सिरी एप्पल – sdx15 / शटरस्टॉक.कॉम

Virksomhedens udviklere arbejder på at kalibrere algoritmerne for at sikre, at simultantolkning ikke genererer udførelseskonflikter. Evnen til at sammenkæde opgaver kræver overlegen processorkraft, som styrer tilgængeligheden af ​​denne funktion til producentens nyeste hardware. Implementeringen sker gradvist i testversioner af mobil- og computeroperativsystemer.

Operativsystemopdatering bringer ændringer til grænsefladen

Redesignet af den virtuelle assistent omfatter en væsentlig visuel ændring af enhedernes grafiske grænseflade. Det gamle sfæriske ikon, der dukkede op i bunden af ​​skærmen, er blevet erstattet af en lysende kant, der omgiver hele skærmen, når værktøjet aktiveres. Esta visuel signalering indikerer, at systemet lytter og behandler information, integreres på en mere organisk måde med brugen af ​​enheden uden at afbryde visningen af ​​den applikation, der i øjeblikket er åben.

Ud over den æstetiske ændring tillader den nye grænseflade tekstinteraktion indbygget, med kun to tryk på bunden af ​​skærmen for at åbne et dedikeret tastatur. Brugeren kan skifte mellem stemmekommandoer og skrive problemfrit, afhængigt af det miljø, de befinder sig i. Lyskanten reagerer dynamisk på tonefald og behandlingskompleksitet, hvilket giver øjeblikkelig visuel feedback på status for den igangværende anmodning.

Hvordan kædekommandoer fungerer i praksis

Udførelse af kommandoer i en kæde tillader en enkelt sætning at udløse forskellige applikationer og systemfunktioner. Brugeren kan bede assistenten om at tage et billede og i samme sætning beordre, at billedet skal sendes til en bestemt kontakt i en beskedapplikation.

Behandling opdeler sætningen i separate hensigter, udløser kameraet, fanger mediet, åbner messengeren, lokaliserer kontakten og bekræfter afsendelsen. Todo Dette flow opstår i baggrunden, hvilket kræver minimal manuel indgriben.

Et andet praktisk eksempel involverer håndtering af personlige oplysninger, såsom at bede om at finde en bestemt adresse nævnt i en e-mail og tilføje den direkte til en begivenhed i kalenderen. Assistenten krydser data mellem e-mail-applikationen og kalenderen.

Nøjagtigheden af ​​disse samtidige handlinger afhænger af enhedens semantiske indeksering, som organiserer personlige oplysninger på en struktureret måde for hurtig adgang med kunstig intelligens.

Konkurrence i sektoren for kunstig intelligens

Udviklingen af ​​disse nye kapaciteter reagerer direkte på fremskridt præsenteret af konkurrerende virksomheder i teknologisektoren. Markedet for virtuelle assistenter har gennemgået en hurtig udvikling med introduktionen af ​​store sprogmodeller, hvilket gør gamle interaktioner forældede.

Producenten søger at genvinde plads i stemmeautomatiseringssegmentet og tilbyder dyb integration, som tredjepartsapplikationer ikke kan opnå på grund af operativsystemrestriktioner. Konkurrencefordel er baseret på fuldstændig kontrol over hardware og software.

Strategien går ud på at forbedre tekst- og taleforståelsen, men også systemets evne til at forstå, hvad der vises på brugerens skærm. Esta Skærmkontekstbevidsthed er en vigtig teknisk differentiator i konkurrencen om markedet for personlig kunstig intelligens.

Tekniske krav til, at assistenten kan arbejde

At køre avancerede sprogmodeller direkte på enheden kræver specifikke hardwarekomponenter, hvilket begrænser nyheden til mærkets seneste processorer. Chipsene skal indeholde neurale behandlingsenheder, der er i stand til at udføre billioner af operationer i sekundet, hvilket sikrer, at fortolkningen af ​​flere kommandoer sker uden mærkbar latens.

Kravet til RAM-hukommelse er også en afgørende faktor for værktøjets drift, da kunstig intelligens-modeller skal indlæses i flygtig hukommelse for øjeblikkelig adgang. Aparelhos af tidligere generationer vil ikke modtage fuld kædekommandofunktionalitet på grund af disse fysiske arkitektoniske begrænsninger.

Interne test evaluerer besvarelsens nøjagtighed

Softwareingeniører udfører strenge batterier af interne tests for at evaluere assistentens succesrate, når de håndterer tvetydige instruktioner eller dobbeltkommandoer formuleret med kompleks syntaks. Valideringsprocessen involverer simulering af tusindvis af hverdagsscenarier, hvor kunstig intelligens skal bestemme den korrekte rækkefølge for at udføre opgaver og identificere mulige logiske fejl, før handlingen fuldføres. Udviklingsteamet overvåger præstationsmålinger, såsom responstiden mellem slutningen af ​​brugerens tale og begyndelsen af ​​den første handling, samt flydigheden i overgangen mellem de aktiverede applikationer. Det centrale formål med denne testfase er at reducere til nul de tilfælde, hvor systemet kun udfører den første halvdel af kommandoen og ignorerer den anden, et almindeligt problem i tidligere versioner af naturlig sprogbehandling. Kalibrering af hensigtsalgoritmer justeres dagligt baseret på nedbrudsrapporter genereret af testenheder, hvilket sikrer, at den endelige version leverer en ensartet oplevelse.

Integration med tredjepartsapplikationer

Udvidelsen af ​​flere kommandoer afhænger af vedtagelsen af ​​nye applikationsprogrammeringsgrænseflader af uafhængige udviklere. Producenten har udgivet specifikke værktøjer, der giver softwareskabere mulighed for at kortlægge funktionerne i deres applikationer, så assistenten kan få adgang til dem og kombinere dem med handlinger fra andre programmer installeret på enheden.

Avanceret naturlig sprogbehandling

Den teknologiske kerne i den nye assistent er baseret på en fuldstændig omskrevet naturlig sprogbehandlingsmotor. Este-systemet er ikke længere afhængigt af forudprogrammerede sætninger eller ordspecifikke udløsere for at starte en handling.

Semantisk forståelse giver brugeren mulighed for at tale i daglig tale, stamme, rette sig selv midt i sætningen eller ændre mening, og systemet er stadig i stand til at udtrække den endelige hensigt og udføre de mange anmodede kommandoer korrekt.

Databeskyttelse under anmodninger

Systemarkitekturen prioriterer lokal behandling af information, hvilket sikrer, at stemmedata og personlige oplysninger, der tilgås under flere kommandoer, ikke forlader enheden. Semantisk indeksering og opgaveudførelse foregår isoleret på hovedchippen.

Til anmodninger, der kræver større computerkraft, har virksomheden udviklet en privat cloud computing-infrastruktur. De data, der sendes til disse servere, behandles uden permanent lagring og med ende-til-ende-kryptering, hvilket forhindrer adgang for tredjeparter eller producenten selv.

Udvidelse af automatiseringsmuligheder

Kædekommandofunktionaliteten reducerer afhængigheden af ​​applikationer dedikeret til at skabe komplekse rutiner. Automatisering genereres nu spontant gennem stemme, uden at det er nødvendigt tidligere at konfigurere manuelle arbejdsgange.

Brugere får mulighed for at diktere sekvenser af handlinger, der involverer styring af smarte hjemmeenheder, afsendelse af beskeder og afspilning af medier i en enkelt naturlig interaktion.

Udviklingen af ​​assistenten forvandler enhedens mikrofon til systemets vigtigste navigations- og betjeningsværktøj, hvilket forenkler opgaver, der tidligere krævede flere tryk på skærmen og navigation gennem forskellige menuer.