News (CA)

Apple prova la nova funció Siri per executar diverses ordres simultàniament en dispositius

Siri
Foto: Siri - sdx15 / Shutterstock.com

L’empresa tecnològica ha iniciat una fase de prova per a una nova característica del seu assistent virtual que permet executar múltiples ordres en una sola instrucció de veu. L’eina canvia la manera com els usuaris interactuen amb els dispositius de la marca, eliminant la necessitat de fer pauses entre les diferents peticions. El recurs processa frases complexes i identifica diferents accions dins d’una mateixa sol·licitud, executant-les de manera seqüencial i automàtica.

Aquesta actualització forma part d’un paquet de modernització del sistema operatiu més gran centrat en la intel·ligència artificial generativa i el processament del llenguatge natural. L’arquitectura del programari es va reestructurar per entendre el context de les converses, permetent a l’assistent mantenir la memòria de les peticions anteriors i aplicar aquesta informació en les interaccions posteriors. El canvi representa una transició d’un model d’ordres rígid a una interfície de conversa més fluida.

सिरी एप्पल
सिरी एप्पल – sdx15 / शटरस्टॉक.कॉम

Els desenvolupadors de l’empresa treballen per calibrar els algorismes per garantir que la interpretació simultània no generi conflictes d’execució. La capacitat d’encadenar tasques requereix una potència de processament superior, que dirigeix ​​la disponibilitat d’aquesta funció al maquinari més recent del fabricant. La implementació es produeix gradualment en versions de prova de sistemes operatius mòbils i informàtics.

L’actualització del sistema operatiu aporta canvis a la interfície

El redisseny de l’assistent virtual inclou un canvi visual important a la interfície gràfica dels dispositius. L’antiga icona esfèrica que apareixia a la part inferior de la pantalla s’ha substituït per una vora lluminosa que envolta tota la pantalla quan l’eina està activada. La senyalització visual Esta indica que el sistema està escoltant i processant informació, integrant-se d’una manera més orgànica amb l’ús del dispositiu sense interrompre la visualització de l’aplicació que està oberta actualment.

A més del canvi estètic, la nova interfície permet la interacció de text de manera nativa, amb només dos tocs a la part inferior de la pantalla per obrir un teclat dedicat. L’usuari pot canviar entre les ordres de veu i l’escriptura sense problemes, depenent de l’entorn en què es trobi. La vora lleugera reacciona dinàmicament al to de veu i a la complexitat del processament, proporcionant una retroalimentació visual immediata sobre l’estat de la sol·licitud en curs.

Com funcionen els comandaments en cadena a la pràctica

L’execució d’ordres en una cadena permet que una sola frase activi diferents aplicacions i funcions del sistema. L’usuari pot demanar a l’assistent que faci una foto i, en la mateixa frase, ordenar que la imatge s’enviï a un contacte concret en una aplicació de missatgeria.

El processament divideix la frase en intencions separades, activar la càmera, capturar els mitjans, obrir el missatger, localitzar el contacte i confirmar l’enviament. Todo Aquest flux es produeix en segon pla i requereix una intervenció manual mínima.

Un altre exemple pràctic consisteix a gestionar la informació personal, com ara demanar que es trobi una adreça específica esmentada en un correu electrònic i afegir-la directament a un esdeveniment del calendari. L’assistent creua dades entre l’aplicació de correu electrònic i el calendari.

La precisió d’aquestes accions simultànies depèn de la indexació semàntica del dispositiu, que organitza la informació personal de manera estructurada per a l’accés ràpid de la intel·ligència artificial.

Competència en el sector de la intel·ligència artificial

El desenvolupament d’aquestes noves capacitats respon directament als avenços presentats per empreses competidores del sector tecnològic. El mercat dels assistents virtuals ha experimentat una ràpida evolució amb la introducció de models de llenguatge a gran escala, fent que les antigues interaccions quedin obsoletes.

El fabricant busca recuperar espai en el segment de l’automatització de veu, oferint una integració profunda que les aplicacions de tercers no poden aconseguir a causa de les restriccions del sistema operatiu. L’avantatge competitiu es basa en un control complet sobre el maquinari i el programari.

L’estratègia implica no només millorar la comprensió del text i de la parla, sinó també la capacitat del sistema d’entendre el que es mostra a la pantalla de l’usuari. Esta La consciència del context de la pantalla és un important diferenciador tècnic en la competència pel mercat de la intel·ligència artificial personal.

Requisits tècnics per a la feina de l’auxiliar

L’execució de models d’idiomes avançats directament al dispositiu requereix components de maquinari específics, limitant la novetat als processadors més recents de la marca. Els xips han de contenir unitats de processament neuronal capaços de realitzar bilions d’operacions per segon, garantint que la interpretació de múltiples ordres es produeixi sense una latència notable.

El requisit de memòria RAM també és un factor determinant per al funcionament de l’eina, ja que els models d’intel·ligència artificial s’han de carregar a la memòria volàtil per accedir-hi instantàniament. Aparelhos de les generacions anteriors no rebrà la funcionalitat completa de comandaments en cadena a causa d’aquestes limitacions arquitectòniques físiques.

Les proves internes avaluen la precisió de les respostes

Els enginyers de programari realitzen riguroses bateries de proves internes per avaluar la taxa d’èxit de l’assistent quan tracten instruccions ambigües o ordres dobles formulades amb una sintaxi complexa. El procés de validació implica la simulació de milers d’escenaris quotidians, on la intel·ligència artificial necessita decidir l’ordre correcte per executar les tasques i identificar possibles errors lògics abans de completar l’acció. L’equip de desenvolupament supervisa les mètriques de rendiment, com ara el temps de resposta entre el final de la paraula de l’usuari i l’inici de la primera acció, així com la fluïdesa en la transició entre les aplicacions activades. L’objectiu central d’aquesta fase de prova és reduir a zero les instàncies en què el sistema executa només la primera meitat de l’ordre i ignora la segona, un problema comú en versions anteriors del processament del llenguatge natural. Els algorismes de calibració d’intencions s’ajusten diàriament en funció dels informes d’error generats pels dispositius de prova, de manera que la versió final ofereix una experiència coherent.

Integració amb aplicacions de tercers

L’expansió de múltiples ordres depèn de l’adopció de noves interfícies de programació d’aplicacions per part de desenvolupadors independents. El fabricant ha llançat eines específiques que permeten als creadors de programari mapejar les funcions de les seves aplicacions perquè l’assistent pugui accedir-hi i combinar-les amb accions d’altres programes instal·lats al dispositiu.

Processament avançat del llenguatge natural

El nucli tecnològic del nou assistent es basa en un motor de processament de llenguatge natural completament reescrit. El sistema Este ja no es basa en frases preprogramades o activadors específics de paraules per iniciar una acció.

La comprensió semàntica permet a l’usuari parlar col·loquialment, tartamudejar, corregir-se a mitja frase o canviar d’opinió, i el sistema encara és capaç d’extreure la intenció final i executar correctament les múltiples ordres sol·licitades.

Privadesa de les dades durant les sol·licituds

L’arquitectura del sistema prioritza el processament local de la informació, assegurant que les dades de veu i la informació personal a què s’accedeix durant diverses ordres no surtin del dispositiu. La indexació semàntica i l’execució de tasques es produeixen de manera aïllada al xip principal.

Per a les sol·licituds que requereixen una potència informàtica més gran, l’empresa ha desenvolupat una infraestructura privada de computació en núvol. Les dades que s’envien a aquests servidors es tracten sense emmagatzematge permanent i amb xifratge de punta a punta, impedint l’accés de tercers o del propi fabricant.

Ampliació de les capacitats d’automatització

La funcionalitat de comandament en cadena redueix la dependència de les aplicacions dedicades a crear rutines complexes. L’automatització ara es genera espontàniament a través de la veu, sense necessitat de configurar prèviament els fluxos de treball manuals.

Els usuaris aconsegueixen la capacitat de dictar seqüències d’accions que impliquen controlar dispositius domèstics intel·ligents, enviar missatges i reproduir mitjans en una única interacció natural.

L’evolució de l’assistent transforma el micròfon del dispositiu en la principal eina de navegació i operació del sistema, simplificant tasques que abans requerien múltiples tocs a la pantalla i navegació per diversos menús.