Noticias (ES)

Apple prueba la nueva función Siri para ejecutar múltiples comandos simultáneamente en dispositivos

Siri
Foto: Siri - sdx15 / Shutterstock.com

La compañía tecnológica ha iniciado una fase de pruebas de una nueva función de su asistente virtual que permite ejecutar múltiples comandos en una única instrucción de voz. La herramienta cambia la forma en que los usuarios interactúan con los dispositivos de la marca, eliminando la necesidad de pausas entre diferentes solicitudes. El recurso procesa oraciones complejas e identifica diferentes acciones dentro de una misma solicitud, ejecutándolas de forma secuencial y automática.

Esta actualización es parte de un paquete más amplio de modernización del sistema operativo centrado en la inteligencia artificial generativa y el procesamiento del lenguaje natural. La arquitectura del software se reestructuró para comprender el contexto de las conversaciones, permitiendo al asistente mantener la memoria de solicitudes anteriores y aplicar esta información en interacciones posteriores. El cambio representa una transición de un modelo de comando rígido a una interfaz conversacional más fluida.

सिरी एप्पल
सिरी एप्पल – sdx15 / शटरस्टॉक.कॉम

Los desarrolladores de la empresa trabajan en calibrar los algoritmos para garantizar que la interpretación simultánea no genere conflictos de ejecución. La capacidad de encadenar tareas requiere una potencia de procesamiento superior, lo que dirige la disponibilidad de esta función al hardware más reciente del fabricante. La implementación se produce de forma gradual en versiones de prueba de sistemas operativos móviles y de ordenadores.

La actualización del sistema operativo trae cambios a la interfaz

El rediseño del asistente virtual incluye un importante cambio visual en la interfaz gráfica de los dispositivos. El antiguo icono esférico que aparecía en la parte inferior de la pantalla ha sido sustituido por un borde luminoso que rodea toda la pantalla cuando se activa la herramienta. La señalización visual Esta indica que el sistema está escuchando y procesando información, integrándose de forma más orgánica con el uso del dispositivo sin interrumpir la vista de la aplicación que se encuentra actualmente abierta.

Además del cambio estético, la nueva interfaz permite la interacción de texto de forma nativa, con sólo dos toques en la parte inferior de la pantalla para abrir un teclado dedicado. El usuario puede alternar entre comandos de voz y escribir sin problemas, según el entorno en el que se encuentre. El borde luminoso reacciona dinámicamente al tono de voz y a la complejidad del procesamiento, proporcionando información visual inmediata sobre el estado de la solicitud en curso.

Cómo funcionan los comandos en cadena en la práctica

La ejecución de comandos en cadena permite que una sola frase active diferentes aplicaciones y funciones del sistema. El usuario puede pedirle al asistente que tome una foto y, en la misma frase, ordenar que la imagen se envíe a un contacto concreto en una aplicación de mensajería.

El procesamiento divide la frase en intenciones separadas, activando la cámara, capturando los medios, abriendo el mensajero, localizando el contacto y confirmando el envío. Todo Este flujo se produce en segundo plano y requiere una mínima intervención manual.

Otro ejemplo práctico implica la gestión de información personal, como solicitar encontrar una dirección específica mencionada en un correo electrónico y agregarla directamente a un evento en el calendario. El asistente cruza datos entre la aplicación de correo electrónico y el calendario.

La precisión de estas acciones simultáneas depende de la indexación semántica del dispositivo, que organiza la información personal de forma estructurada para que la inteligencia artificial pueda acceder rápidamente a ella.

Competencia en el sector de la inteligencia artificial

El desarrollo de estas nuevas capacidades responde directamente a los avances que presentan las empresas competidoras del sector tecnológico. El mercado de asistentes virtuales ha experimentado una rápida evolución con la introducción de modelos lingüísticos a gran escala, lo que ha dejado obsoletas las antiguas interacciones.

El fabricante busca recuperar espacio en el segmento de automatización de voz, ofreciendo una integración profunda que las aplicaciones de terceros no pueden lograr debido a restricciones del sistema operativo. La ventaja competitiva se basa en un control total sobre el hardware y el software.

La estrategia implica no sólo mejorar la comprensión del texto y del habla, sino también la capacidad del sistema para comprender lo que se muestra en la pantalla del usuario. Esta El conocimiento del contexto de la pantalla es un diferenciador técnico importante en la competencia por el mercado de la inteligencia artificial personal.

Requisitos técnicos para que el asistente trabaje.

La ejecución de modelos de lenguaje avanzado directamente en el dispositivo requiere componentes de hardware específicos, lo que limita la novedad a los procesadores más recientes de la marca. Los chips deben contener unidades de procesamiento neuronal capaces de realizar billones de operaciones por segundo, garantizando que la interpretación de múltiples comandos se produzca sin una latencia perceptible.

El requerimiento de memoria RAM también es un factor determinante para el funcionamiento de la herramienta, ya que los modelos de inteligencia artificial deben cargarse en una memoria volátil para un acceso instantáneo. Aparelhos de generaciones anteriores no recibirán la funcionalidad completa de comando en cadena debido a estas limitaciones arquitectónicas físicas.

Las pruebas internas evalúan la precisión de las respuestas.

Los ingenieros de software llevan a cabo rigurosas baterías de pruebas internas para evaluar la tasa de éxito del asistente cuando se enfrenta a instrucciones ambiguas o comandos dobles formulados con sintaxis compleja. El proceso de validación implica la simulación de miles de escenarios cotidianos, donde la inteligencia artificial debe decidir el orden correcto para ejecutar las tareas e identificar posibles errores lógicos antes de completar la acción. El equipo de desarrollo monitorea métricas de desempeño, como el tiempo de respuesta entre el final del discurso del usuario y el inicio de la primera acción, así como la fluidez en la transición entre las aplicaciones activadas. El objetivo central de esta fase de prueba es reducir a cero las instancias en las que el sistema ejecuta solo la primera mitad del comando e ignora la segunda, un problema común en versiones anteriores de procesamiento del lenguaje natural. La calibración de los algoritmos de intención se ajusta diariamente en función de los informes de fallos generados por los dispositivos de prueba, lo que garantiza que la versión final ofrezca una experiencia coherente.

Integración con aplicaciones de terceros

La expansión de múltiples comandos depende de la adopción de nuevas interfaces de programación de aplicaciones por parte de desarrolladores independientes. El fabricante ha lanzado herramientas específicas que permiten a los creadores de software mapear las funciones de sus aplicaciones para que el asistente pueda acceder a ellas y combinarlas con acciones de otros programas instalados en el dispositivo.

Procesamiento avanzado del lenguaje natural

El núcleo tecnológico del nuevo asistente se basa en un motor de procesamiento del lenguaje natural completamente reescrito. El sistema Este ya no depende de frases preprogramadas o activadores de palabras específicas para iniciar una acción.

La comprensión semántica permite al usuario hablar coloquialmente, tartamudear, corregirse a mitad de una frase o cambiar de opinión, y el sistema aún es capaz de extraer la intención final y ejecutar correctamente los múltiples comandos solicitados.

Privacidad de datos durante las solicitudes

La arquitectura del sistema prioriza el procesamiento local de la información, asegurando que los datos de voz y la información personal a la que se accede durante múltiples comandos no salgan del dispositivo. La indexación semántica y la ejecución de tareas ocurren de forma aislada en el chip principal.

Para solicitudes que requieren una mayor potencia informática, la empresa ha desarrollado una infraestructura de computación en la nube privada. Los datos enviados a estos servidores son tratados sin almacenamiento permanente y con cifrado de extremo a extremo, impidiendo el acceso de terceros o del propio fabricante.

Ampliando las capacidades de automatización

La funcionalidad de comando en cadena reduce la dependencia de aplicaciones dedicadas a crear rutinas complejas. La automatización ahora se genera de forma espontánea a través de la voz, sin necesidad de configurar previamente flujos de trabajo manuales.

Los usuarios obtienen la capacidad de dictar secuencias de acciones que implican controlar dispositivos domésticos inteligentes, enviar mensajes y reproducir medios en una única interacción natural.

La evolución del asistente transforma el micrófono del dispositivo en la principal herramienta de navegación y funcionamiento del sistema, simplificando tareas que antes requerían múltiples toques en la pantalla y navegación por varios menús.