Aplicación Google Meet recibe traducción de voz simultánea con inteligencia artificial en celulares

Google Meet

Google Meet -Saitee / Shutterstock.com

Google ha comenzado a implementar una nueva herramienta de traducción simultánea de voz para aplicaciones Google Meet en sistemas operativos Android e iOS. La tecnología utiliza inteligencia artificial para procesar el discurso de los participantes en tiempo real durante las videoconferencias. La función ha estado operativa en la versión para navegadores web desde el año pasado. La funcionalidad Agora llega a los dispositivos móviles para facilitar la comunicación remota en cualquier lugar.

El sistema funciona con el modelo Gemini, que ofrece audio traducido casi instantáneamente a los oyentes. La actualización Essa tiene como objetivo romper las barreras del idioma en equipos globales y entornos educativos. La herramienta va más allá de los tradicionales subtítulos de texto. El audio procesado intenta mantener las características originales del hablante, generando una experiencia de conversación más natural y fluida directamente a través del celular o tableta.

Google Meet – Foto: Thaspol Sangsee / Shutterstock.com

La inteligencia artificial Como preserva el tono de voz en las llamadas

La principal innovación de la función radica en la capacidad de clonar voces durante la transmisión en vivo. El software no proporciona una voz robótica genérica. La inteligencia artificial analiza el patrón de habla del usuario y genera una versión sintética en el idioma de destino. El sonido original se mantiene a muy bajo volumen de fondo, mientras el doblaje toma protagonismo en la llamada.

El enfoque tecnológico de Essa garantiza que el contexto emocional de la conversación no se pierda en la traducción. Profissionais que utilizan la plataforma son capaces de transmitir sus ideas con la misma intensidad original. La herramienta captura las sutilezas de la comunicación humana de manera eficiente.

  • El sistema identifica y reproduce momentos de excitación o seriedad durante el habla.
  • La voz sintética adapta el ritmo y énfasis de las palabras según el idioma elegido.
  • Apenas Un miembro de la reunión debe tener el plan compatible para liberar el rol a otros.

La dinámica de funcionamiento solo requiere que el participante active la opción y defina el idioma deseado para escuchar. El procesamiento se realiza en la nube Google. El audio traducido se entrega con un retraso mínimo, lo que permite que los debates y presentaciones sigan un flujo continuo sin interrupciones repentinas que perjudiquen la comprensión.

Lanzamiento de Prazos y paquetes necesarios para el funcionamiento.

La implementación de la nueva característica en aplicaciones móviles se realizará de manera paulatina a lo largo del mes de abril de 2026. El Domínios corporativo configurado para lanzamiento rápido comenzó a recibir la actualización el 8 de abril de 2026. Los entornos Já con lanzamiento programado tendrán acceso a la herramienta a partir del 23 de abril de 2026. Los usuarios deberán mantener la aplicación actualizada en las tiendas oficiales de sus sistemas operativos.

El acceso a la traducción de voz requiere suscripciones específicas al ecosistema Google Workspace. La empresa restringió la nueva función a los paquetes más sólidos destinados al uso corporativo o educativo avanzado. Los Contas gratuitos convencionales no tienen la capacidad de iniciar la función de clonación de voz.

Los planes elegibles incluyen Business Standard, Business Plus, Enterprise Standard y Enterprise Plus. Assinantes de los paquetes AI Google, Pro y Ultra también reciben la funcionalidad. En el sector educativo, la herramienta forma parte del plan Education Plus. Si el organizador o un participante dispone de una de estas licencias, todos los presentes en la sala virtual podrán escuchar las traducciones sin coste adicional.

Idiomas disponible en fase inicial y ampliación del sistema

Neste en primer lugar, el soporte técnico cubre pares bidireccionales entre inglés y otros cinco idiomas de gran circulación global. La lista oficial incluye español, francés, alemán, italiano y portugués. La selección inicial de Essa cubre una parte importante de las interacciones comerciales y académicas que se realizan diariamente en la plataforma de video.

La empresa ya ha confirmado que la base lingüística crecerá en los próximos meses. El turco parece ser la próxima incorporación confirmada al calendario de desarrollo. El software Engenheiros trabaja para perfeccionar modelos de inteligencia artificial. El objetivo es aumentar la precisión en la detección de acentos regionales y expresiones idiomáticas complejas.

La ampliación del catálogo de idiomas depende de la formación continua del modelo Gemini. La calidad de la traducción simultánea mejora a medida que el sistema procesa nuevos datos lingüísticos. Google sigue enfocado en ofrecer doblaje que respete las reglas gramaticales y el contexto cultural de cada región admitida por la aplicación.

Configurações Privacidad y activación en dispositivos móviles

La seguridad de los datos de voz representa una prioridad en la arquitectura de la nueva función Google Meet. La activación de la traducción no se produce de forma automática ni oculta. El usuario debe otorgar permiso explícito a través del botón específico en la interfaz de la aplicación. El participante Qualquer tiene la libertad de revocar esta autorización en cualquier momento durante la videollamada.

Para Para habilitar la función en Android o iOS, el proceso requiere solo unos pocos toques en la pantalla del teléfono inteligente. El usuario deberá acceder al menú representado por tres puntos durante la videoconferencia. Luego navegue hasta el área de configuración y ubique la clave de activación de traducción de voz. La interfaz intuitiva facilita su uso para personas con diferentes niveles de conocimientos técnicos.

Administradores de redes corporativas tiene control total sobre la disponibilidad de la herramienta. El panel de gestión le permite bloquear o liberar el recurso para grupos específicos de empleados. Google aplica estrictos protocolos de seguridad para garantizar que el audio procesado no sea interceptado ni almacenado incorrectamente durante las sesiones de traducción simultánea.

Ver También