Приложение Google Meet получает синхронный голосовой перевод с помощью искусственного интеллекта на мобильных телефонах

Google Meet

Google Meet -Saitee / Shutterstock.com

Google начал выпуск нового инструмента голосового синхронного перевода для приложений Google Meet в операционных системах Android и iOS. Технология использует искусственный интеллект для обработки речи участников в режиме реального времени во время видеоконференций. В версии для веб-браузеров функция работает с прошлого года. Теперь эта функциональность доступна и на мобильных устройствах, что позволяет облегчить удаленное общение в любом месте.

В основе системы лежит модель Gemini, которая практически мгновенно доставляет слушателям переведенный звук. Это обновление направлено на устранение языковых барьеров в глобальных командах и образовательной среде. Этот инструмент выходит за рамки традиционных текстовых субтитров. Обработанный звук пытается сохранить исходные характеристики динамика, создавая более естественный и плавный разговор непосредственно через мобильный телефон или планшет.

Google Meet – Фото: Таспол Сангзее / Shutterstock.com

Как искусственный интеллект сохраняет тон голоса при звонках

Основное новшество функции заключается в возможности клонировать вокал во время прямой трансляции. Программное обеспечение не передает обычный роботизированный голос. Искусственный интеллект анализирует образец речи пользователя и генерирует синтетическую версию на целевом языке. Исходный звук остается на очень низкой громкости на заднем плане, тогда как в разговоре лидирует дубляж.

Такой технологический подход гарантирует, что эмоциональный контекст разговора не потеряется при переводе. Профессионалы, использующие платформу, способны с такой же оригинальной интенсивностью донести свои идеи. Инструмент эффективно улавливает тонкости человеческого общения.

  • Система распознает и воспроизводит моменты волнения или серьезности во время речи.
  • Синтетический голос адаптирует ритм и акцент слов в соответствии с выбранным языком.
  • Только один участник собрания должен иметь совместимый план, чтобы передать эту роль остальным.

Динамика работы требует от участника только активировать опцию и определить желаемый язык для прослушивания. Processing takes place in the Google cloud. Переведенный звук доставляется с минимальной задержкой, что позволяет проводить дебаты и презентации в непрерывном потоке без внезапных прерываний, ухудшающих понимание.

Сроки выпуска и пакеты, необходимые для работы

Внедрение новой функции в мобильные приложения происходит постепенно в течение апреля 2026 года. Корпоративные домены, настроенные для быстрого выпуска, начали получать обновление 8 апреля 2026 года. Среды с запланированным выпуском получат доступ к инструменту с 23 апреля 2026 года. Пользователям необходимо постоянно обновлять приложение в официальных магазинах своих операционных систем.

Для доступа к голосовому переводу требуется специальная подписка на экосистему Google Workspace. Компания ограничила новую функцию наиболее надежными пакетами, предназначенными для корпоративного или расширенного образовательного использования. Conventional free accounts do not have the ability to launch the vocal cloning feature.

Смотрите Также

Подходящие планы включают Business Standard, Business Plus, Enterprise Standard и Enterprise Plus. Подписчики пакетов Google AI Pro и Ultra также получают эту функциональность. В сфере образования этот инструмент является частью плана Education Plus. Если у организатора или участника есть одна из этих лицензий, все присутствующие в виртуальной комнате смогут прослушивать переводы без дополнительной оплаты.

Языки, доступные на начальном этапе и расширении системы

На первых порах техническая поддержка охватывает двунаправленные пары между английским и пятью другими языками, имеющими большое мировое распространение. Официальный список включает испанский, французский, немецкий, итальянский и португальский языки. Этот первоначальный отбор охватывает значительную часть коммерческих и академических взаимодействий, ежедневно осуществляемых на видеоплатформе.

Компания уже подтвердила, что языковая база будет расширяться в ближайшие месяцы. Предполагается, что Turk станет следующим подтвержденным дополнением к графику разработки. Инженеры-программисты работают над совершенствованием моделей искусственного интеллекта. Цель – повысить точность распознавания региональных акцентов и сложных идиоматических выражений.

Расширение языкового каталога зависит от постоянного обучения модели Gemini. Качество синхронного перевода улучшается по мере обработки системой новых лингвистических данных. Google по-прежнему сосредоточен на дублировании, учитывающем грамматические правила и культурный контекст каждого региона, поддерживаемого приложением.

Настройки конфиденциальности и активация на мобильных устройствах

Безопасность голосовых данных представляет собой приоритет в архитектуре новой функции Google Meet. Активация перевода не происходит автоматически или скрыто. Пользователю необходимо предоставить явное разрешение с помощью специальной кнопки в интерфейсе приложения. Любой участник может отозвать это разрешение в любой момент во время видеозвонка.

Чтобы включить функцию на Android или iOS, для этого требуется несколько нажатий на экран смартфона. Во время видеоконференции пользователь должен получить доступ к меню, представленному тремя точками. Затем перейдите в область настроек и найдите ключ активации голосового перевода. Интуитивно понятный интерфейс упрощает использование для людей с разным уровнем технических знаний.

Администраторы корпоративной сети имеют полный контроль над доступностью инструмента. Панель управления позволяет заблокировать или освободить ресурс для определенных групп сотрудников. Google применяет строгие протоколы безопасности, чтобы гарантировать, что обработанный звук не будет перехвачен или сохранен ненадлежащим образом во время сеансов синхронного перевода.

Смотрите Также