Najnowsze Wiadomości (PL)

Sztuczna inteligencja Google Gemini zaczyna wykonywać złożone polecenia w WhatsApp na Androida

Aplicativo WhatsApp
Foto: Aplicativo WhatsApp - Foto: Worawee Meepian / Shutterstock.com

Google Gemini otrzymał aktualizację umożliwiającą bezpośrednie połączenie z WhatsApp na urządzeniach wyposażonych w system operacyjny Android. Nowość zmienia dynamikę użytkowania. Nowa funkcjonalność przekształca sztuczną inteligencję w agenta zdolnego do wykonywania skomplikowanych zadań, wykraczających poza proste odpowiadanie na pytania czy dyktowanie tekstów. Funkcja umożliwia wysyłanie wiadomości, pobieranie informacji z innych aplikacji i wykonywanie poleceń w czasie rzeczywistym, bez konieczności przełączania się pomiędzy różnymi platformami na ekranie telefonu komórkowego.

Zmiana stanowi postęp w sposobie interakcji użytkowników ze smartfonami, ustanawiając płynną komunikację między różnymi usługami. Integracja pełni rolę pomostu technologicznego, umożliwiając sztucznej inteligencji dostęp do danych z narzędzi takich jak Google Keep i Google Maps w celu formułowania automatycznych przesyłek w komunikatorze Meta. Especialistas w dziedzinie technologii zwraca uwagę, że ruch ten konsoliduje przejście od starych asystentów głosowych do autonomicznych agentów zwiększających produktywność.

Configuração wymaga ręcznej aktywacji w systemie operacyjnym

Zwolnienie zasobu nie następuje automatycznie dla wszystkich użytkowników. Konfiguracja wymaga bezpośredniego dostępu do aplikacji Google Gemini zainstalowanej na smartfonie. Firma potwierdziła, że ​​nowa funkcja jest dostępna wyłącznie dla ekosystemu Android, pozostawiając właścicieli iPhone’ów poza początkowym etapem wdrażania. Internetowa wersja sztucznej inteligencji również nie obsługuje tej specyficznej funkcjonalności.

Para Aby umożliwić komunikację pomiędzy aplikacjami, właściciel urządzenia musi wykonać procedurę w menu preferencji. Proces zapewnia, że ​​użytkownik udzieli sztucznej inteligencji niezbędnych uprawnień w zakresie dostępu do treści rozmów i możliwości wysyłania wiadomości w jego imieniu. Ścieżka aktywacji przebiega według określonej kolejności ustalonej przez twórców:

  • Abrir aplikacja Google Gemini na telefonie komórkowym.
  • Acessar ikonę profilu użytkownika i przejdź do zakładki Configurações.
  • Navegar do sekcji o nazwie Personal Intelligence i wybierz Connection Apps.
  • Localizar opcję dla WhatsApp i aktywuj przycisk przełączania.

Po wykonaniu tych kroków wirtualny asystent uzyskuje od systemu autoryzację do działania w połączeniu z komunikatorem. Wymóg ręcznej aktywacji odzwierciedla politykę prywatności systemu operacyjnego, która wymaga wyraźnej zgody przed zezwoleniem oprogramowaniu stron trzecich na manipulowanie danymi komunikacji osobistej. Warstwa bezpieczeństwa Essa zapobiega wykonywaniu przez narzędzie niepożądanych działań bez wcześniejszej wiedzy administratora urządzenia.

Strukturalny Diferença w stosunku do starego Google Assistant

Działanie nowego systemu zasadniczo różni się od architektury stosowanej w tradycyjnych poleceniach głosowych. Stary Google Assistant działał w izolacji w środowisku smartfona. Poprzednie narzędzie ograniczało się do dyktowania wiadomości po tym, jak użytkownik zadzwonił do konkretnego kontaktu, korzystając z nazwy zarejestrowanej w kalendarzu. Havia poważne ograniczenie techniczne możliwości zrozumienia szerszych kontekstów lub informacji zawierających odniesienia z różnych źródeł.

Google Gemini działa w oparciu o logikę ciągłej integracji. Sztuczna inteligencja działa jako łącznik pomiędzy wieloma aplikacjami zainstalowanymi na telefonie komórkowym. Oprogramowanie może jednocześnie uzyskiwać dostęp do kalendarza, notatników i usług geolokalizacyjnych, utrzymując interfejs wiadomości w gotowości do działania. Możliwość przetwarzania równoległego Essa zamienia to narzędzie w agenta zdolnego do zarządzania przepływami pracy wymagającymi wielu kroków, konsolidując wszystko w jednym poleceniu głosowym.

Ewolucja technologiczna stojąca za tą zmianą wiąże się z wykorzystaniem wielkoskalowych modeli językowych. Algorytmy Esses przetwarzają intencje użytkownika z większą precyzją, identyfikując, które aplikacje należy uruchomić, aby zrealizować zamówienie. Rezultatem jest bardziej organiczne doświadczenie użytkownika. Maszyna przejmuje całą pracę związaną z otwieraniem, kopiowaniem, wklejaniem i zamykaniem okien, dostarczając jedynie końcowy wynik na ekran czatu.

Użycie Casos obejmuje przesyłanie danych w czasie rzeczywistym

Praktyczne zastosowanie tej technologii zmienia dynamikę codziennych zadań. W typowym scenariuszu udostępniania plików proces ręczny wymagałby od danej osoby zamknięcia WhatsApp, otwarcia Google Keep, zlokalizowania żądanej notatki, skopiowania tekstu do schowka i powrotu do komunikatora w celu wklejenia treści. Dzięki nowej aktualizacji użytkownik musi jedynie sformułować zdanie: „Odbierz mój przepis na pizzę od Google Keep i wyślij go do Mark na WhatsApp”.

Google Gemini wykonuje całą sekwencję działań w tle. Narzędzie pobiera żądany dokument, wyraźnie formatuje wiadomość tekstową i przygotowuje wysyłkę w aplikacji Meta za jednym dotknięciem potwierdzenia. Ta sama logika dotyczy udostępniania tras i lokalizacji geograficznych. Durante planując podróż, osoba fizyczna może poprosić: „Znajdź odległość od mojego domu do Daytona Beach i wyślij szczegóły mojemu znajomemu na WhatsApp”.

Po otrzymaniu tej instrukcji asystent natychmiast wysyła zapytanie do bazy danych Google Maps. System oblicza najefektywniejszą trasę, wydobywa niezbędne informacje o trasie, układa tekst w czytelny sposób i otwiera dokładnie odpowiednie okno konwersacji w komunikatorze. Zasadnicza różnica polega na przejściu od prostego konwertera mowy na tekst na agenta sztucznej inteligencji, który autonomicznie manipuluje danymi na różnych platformach.

Operação za pomocą poleceń głosowych dociera do paneli Android Auto

Integracja pomiędzy usługami rozciąga się również na środowisko motoryzacyjne poprzez system Android Auto. Kierowcy zyskują możliwość uruchomienia mikrofonu bezpośrednio na panelu multimediów pojazdu lub naciśnięcia przycisku poleceń głosowych umieszczonego na kierownicy, aby wydać naturalne instrukcje. Durante wracając z pracy kierowca może aktywować system i powiedzieć: „Wyślij wiadomość na WhatsApp do Sonal z informacją, że przyjadę za około 10 minut”.

Komputer pokładowy błyskawicznie przetwarza mowę. System potwierdza żądaną akcję za pomocą interfejsu wizualnego i dźwiękowego Android Auto i wysyła komunikat. Todo procedura odbywa się bez konieczności odrywania wzroku od drogi lub dotykania ekranu telefonu komórkowego. Utrzymanie bezpieczeństwa na drodze jest jednym z głównych założeń tego wdrożenia, eliminując potrzebę ręcznej interakcji z urządzeniem podczas jazdy samochodem.

Especialistas w zakresie bezpieczeństwa drogowego ocenia, że ​​ulepszone polecenia głosowe znacznie zmniejszają rozpraszanie uwagi za kierownicą. Zdolność Google Gemini do rozumienia złożonych zdań za pierwszym razem łagodzi frustrację typową dla starszych asystentów. Poprzednie wersje często wymagały powtarzania poleceń lub ręcznego poprawiania słów błędnie interpretowanych przez oprogramowanie.

Ekosystem Expansão obejmuje platformy innych firm

Aktywacja klucza WhatsApp w sekcji inteligencji osobistej Google Gemini przekształca asystenta z prostej nowinki technologicznej w praktyczne centrum dowodzenia na co dzień. Firma zachęca użytkowników do eksplorowania menu rozszerzeń aplikacji w celu odkrycia nowych sposobów automatyzacji rutynowych zadań. Wysyłanie wiadomości tekstowych za pomocą złożonych poleceń głosowych stanowi dopiero początkową fazę szerszego projektu łączności.

Funkcjonalne partnerstwo Além z komunikatorem Meta, Google Gemini, demonstruje rosnącą kompatybilność z innymi narzędziami opracowanymi przez strony trzecie. System oferuje już integrację z platformami do strumieniowego przesyłania dźwięku, takimi jak Spotify, umożliwiając zaawansowaną kontrolę nad odtwarzaniem muzyki i podcastów. Otwarta architektura systemu operacyjnego Android sugeruje, że w nadchodzących miesiącach nowe aplikacje prawdopodobnie zaadoptują podobne protokoły.

Konsolidacja agentów sztucznej inteligencji na urządzeniach mobilnych wskazuje na zmianę paradygmatu projektowania oprogramowania. Aplikacje nie są już odizolowanymi wyspami informacji i zaczynają działać jak tryby w połączonym ekosystemie. Google w dalszym ciągu koncentruje się na ulepszaniu możliwości Gemini w zakresie świadomości kontekstowej, mając na celu dostarczanie coraz dokładniejszych odpowiedzi i szybszych działań globalnej bazie użytkowników systemu mobilnego.