Google kündigte diesen Donnerstag den Gemini 3.1 Flash Live als das bisher hochwertigste Audio- und Sprachmodell an. Die Version Essa bietet eine Reihe bedeutender Verbesserungen gegenüber Gemini Live und Search Live. Das Modell ist jetzt in der Vorschau über die Gemini Live-API auf Google AI Studio verfügbar. Ele zeichnet sich durch eine geringere Latenz im Vergleich zur Vorgängerversion und eine höhere Effektivität bei der Erkennung akustischer Nuancen wie Ton und Rhythmus aus.
Entwickler können das neue Modell sofort testen, um Anwendungen mit multimodalen Konversationen in Echtzeit zu erstellen. Der Gemini 3.1 Flash Live filtert Hintergrundgeräusche genauer und kann relevante Sprache inmitten von Umgebungsgeräuschen wie Verkehr oder Fernsehen besser erkennen. Além Darüber hinaus unterstützt das System mehr als 90 Sprachen, was die Reichweite von Live-Interaktionen erweitert.
- Verbesserte Erkennung akustischer Nuancen wie Tonhöhe und Rhythmus
- Reduzierte Latenz bei Echtzeitgesprächen
- Effektivere Filterung von Hintergrundgeräuschen und Umgebungsgeräuschen
- Unterstützen Sie über 90 Sprachen für multimodale Interaktionen
Technische Verbesserungen am Audiomodell
Das neue Modell verbessert die Möglichkeit, externe Tools während Live-Gesprächen auszulösen, erheblich. Ele ermöglicht außerdem eine bessere Nachverfolgung komplexer Anweisungen und hält den Agenten auch dann innerhalb der operativen Grenzen, wenn Gespräche unerwartete Wendungen nehmen. Essas-Änderungen führen zu zuverlässigeren und natürlicheren Reaktionen.
Auf Gemini Live für Android- und iOS-Geräte liefert Flash Live 3.1 schnellere Antworten mit weniger Pausen. Das System kann die Argumentation des Gesprächs doppelt so lange verfolgen wie zuvor. Isso ermöglicht längere Brainstorming-Sitzungen, ohne den Gedankengang zu verlieren.
Gemini Live passt die Dauer und den Ton der Antworten dynamisch an den aktuellen Kontext an. Usuários berichten von reibungsloseren Interaktionen und weniger Unterbrechungen bei der täglichen Nutzung. Die Integration mit dem neuen Modell trägt zu einem konsistenteren Gesamterlebnis bei.
Globale Expansion von Search Live
Google verwendet Gemini 3.1 Flash Live, um Search Live weltweit in über 200 Ländern zu starten. Die Erweiterung deckt alle Sprachen und Standorte ab, an denen Modo IA derzeit verfügbar ist. Die Funktion ermöglicht interaktive Gespräche mit Busca von Google, einschließlich Audio und Video bis Google Lens.
Benutzer können jetzt Konversationssuchen in Echtzeit mit größerer Genauigkeit in verschiedenen Regionen durchführen. Das System verarbeitet multimodale Abfragen in unterschiedlichen Umgebungen effizienter. Die Verfügbarkeit von Essa erweitert den Zugriff auf Sprachinformationen auf globaler Ebene.
Der Search Live profitiert direkt von Verbesserungen bei der Spracherkennung und Latenzreduzierung. Conversas wird mit der Suche natürlicher und kontextualisierter. Die Audio- und Videointegration erleichtert die Interaktion in praktischen Alltagsszenarien.

Details zur Sprach- und multimodalen Unterstützung
Die Unterstützung von mehr als 90 Sprachen ermöglicht hochwertige multimodale Konversationen in Echtzeit. Das Modell geht besser mit regionalen Unterschieden in der Aussprache und den Akzenten um. Isso macht Gemini Live für Benutzer in verschiedenen Ländern zugänglicher.
Entwickler erhalten Werkzeuge, um personalisierte Erlebnisse auf Basis des neuen Modells zu schaffen. Die API erleichtert die Integration in Anwendungen, die umfangreiche Sprachinteraktionen erfordern. Der Fokus auf geringe Latenz trägt dazu bei, dass Gespräche natürlich fließen.
Praktische Anwendungen im täglichen Gebrauch
Im Alltag reagiert der Gemini Live mit dem neuen Modell schneller auf komplexe Befehle und Fragen. Das System behält den Kontext über längere Zeiträume bei, ohne die Argumentation neu zu starten. Usuários kann Ideen während längerer Sitzungen kontinuierlich erkunden.
Die Möglichkeit, Umgebungsgeräusche herauszufiltern, verbessert die Leistung an belebten Orten oder bei Hintergrundgeräuschen. Conversas In Umgebungen wie Straßen oder Räumen mit einem Fernseher werden sie heller. Die dynamische Anpassung von Ton und Dauer der Antworten passt sich dem Interaktionsstil an.
Fortschritte bei der Integration mit externen Tools
Das verbesserte Modell löst externe Tools während Gesprächen effektiver aus. Ele folgt Systemanweisungen auch in verzweigten Dialogen konsistenter. Essa stability contributes to more predictable results in practical applications.
Entwickler und Endbenutzer profitieren von robusteren Interaktionen. Der Gemini Live wird zu einem zuverlässigeren Werkzeug für Aufgaben, die mehrere Schritte umfassen. Die Kombination aus fortschrittlichem Audio und erweiterten Argumentationsfunktionen erweitert die Einsatzmöglichkeiten.
Google investiert weiterhin in Audiomodelle, um KI-Interaktionen natürlicher zu gestalten. Die Veröffentlichung von Gemini 3.1 Flash Live stellt einen wichtigen Schritt in diese Richtung dar. Usuários von Android und iOS können die neuen Funktionen direkt in der Gemini Live-App ausprobieren.
Atualizações verwandt im Ökosystem Gemini
Die Ankündigung beinhaltet zusätzliche Verbesserungen am schwebenden Panel Gemini Live auf dem Android. Die Änderungen von Essas zielen darauf ab, den schnellen Zugriff auf Sprachfunktionen zu erleichtern. Die Reihe von Updates verstärkt das Engagement für erweiterte Konversationserlebnisse.
Search Live erreicht jetzt ein breiteres Publikum mit integrierten Audio- und Videofunktionen. Die globale Expansion demokratisiert den Zugang zu interaktiven Sprachsuchen. Usuários in verschiedenen Regionen erhalten ein leistungsfähigeres Tool für Echtzeitabfragen.
Der Gemini 3.1 Flash Live stellt eine bemerkenswerte Weiterentwicklung der Audio- und Sprachqualität der Google-Modelle dar. Verbesserungen bei Latenz, Rauschfilterung und Anleitungsverfolgung legen die Messlatte für Live-Interaktionen höher. Mit der Vorschauversion können Entwickler jetzt neue Anwendungen erkunden.