Google kündigte an diesem Dienstag (18) die Einführung des Gemini 3 an, seines bisher fortschrittlichsten Modells für künstliche Intelligenz. Da Disponível sofort in der Gemini-App und Modo AI in Pesquisa Google integriert ist, verspricht die neue Version prägnantere Antworten, bessere Programmierbarkeit und interaktive Erlebnisse durch generative Schnittstellen. Ziel ist es, Anwendern und Entwicklern ein vielseitiges Tool mit direkter Integration in die Produkte des Unternehmens anzubieten. Die gleichzeitige Veröffentlichung des Chatbots und der Suchmaschine markiert eine Premiere in der Strategie des Unternehmens.
Die Technologie wurde von Google DeepMind entwickelt und zeichnet sich durch Fortschritte in der Multimodalität aus, die eine präzisere Verarbeitung von Texten, Bildern, Videos und Codes ermöglicht. Segundo des Unternehmens erzielte der Gemini 3 überlegene Ergebnisse bei Denk- und Programmier-Benchmarks. Die neue Funktion ist jetzt weltweit für Benutzer über 18 Jahre in Ländern zugänglich, in denen die Anwendung unterstützt wird.
- Schlüsselinnovationen: Generatives Interfaces, multimodales Verständnis, optimierte Suche.
- Verfügbarkeit: Aplicativo Gemini, Modo AI von Pesquisa Google und Vertex AI.
- Zielgruppe: allgemeines Usuários, Entwickler und Unternehmen über Google Cloud.
Fortschritte bei generativen Schnittstellen
Gemini 3 führt generative Schnittstellen ein, die in der Lage sind, visuelle Plattformen in Echtzeit zu erstellen. Die Funktion „Visual Layout“ organisiert Antworten mit Bildern, Videos und Tabellen und simuliert so ein spezielles Website-Erlebnis.
Mit der „Dynamic View“-Funktionalität können Sie aus einfachen Eingabeaufforderungen komplette Schnittstellen, beispielsweise Webanwendungen, generieren. Das vorgestellte Um-Beispiel war die Erstellung einer interaktiven Galerie über Vincent und Gogh mit historischem Kontext und Bildern von Werken, die in Sekundenschnelle generiert wurden.

Verbessertes multimodales Verständnis
Die neue KI verarbeitet unterschiedliche Medienformate effizienter. Testes-Benchmarks zeigen eine überlegene Leistung bei Aufgaben, die Text, Bild und Video kombinieren.
Beispielsweise kann der Gemini 3 detaillierte Anmerkungen aus Bildern extrahieren oder Antworten an bestimmte Formate anpassen, beispielsweise an visuelle Präsentationen. Die Essa-Fähigkeit ist nützlich für Studenten und Berufstätige, die mit komplexen Inhalten arbeiten.
Auch die Integration mit Entwicklungstools wurde optimiert. Das Modell unterstützt die Erstellung genauerer Codes, was Programmierern und Unternehmen zugute kommt.
Neues Aussehen der Anwendung
Die Gemini-Anwendung verfügt über eine erneuerte Benutzeroberfläche mit intuitiverer Navigation. Der Bereich „Mein Stuff“ erleichtert den Zugriff auf erstellte Inhalte wie Bilder und Berichte.
Das Redesign zielt darauf ab, das Benutzererlebnis, insbesondere auf mobilen Geräten, zu verbessern. Das Update steht ab sofort in den App Stores zum Download bereit.
Intelligentere Programmierung
Der Gemini 3 verstärkt das Konzept der „Vibe-Codierung“ mit größerer Präzision bei Programmieraufgaben. Das Modell ist in der Lage, komplexe Codes wie SVGs zu generieren und die Konkurrenz in Benchmarks zu übertreffen.
Unternehmen, die Vertex AI nutzen, haben Zugriff auf fortschrittliche Tools für Automatisierung und Entwicklung. Die Integration mit Google Cloud erweitert den Einsatz in Unternehmensprojekten.
Effizientere Google-Suche
Zum ersten Mal wurde am Tag der Veröffentlichung ein neues KI-Modell in Pesquisa Google integriert. Der Modo IA bietet jetzt mehr visuelle und interaktive Antworten mit Tabellen und Grafiken.
Abonnenten der Pro- und Ultra-Pläne haben sofortigen Zugriff auf die „Thinking“-Funktion, die den Gemini 3 zur Bearbeitung komplexer Fragen nutzt. Die Funktionalität wird in Kürze auf alle Benutzer ausgeweitet.
Integration mit Google Antigravity
Google Antigravity, eine neue Entwicklungsplattform, begleitet den Start. Mit Ela können Programmierer Anwendungen mit High-Level-Befehlen erstellen und dabei KI in den Prozess integrieren.
Das Tool kombiniert Textaufforderungen, Terminal und Echtzeitvorschau. Es richtet sich an Entwickler, die Agilität bei der Erstellung von Software anstreben.