Nachrichten (DE)

Google präsentiert Gemini 3 und revolutioniert die Suche durch die Erstellung dynamischer Layouts und komplexer Codes

gemini
gemini - Stock all/Shutterstock.com gemini - Stock all/Shutterstock.com

Der Google kündigte offiziell die Ankunft des Gemini 3 an und festigte damit seinen bislang bedeutendsten Fortschritt auf dem Gebiet der generativen künstlichen Intelligenz. Die von der DeepMind-Abteilung entwickelte neue Technologie ist jetzt für Benutzer und Entwickler zugänglich und verspricht, die digitale Interaktion durch Schnittstellen zu verändern, die sich in Echtzeit an die Bedürfnisse der Suchenden anpassen. Die Veröffentlichung erfolgt gleichzeitig sowohl in der dedizierten Anwendung als auch in der Suchmaschine des Unternehmens und markiert eine strategische Änderung in der Verbreitung seiner Sprachmodelle.

Generative und dynamische Schnittstellen

Die wichtigste Innovation des Modells liegt in der Fähigkeit, sofort vollständige visuelle Schnittstellen zu generieren. Die Ressource namens Visual Layout organisiert Antworten mit künstlicher Intelligenz, indem sie die Struktur spezialisierter Websites simuliert und Texte, Bilder und Videos auf zusammenhängende Weise kombiniert. Die Essa-Funktionalität zielt darauf ab, Informationsfragmentierung zu beseitigen und ein Ergebnis zu liefern, das sofort genutzt werden kann.

gemini
Zwillinge – Foto: ioda / Shutterstock.com

Ein weiteres bekanntes Tool ist Dynamic View, mit dem Sie aus einfachen Textbefehlen ganze Webanwendungen erstellen können. Durante die Technologiedemonstration, der Aufbau einer interaktiven Galerie über den Maler Vincent van Gogh in wenigen Sekunden wurde gezeigt. Das System generierte nicht nur historischen Kontext, sondern organisierte Kunstwerke auch in einer visuell ansprechenden Präsentation, sodass die Navigation über mehrere Seiten nicht mehr erforderlich war.

Programmierfähigkeiten und Antigravity

Besondere Aufmerksamkeit erhält der Bereich Softwareentwicklung mit der Verbesserung des Vibe-Coding-Konzepts. Gemini 3 zeigt eine überragende Genauigkeit beim Schreiben komplexer Codes, einschließlich der Generierung von SVG-Dateien und funktionalen Skripts, die bei Leistungstests die Konkurrenz übertreffen. Der Vorschlag besteht darin, den Arbeitsablauf von Programmierern zu beschleunigen, den Zeitaufwand für sich wiederholende Aufgaben zu reduzieren und grundlegende Fehler zu korrigieren.

Zusammen mit dem Modell wurde die Google Antigravity-Plattform eingeführt, eine Umgebung, die auf die agile Softwareerstellung abzielt. Das Tool integriert High-Level-Befehle, Programmierterminal und Echtzeitvisualisierung und ermöglicht es Entwicklern, robuste Anwendungen mit künstlicher Intelligenz als zentralem Treiber zu erstellen. Die Integration mit Google Cloud und Vertex AI erweitert diese Möglichkeiten für die Unternehmensumgebung und erleichtert eine groß angelegte Prozessautomatisierung.

Sofortige Suchintegration

Zum ersten Mal in der Unternehmensgeschichte wird am selben Tag seiner weltweiten Ankündigung ein hochmodernes Modell in den Pesquisa Google integriert. Die Modo-KI der Suchmaschine bietet jetzt interaktivere Antworten und verwendet dynamische Tabellen und Grafiken, die im Handumdrehen generiert werden, um komplexe Themen zu erklären. Das Essa-Update zielt darauf ab, die Suchmaschinenrelevanz in einem Szenario aufrechtzuerhalten, in dem Chatbots für die schnelle Informationsbeschaffung immer beliebter werden.

Benutzer des erweiterten Plans wie Pro und Ultra erhalten Zugriff auf die Funktion Thinking. Die Esta-Funktionalität nutzt die Rechenleistung des Gemini 3, um Fragen zu bearbeiten, die tiefe logische Überlegungen und Querverweise auf verschiedene Daten erfordern. Das Unternehmen bestätigte, dass das Tool schrittweise auf die allgemeine Benutzerbasis ausgeweitet wird, um den Zugang zu hochkomplexer Forschung zu demokratisieren.

Multimodale Entwicklung und Benutzerfreundlichkeit

Die Gemini 3-Architektur wurde entwickelt, um verschiedene Medienformate mit beispielloser Effizienz zu verarbeiten. Das Modell kann in Videos, Bildern und Texten enthaltene Informationen gleichzeitig interpretieren und in Beziehung setzen, detaillierte Anmerkungen extrahieren oder visuelle Inhalte in strukturierte Präsentationen umwandeln. Die multimodale Funktion von Essa ist für Studenten und Berufstätige unerlässlich, die große Datenmengen aus verschiedenen Quellen synthetisieren müssen.

Die offizielle Anwendung wurde außerdem optisch neu gestaltet, um mit den neuen Funktionen des Systems Schritt zu halten. Die Benutzeroberfläche verfügt jetzt über den Abschnitt My Stuff, der die Verwaltung von benutzergenerierten Inhalten wie Berichten und Bildern erleichtern soll. Die Navigation für mobile Geräte wurde vereinfacht, sodass die Benutzererfahrung auch bei der Bearbeitung komplexer Aufgaben auf kleineren Bildschirmen flüssig ist.

To Top