Nachrichten (DE)

Google kündigt Gemini 3.1 Pro mit doppelter Begründung in fortgeschrittenen Tests an

Gemini
Gemini - Mehaniq/shutterstock.com

Google gab an diesem Donnerstag (19) die Einführung von Gemini 3.1 Pro bekannt, einem bedeutenden Update der Familie der Modelle für künstliche Intelligenz des Unternehmens. Das neue Modell zeichnet sich durch Fortschritte im fortgeschrittenen Denken aus und bietet eine mehr als verdoppelte Leistung bei Logiktests im Vergleich zum Vorgängermodell Gemini 3 Pro. Die Vorschau steht jetzt Entwicklern und Abonnenten kostenpflichtiger Tarife zur Verfügung und konzentriert sich auf komplexe Aufgaben, die eine Informationssynthese und eine aufwändige Problemlösung erfordern.

Die Freigabe erfolgt während der internen Test- und Validierungsphase von Workflows mit autonomen Agenten. Allgemeiner Usuários-Zugriff auf die Version über die Anwendung Gemini, mit erhöhten Beschränkungen für diejenigen, die die Abonnements Google AI, Pro und Empresas und Entwickler nutzen das Tool über die Gemini-API, einschließlich Plattformen wie AI Studio, Vertex AI und Android Studio.

Die Ankündigung wurde von Google DeepMind gemacht, das den Gemini 3.1 Pro als das fortschrittlichste Modell des Unternehmens für Herausforderungen positioniert, die Intelligenz erfordern, die über einfache Antworten hinausgeht. Das Update beinhaltet Verbesserungen im multimodalen Denken und umfasst Text-, Bild-, Audio-, Video- und vollständige Code-Repositorys.

Leistung bei Argumentations-Benchmarks

Gemini 3.1 Pro erreichte 77,1 % auf ARC-AGI-2, einem Benchmark, der die Fähigkeit bewertet, völlig neue logische Muster zu lösen. Das Ergebnis von Esse stellt mehr als das Doppelte der Leistung dar, die von Gemini 3 Pro erzielt wurde, das in derselben Metrik 31,1 % erreichte.

Auch bei strengen Bewertungen übertraf das Modell die Konkurrenz. Last Exam von No Humanity erzielte 44,4 % und lag damit vor den Modellen von Anthropic und OpenAI. Esses-Fortschritte stärken die Position von Gemini 3.1 Pro bei Aufgaben, die Fachwissen und fundiertes Denken erfordern.

Durch die Verbesserung des logischen Denkens können Sie komplexe Probleme konsequenter angehen. Der Fokus liegt auf praktischen Anwendungen, bei denen das einfache Abrufen trainierter Muster nicht ausreicht.

Fortschritte bei Agenten- und Suchaufgaben

Bei APEX-Agents, das die Leistung bei langfristigen beruflichen Aufgaben misst, verzeichnete Gemini 3,1 Pro 33,5 %. Der Esse-Index weist auf eine verbesserte Fähigkeit hin, Ziele über längere Schritte hinweg aufrechtzuerhalten.

Das Modell erreichte 85,9 % in BrowseComp, einer Bewertung der Agenten-Internetsuche in Kombination mit der Verwendung von Tools wie Python. Das Esse-Ergebnis unterstreicht die Effizienz bei der autonomen Suche und Extraktion relevanter Informationen.

Diese Vorteile erleichtern die Schaffung zuverlässigerer autonomer Agenten. Google betont, dass das Modell Arbeitsabläufe priorisiert, die mehrere Schritte und Tool-Integration umfassen.

Gemini Inteligência Artificial
Zwillinge Inteligência Artificial – Ju Jae-jung/ Shutterstock.com

Fähigkeiten in der Systemsynthese und visuellen Erstellung

Gemini 3.1 Pro demonstriert die Fähigkeit, komplexe Systeme anhand von Texteingabeaufforderungen zu vereinfachen. In Demos wurden skalierbare SVG-Animationen direkt aus Beschreibungen generiert, wodurch im Vergleich zu herkömmlichen Videos schlankere visuelle Elemente entstanden.

Eine weitere Anwendung umfasste die Konfiguration eines öffentlichen Telemetrie-Streams, um ein funktionales Dashboard zu erstellen, das die Umlaufbahn von Estação Espacial Internacional in Echtzeit visualisiert. Das Modell verarbeitete APIs und Daten, um eine operative Schnittstelle bereitzustellen.

Das Modell kodierte auch interaktive 3D-Erlebnisse. Ein Beispiel simulierte den Flug eines Vogelschwarms, der auf die Handverfolgung des Benutzers reagierte, und integrierte dabei Computervision und Animation.

Beispiele für kreative Codierung

In einem literarischen Interpretationstest hat Gemini 3.1 Pro Beschreibungen aus dem Buch „Die Morro der Ventos Uivantes“ in eine moderne Portfolio-Schnittstelle umgewandelt. AI hat den atmosphärischen Ton der Arbeit erfasst, um eine zeitgemäße und funktionale Website zu entwerfen.

Diese Demonstrationen veranschaulichen die Fähigkeit, abstrakte Konzepte in ausführbaren Code zu übersetzen. Das Modell generiert visuelle und interaktive Strukturen basierend auf narrativen Anregungen.

Der Fokus auf multimodale Synthese erweitert die Einsatzmöglichkeiten in Design, Bildung und Rapid Prototyping.

Zugangs- und Abonnementpläne

Gemini 3.1

In NotebookLM ist die Version ebenfalls auf kostenpflichtige Benutzer beschränkt. Das Tool profitiert von erweiterten Funktionen zur Dokumentensynthese und Generierung von Erkenntnissen.

Entwickler greifen über die API auf Plattformen wie AI Studio und Vertex AI auf die Vorschau zu. Empresas verwenden das Modell in Unternehmensumgebungen mit Gemini Enterprise.

Verfügbarkeit für Entwickler und Unternehmen

Die Integration in Vertex AI ermöglicht Experimente im Unternehmensmaßstab. Google hebt hervor, dass die Vorschau dazu dient, Abläufe mit autonomen Agenten vor der breiten Veröffentlichung zu verfeinern.

Das Modell verwaltet ein Kontextfenster von 1 Million Token und unterstützt so die Analyse großer Datenmengen. Die Essa-Funktion bleibt mit früheren Generationen der Gemini 3-Serie konsistent.

Das Update stärkt das Google-Ökosystem von Tools für KI, die in professionellen Szenarien eingesetzt werden.

To Top