Noticias (ES)

Google lanza el modelo Gemini 3 con razonamiento avanzado y liderazgo global en benchmarks de IA

Gemini 3
Gemini 3 - Google

Google anunció este martes (18) la llegada del Gemini 3, descrito por la dirección de la empresa como su modelo de inteligencia artificial más sofisticado hasta la fecha, diseñado para comprender matices y realizar tareas con una autonomía sin precedentes. La nueva generación de tecnología promete transformar la interacción digital integrando capacidades multimodales superiores y un razonamiento lógico profundo directamente en los productos de la empresa, desde el motor de búsqueda hasta complejas herramientas de desarrollo de software. La actualización marca una nueva fase en la lucha por el dominio de la IA generativa, centrándose no sólo en responder a órdenes, sino también en actuar como socio de pensamiento.

Principales novedades presentadas en el lanzamiento:

  • Razonamiento Aprofundado: modo Introdução del Deep Think para resolver problemas complejos.
  • Autonomía de Agentes: Capacidade mejoró la planificación y ejecución de tareas de varios pasos.
  • Google Antigravity: plataforma Nova centrada en desarrolladores que integra agentes de codificación.
  • Rendimiento Recorde: Liderança confirmado en el ranking LMArena y en pruebas académicas.

Avances en razonamiento lógico y capacidades multimodales.

La gran diferencia del Gemini 3 radica en su arquitectura de “razonamiento de última generación”, que permite al modelo procesar información con un mayor nivel de profundidad que las versiones anteriores. Segundo Sundar Pichai, director ejecutivo de Google y Alphabet, la tecnología ha evolucionado desde la simple lectura de texto e imágenes hasta la comprensión del contexto y la intención detrás de las solicitudes de los usuarios, eliminando la necesidad de indicaciones demasiado detalladas.

La compañía también presentó “Gemini 3 Deep Think”, un modo de razonamiento mejorado que logró puntuaciones impresionantes en evaluaciones de alta dificultad, demostrando la capacidad de enfrentar desafíos que requieren lógica secuencial e interpretación de datos abstractos.

Las pruebas de rendimiento indican un importante salto cualitativo respecto al modelo 2.5 Pro:

  • Puntuación de 1501 Elo en el Leaderboard de LMArena.
  • 91,9% de aprobación en el benchmark GPQA Diamond.
  • 87,6 % de precisión en el Video-MMMU para comprensión multimodal.

Nueva plataforma Google Antigravity para desarrolladores

Simultáneamente al lanzamiento del modelo, se presentó la plataforma Google Antigravity, descrita como un entorno de desarrollo “agente primero”. La herramienta permite a los programadores operar en un nivel orientado a tareas, donde la IA pasa de ser solo un asistente para completar código a un socio activo que planifica y ejecuta flujos de trabajo de un extremo a otro.

Con acceso directo al editor, terminal y navegador, los agentes Gemini 3 dentro de Antigravity pueden desarrollar, probar y validar aplicaciones de un extremo a otro. La integración tiene como objetivo aumentar la productividad al delegar procesos repetitivos y complejos a la inteligencia artificial, manteniendo la supervisión humana para las decisiones estratégicas y creativas en el desarrollo de software.

Integración directa en capacidades de búsqueda y codificación.

La actualización también impacta directamente al consumidor final con la implementación inmediata de Gemini 3 en el “AI Mode” de Busca de Google.

Por primera vez, un modelo de esta magnitud está disponible en el motor de búsqueda el día del lanzamiento, permitiendo generar interfaces dinámicas y diseños visuales inmersivos en tiempo real basados ​​en consultas.

Además, se ha mejorado la capacidad de “codificación de vibración”, lo que permite que el modelo genere visualizaciones web ricas e interactivas basadas en instrucciones en lenguaje natural.

Rendimiento superior en exámenes de matemáticas y ciencias

La precisión objetiva y la capacidad matemática fueron puntos centrales en el desarrollo de esta generación.

El modelo alcanzó un nuevo máximo del 23,4% en MathArena Apex, estableciendo un récord para modelos de frontera en resolución matemática avanzada.

En pruebas de verificación de hechos como la SimpleQA Verified, el Gemini 3 logró un 72,1%, lo que sugiere una reducción de las “alucinaciones” comunes en los modelos generativos.

Estos datos refuerzan la utilidad de la herramienta para académicos y científicos que requieren confiabilidad en la síntesis de grandes volúmenes de datos técnicos.

Capacidad de planificación a largo plazo

Uno de los desarrollos más técnicos detallados por el equipo de Google DeepMind es la coherencia del modelo en tareas de largo plazo. En simulaciones de negocios como el benchmark Vending-Bench 2, el Gemini 3 fue capaz de gestionar operaciones virtuales durante períodos prolongados sin desviarse del objetivo inicial, algo que los modelos anteriores tenían dificultades para mantener. Isso sugiere que la IA se puede utilizar con mayor seguridad para organizar flujos de trabajo personales, como la programación de servicios y la gestión de correos electrónicos, manteniendo la coherencia de las acciones desde el principio hasta el final del proceso bajo la supervisión del usuario.

Disponibilidad y acceso inmediato a los recursos.

Gemini 3 Pro ahora está disponible para desarrolladores a través de Google AI Studio y Vertex AI, así como integraciones de plataformas de terceros.

Para el público en general, las funciones comienzan a distribuirse hoy en las aplicaciones Gemini y Busca, con funciones avanzadas reservadas para los suscriptores del plan AI Ultra.

To Top