Google ha anunciado Gemini 3, su modelo de inteligencia artificial más avanzado hasta la fecha. El lanzamiento llega a través de la app Gemini, el buscador con modo IA y varias plataformas para desarrolladores, marcando un nuevo salto en razonamiento, comprensión multimodal y capacidad para codificar con agentes inteligentes.
Por: Christian Rossell Cruz García
¿Qué trae de nuevo Gemini 3?
- Razonamiento más profundo: Según Google, Gemini 3 Pro ofrece un nivel de profundidad y matiz en sus respuestas que simplemente no se había visto antes.
- Modelo “Deep Think”: Además de la versión Pro, hay una variante llamada Gemini 3 Deep Think, optimizada para razonamiento avanzado. Esta versión alcanza puntajes aún más altos en ciertos benchmarks, aunque por ahora está limitada a suscriptores de Google AI Ultra.
- Contexto largo: Gemini 3 mejora su capacidad para procesar grandes volúmenes de información, lo que permite trabajar con documentos extensos, código o conversaciones largas.
- Uso multimodal: No solo entiende texto; también tiene mejoras en razonamiento visual, espacial y puede integrar imágenes, video y código.
- Planificación y agentes: Está diseñado para flujos de trabajo con agentes inteligentes que pueden usar herramientas reales (editor, terminal, navegador) para completar tareas de codificación.
- Codificación: Gemini 3 Pro destaca mucho en benchmarks de desarrollo y uso de herramientas. Por ejemplo, en Terminal-Bench 2.0 obtuvo un 54.2 %, lo que indica que puede usar la terminal como un “agente” de manera efectiva.
- Alta confiabilidad factual: Sus resultados en tareas de conocimiento o preguntas verificadas han mejorado, lo que sugiere una mejor precisión factual.
Récords en benchmarks
Gemini 3 establece nuevos hitos en varios benchmarks clave:
- Consiguió 37.4 puntos en “Humanity’s Last Exam”, una prueba de razonamiento general muy exigente.
- Obtuvo 1,501 en LMArena, colocándose como líder en satisfacción de tareas reales y razonamiento humano-dirigido.
- En matemáticas alcanzó 23.4 % en MathArena Apex, marcando una gran mejora sobre la versión anterior.
- En razonamiento multimodal también brilló: por ejemplo, logró 81 % en MMMU-Pro y 87.6 % en Video-MMMU.
- En uso de herramienta (agentic), su desempeño en SWE-Bench Verified subió a 76.2 %, comparado con versiones anteriores.
- En “planning” a largo plazo también mejora: en contextos muy amplios mantiene un comportamiento más consistente.
Antigravity: el IDE impulsado por Gemini 3
Junto con Gemini 3, Google presentó Antigravity, su nueva plataforma de codificación “agent-first”. Este entorno permite que múltiples agentes de IA interactúen directamente con el editor, la terminal y un navegador:
- Tiene dos vistas principales: una “Editor” que se parece a un IDE tradicional con un panel para agentes, y otra “Manager” para coordinar varios agentes a la vez.
- Genera “Artifacts”: listas de tareas, planes, capturas de pantalla y grabaciones del navegador que documentan lo que los agentes están haciendo, para que los desarrolladores puedan verificar y entender sus acciones.
- Está disponible en vista previa pública para Windows, macOS y Linux.
- Además de Gemini 3 Pro, Antigravity soporta otros modelos (como Claude Sonnet 4.5 y algunos de código abierto), lo que lo hace flexible para distintos flujos de trabajo.
Uso y despliegue
- Gemini 3 Pro ya está disponible para desarrolladores a través de Google AI Studio, Vertex AI y la API de Gemini.
- Precio: según Google, funciona con un esquema por tokens: hay un costo por tokens de entrada y salida.
- También se integrará en herramientas muy usadas como Android Studio, VS Code, JetBrains, y más.
- En cuanto a usuarios, la app Gemini ya tiene más de 650 millones de usuarios activos mensualmente, y 13 millones de desarrolladores según Google.
El lanzamiento de Gemini 3 representa un movimiento muy ambicioso por parte de Google. No es solo un modelo más potente, sino una plataforma pensada para desarrollar con IA, con agentes que pueden codificar de forma autónoma y verificar su propio trabajo. Es un gran paso para los flujos de trabajo “agentic”: en vez de que la IA te dé sugerencias, los agentes hacen partes reales del trabajo.
Al mismo tiempo, sus récords en benchmarks demuestran que Google no solo está invirtiendo en interfaz y usabilidad de IA, sino también en poder de razonamiento, matemática, planificación y uso de herramientas. Esto podría cambiar cómo los desarrolladores construyen aplicaciones apoyados en IA.
Sin embargo, como con cualquier lanzamiento, habrá preguntas sobre seguridad, control y confiabilidad: depender de agentes autónomos abre nuevos desafíos.
