Google inicia oficialmente la era de los agentes de IA presentando Gemini 3.0, su modelo más potente con un nuevo modo de razonamiento profundo Deep Think y el entorno de desarrollo Antigravity. El sucesor de la versión 2.5 arrasa con la competencia en los rankings de LMArena y llega directamente al buscador. ¿Vale la pena invertir en la suscripción Ultra a pesar de la mayor lentitud del modelo? Comprobamos si Gemini 3.0 es realmente el «doctorando digital» que estábamos esperando.
Apenas dos años después del inicio de la «era Gemini», Google, en boca de su CEO Sundar Pichai, anunció el estreno de Gemini 3.0. No se trata solo de una actualización numérica más. Es un cambio fundamental en el enfoque de cómo la IA «piensa», planifica y colabora con el ser humano. El nuevo modelo pretende ser la respuesta a la creciente demanda de la llamada agencia (agentic workflows) y el razonamiento profundo (reasoning).
¿Qué es Gemini 3.0?
Gemini 3.0 es el modelo multimodal más reciente de Google DeepMind que, según sus creadores, es el «modelo más inteligente que jamás hayan creado». La diferencia clave respecto a sus predecesores (Gemini 1.5 o 2.5) es el desplazamiento del centro de gravedad de la simple generación de contenido hacia el razonamiento profundo y la acción agéntica.
El modelo se ha puesto a disposición en varias variantes, incluyendo Gemini 3 Pro y el modo Deep Think (disponible para suscriptores de Google AI Ultra). Google presume de que su IA ha pasado de «leer texto» a «leer estados de ánimo» e intenciones del usuario.
Deep Think: razonamiento a nivel de doctorado
La mayor novedad es el modo Gemini 3 Deep Think. Funciona con un principio similar a los modelos de la serie «o1» de OpenAI: antes de dar una respuesta, «reflexiona», descomponiendo el problema en factores primos.
En la práctica, esto significa que el modelo:
- Maneja mejor los matices y las preguntas «con trampa».
- Verifica sus propias suposiciones durante la generación de la respuesta.
- Alcanza resultados a nivel de doctorado en pruebas como Humanity’s Last Exam o GPQA Diamond.
Para el sector SEO y el marketing de contenidos, esto significa el fin de la era de las «alucinaciones» en tareas lógicas sencillas, pero también… un mayor tiempo de espera para la respuesta (de lo cual hablamos en la sección de desventajas).
Nuevas funciones que cambian las reglas del juego
Google no se limitó solo a mejorar los parámetros del «cerebro» del modelo. Se introdujeron herramientas que redefinen el trabajo con código e interfaces.
Google Antigravity y programación agéntica Para los desarrolladores y técnicos SEO, la novedad más importante es Google Antigravity. Es una plataforma en la que la IA deja de ser solo un asistente que sugiere sintaxis para convertirse en un agente autónomo.
Este sistema posee su propio «Inbox», puede planificar tareas, editar archivos, usar la terminal y el navegador, y luego pedir al humano que apruebe el plan. En las pruebas SWE-bench Verified (que miden las capacidades de los agentes de codificación), Gemini 3.0 superó ampliamente a sus predecesores.
Vibe coding e interfaz generativa Un término interesante que apareció con motivo del estreno es vibe coding. Permite crear aplicaciones o juegos no mediante especificaciones técnicas precisas, sino describiendo el «ambiente» (por ejemplo, «crea un juego retro al estilo de los años 90 con efecto de monitor CRT antiguo»).
Además, Gemini 3.0 introduce la Generative UI. Esto significa que durante una conversación con el bot (o en el buscador de Google), la IA puede generar en tiempo real un widget interactivo (por ejemplo, una calculadora de crédito o un simulador físico) en lugar de simplemente escupir un muro de texto o código estático.
Gemini 3.0 en cifras: ¿cómo queda frente a la competencia?
Los números hablan por sí solos. Google afirma que Gemini 3.0 ocupa actualmente el primer lugar en los rankings clave:
- LMArena (Chatbot Arena): Resultado de 1501 puntos ELO (50 puntos de ventaja sobre el líder anterior).
- MMMU-Pro (multimodalidad): 81% de efectividad.
- WebDev Arena: Líder en tareas relacionadas con la creación de sitios web.
El modelo supera a la competencia en el ámbito de la «planificación a largo plazo» (long-term planning), lo que se demostró en la prueba Vending-Bench 2, donde la IA gestionó un negocio simulado durante un año virtual, manteniendo la coherencia de las decisiones.
Desventajas y desafíos de la nueva versión
A pesar del entusiasmo, las primeras reseñas (entre otras, de The Verge o Wired) y las pruebas de los usuarios señalan varios inconvenientes importantes:
- El modelo tiene filtros de seguridad (safety guardrails) muy restrictivos. Los usuarios reportan la negativa a generar imágenes o respuestas sobre temas históricos/políticos que se consideran «sensibles», incluso si la consulta es neutral.
- El modo Deep Think es lento. Se puede esperar una respuesta de 10 a 15 segundos, lo que en el caso de consultas rápidas resulta irritante. Es un «Ferrari» que funciona genial en la pista de carreras (problemas difíciles), pero mal en los atascos (preguntas simples).
- Las mejores funciones (Deep Think, Antigravity) están ocultas tras el muro de pago de la suscripción Google AI Ultra (aprox. 30 USD/mes).
Resumen
Gemini 3.0 es una herramienta potente que desplaza la frontera entre un chatbot y un «colaborador digital». Para el sector del marketing y TI, es una señal de que entramos en la era de los agentes que no solo escriben texto, sino que hacen el trabajo por nosotros. ¿Vale la pena pasarse a la versión Ultra? Si tu trabajo requiere análisis de datos, codificación o una investigación compleja, definitivamente sí.
¿Quieres estar al día con las noticias del mundo de la inteligencia artificial? ¡Suscríbete a la newsletter de Delante para no perderte los próximos artículos!
Fuente de información sobre Gemini 3: https://blog.google/intl/pl-pl/nowosci-produktowe/gemini-3/