Google I/O se ha convertido definitivamente en Gemini I/O, un modelo de IA que ha copado prácticamente todas las novedades que han salido del evento. De la mano de Sundar Pichai, director ejecutivo de Google, la compañía ha dado la bienvenida a la era agéntica de Gemini, que gracias a la última ronda de novedades ahora cuenta con su propia versión de OpenClaw llamada Spark, un modelo conocido como Omni que promete crear contenido a partir de cualquier tipo de entrada (empezando por el video), el modelo Flash 3.5 o las funciones Documentos Live controlable por voz, Pregunta a YouTube y Carrito Universal.
Empezamos por Gemini Spark, que es la respuesta de Google a OpenClaw, un asistente de inteligencia artificial capaz de usar diferentes modelos de IA para crear agentes al servicio del usuario. Google ya ofrece agentes a empresas y desarrolladores, y con Spark se propone hacer llegar estas posibilidades a todo el mundo "de manera segura". Gemini Spark se presenta como un agente de IA personal en la aplicación de Gemini "que te ayuda a organizar tu vida digital, actuando por ti y siguiendo tus instrucciones". El agente se ejecuta en máquinas virtuales de Google Cloud, así que siempre está activo.
Gemini Spark se basa en el Gamini 3.5 y dice tener la capacidad de realizar tareas de largo recorrido y en segundo plano. Además, es capaz de integrarse con diferentes herramientas empezando por las de Google, y en las próximas semanas con las de terceros a través de MCP (Protocolo de contexto del modelo). Este año los usuarios de Android podrán hacer el seguimiento en directo de las novedades y el progreso de las tareas de Spark en un nuevo espacio de la interfaz llamado Android Halo, mientras que en verano Spark empezará a funcionar directamente dentro de Chrome, que ejercerá como un navegador agéntico.
Por otro lado tenemos a Gemini Omni, un nuevo modelo que puede crear contenido partiendo de cualquier entrada empezando por el vídeo. "Con Omni, puedes combinar imágenes, audio, vídeo y texto para generar vídeos de gran calidad fundamentados en los conocimientos de Gemini sobre el mundo real", explica Google. "También puedes editar fácilmente tus vídeos con una simple conversación". Omni Flash, el primer modelo de esta familia, se encuentra disponible para los suscriptores de Google AI Plus, Pro y Ultra a través de la app Gemini y de Google Flow. Esta semana se lanzará para los usuarios de YouTube Shorts y la app YouTube Create.
Google también ha presentado las siguientes funciones basadas en Gemini.
Empezamos por Gemini Spark, que es la respuesta de Google a OpenClaw, un asistente de inteligencia artificial capaz de usar diferentes modelos de IA para crear agentes al servicio del usuario. Google ya ofrece agentes a empresas y desarrolladores, y con Spark se propone hacer llegar estas posibilidades a todo el mundo "de manera segura". Gemini Spark se presenta como un agente de IA personal en la aplicación de Gemini "que te ayuda a organizar tu vida digital, actuando por ti y siguiendo tus instrucciones". El agente se ejecuta en máquinas virtuales de Google Cloud, así que siempre está activo.
Gemini Spark se basa en el Gamini 3.5 y dice tener la capacidad de realizar tareas de largo recorrido y en segundo plano. Además, es capaz de integrarse con diferentes herramientas empezando por las de Google, y en las próximas semanas con las de terceros a través de MCP (Protocolo de contexto del modelo). Este año los usuarios de Android podrán hacer el seguimiento en directo de las novedades y el progreso de las tareas de Spark en un nuevo espacio de la interfaz llamado Android Halo, mientras que en verano Spark empezará a funcionar directamente dentro de Chrome, que ejercerá como un navegador agéntico.
Por otro lado tenemos a Gemini Omni, un nuevo modelo que puede crear contenido partiendo de cualquier entrada empezando por el vídeo. "Con Omni, puedes combinar imágenes, audio, vídeo y texto para generar vídeos de gran calidad fundamentados en los conocimientos de Gemini sobre el mundo real", explica Google. "También puedes editar fácilmente tus vídeos con una simple conversación". Omni Flash, el primer modelo de esta familia, se encuentra disponible para los suscriptores de Google AI Plus, Pro y Ultra a través de la app Gemini y de Google Flow. Esta semana se lanzará para los usuarios de YouTube Shorts y la app YouTube Create.
Google también ha presentado las siguientes funciones basadas en Gemini.
- Pregunta a YouTube: muestra vídeos que coinciden con lo que pregunta el usuario y va directamente a la parte del video que necesita.
- Documentos Live controlable por voz: una función que permite volcar directamente los pensamientos en un documento. Gemini se encarga de crear el documento sin necesidad de pedirlo.
- Gemini 3.5 Flash: un modelo que combina "inteligencia de frontera con capacidad de acción" y que destaca por sus mejores resultados en programación y rapidez de generación.
- Antigravity 2.0: ahora incorpora Gemini Flash 3.5 y cuenta con una aplicación independiente para ordenadores que actúa como una sede centralizada para la interacción de agentes.
- Google Pics: una nueva herramienta de creación y edición de imágenes con IA, desarrollada a partir del modelo Nano Banana.
- Carrito Universal: cuando se buscan en Google productos para comprar, esta función se integra con las tiendas y los servicios para poder añadir los artículos al carrito. Cuando un producto está en el carrito, un agente busca ofertas y bajadas de precio. Llegará este verano a Estados Unidos.