Gemini: agente de IA personal siempre activo

Noticias » Internet

Google I/O se ha convertido definitivamente en Gemini I/O, un modelo de IA que ha copado prácticamente todas las novedades que han salido del evento. De la mano de Sundar Pichai, director ejecutivo de Google, la compañía ha dado la bienvenida a la era agéntica de Gemini, que gracias a la última ronda de novedades ahora cuenta con su propia versión de OpenClaw llamada Spark, un modelo conocido como Omni que promete crear contenido a partir de cualquier tipo de entrada (empezando por el video), el modelo Flash 3.5 o las funciones Documentos Live controlable por voz, Pregunta a YouTube y Carrito Universal.

Empezamos por Gemini Spark, que es la respuesta de Google a OpenClaw, un asistente de inteligencia artificial capaz de usar diferentes modelos de IA para crear agentes al servicio del usuario. Google ya ofrece agentes a empresas y desarrolladores, y con Spark se propone hacer llegar estas posibilidades a todo el mundo "de manera segura". Gemini Spark se presenta como un agente de IA personal en la aplicación de Gemini "que te ayuda a organizar tu vida digital, actuando por ti y siguiendo tus instrucciones". El agente se ejecuta en máquinas virtuales de Google Cloud, así que siempre está activo.

Gemini Spark se basa en el Gamini 3.5 y dice tener la capacidad de realizar tareas de largo recorrido y en segundo plano. Además, es capaz de integrarse con diferentes herramientas empezando por las de Google, y en las próximas semanas con las de terceros a través de MCP (Protocolo de contexto del modelo). Este año los usuarios de Android podrán hacer el seguimiento en directo de las novedades y el progreso de las tareas de Spark en un nuevo espacio de la interfaz llamado Android Halo, mientras que en verano Spark empezará a funcionar directamente dentro de Chrome, que ejercerá como un navegador agéntico.

Por otro lado tenemos a Gemini Omni, un nuevo modelo que puede crear contenido partiendo de cualquier entrada empezando por el vídeo. "Con Omni, puedes combinar imágenes, audio, vídeo y texto para generar vídeos de gran calidad fundamentados en los conocimientos de Gemini sobre el mundo real", explica Google. "También puedes editar fácilmente tus vídeos con una simple conversación". Omni Flash, el primer modelo de esta familia, se encuentra disponible para los suscriptores de Google AI Plus, Pro y Ultra a través de la app Gemini y de Google Flow. Esta semana se lanzará para los usuarios de YouTube Shorts y la app YouTube Create.

Google también ha presentado las siguientes funciones basadas en Gemini.

Pregunta a YouTube: muestra vídeos que coinciden con lo que pregunta el usuario y va directamente a la parte del video que necesita.
Documentos Live controlable por voz: una función que permite volcar directamente los pensamientos en un documento. Gemini se encarga de crear el documento sin necesidad de pedirlo.
Gemini 3.5 Flash: un modelo que combina "inteligencia de frontera con capacidad de acción" y que destaca por sus mejores resultados en programación y rapidez de generación.
Antigravity 2.0: ahora incorpora Gemini Flash 3.5 y cuenta con una aplicación independiente para ordenadores que actúa como una sede centralizada para la interacción de agentes.
Google Pics: una nueva herramienta de creación y edición de imágenes con IA, desarrollada a partir del modelo Nano Banana.
Carrito Universal: cuando se buscan en Google productos para comprar, esta función se integra con las tiendas y los servicios para poder añadir los artículos al carrito. Cuando un producto está en el carrito, un agente busca ofertas y bajadas de precio. Llegará este verano a Estados Unidos.

6 comentarios

Teuti
Creo que google son los únicos que pueden hacer algo así de forma más o menos rentable, al no ser esclavos de nvidia tienen una burrada de margen para i+D con sus chips a medida y sin arruinarse. Anthropic ya le cortó el grifo de la api hace meses a los usuarios de openclaw
Fox

Teuti escribió:Creo que google son los únicos que pueden hacer algo así de forma más o menos rentable, al no ser esclavos de nvidia tienen una burrada de margen para i+D con sus chips a medida y sin arruinarse. Anthropic ya le cortó el grifo de la api hace meses a los usuarios de openclaw

Anthropic deja usar openclaw de nuevo. Aunque con el cambio que harán el 15 de junio, por lo pronto "dejara de serlo". Pero vamos, esto cambia todas las semanas.
altbrian
No puedo más, ya me resulta extenuante todo lo relacionado con IA. Todo avanza demasiado rápido y cada vez pide que cedamos más cosas claves como nuestra autonomía, trabajo y libertad de no usarla (porque estaríamos en desventaja competitiva)
alagar7101
Esa es la clave. Hasta el que no quiere usarla esta obligado para no estar en desventaja.
BlueTrance
Ya podrían integrar el "buscador de YouTube"... en el buscador de YouTube, porque vaya tela.
Aunque no creo que suceda, porque tendrían que mostrar resultados coincidentes, en lugar de los que ellos quieran promocionar.
LepucK

BlueTrance escribió:Ya podrían integrar el "buscador de YouTube"... en el buscador de YouTube, porque vaya tela.
Aunque no creo que suceda, porque tendrían que mostrar resultados coincidentes, en lugar de los que ellos quieran promocionar.

Esa es la clave la guerra entre servicios de diferentes empresas, que tengas que usar un servicio para conseguir la afinidad que necesitas de otro, usar una empresa para conseguir rapidez en otra, lo de pagar 40 subscripciones para ver series se va a quedar corto a lo que están montando xD.

Ver más comentarios »

Gemini lanza su propia versión de OpenClaw y un modelo que puede crear contenido desde cualquier tipo de entrada