Gemini lanza su propia versión de OpenClaw y un modelo que puede crear contenido desde cualquier tipo de entrada

Benzo
    0
Noticias » Internet
Google I/O se ha convertido definitivamente en Gemini I/O, un modelo de IA que ha copado prácticamente todas las novedades que han salido del evento. De la mano de Sundar Pichai, director ejecutivo de Google, la compañía ha dado la bienvenida a la era agéntica de Gemini, que gracias a la última ronda de novedades ahora cuenta con su propia versión de OpenClaw llamada Spark, un modelo conocido como Omni que promete crear contenido a partir de cualquier tipo de entrada (empezando por el video), el modelo Flash 3.5 o las funciones Documentos Live controlable por voz, Pregunta a YouTube y Carrito Universal.

Empezamos por Gemini Spark, que es la respuesta de Google a OpenClaw, un asistente de inteligencia artificial capaz de usar diferentes modelos de IA para crear agentes al servicio del usuario. Google ya ofrece agentes a empresas y desarrolladores, y con Spark se propone hacer llegar estas posibilidades a todo el mundo "de manera segura". Gemini Spark se presenta como un agente de IA personal en la aplicación de Gemini "que te ayuda a organizar tu vida digital, actuando por ti y siguiendo tus instrucciones". El agente se ejecuta en máquinas virtuales de Google Cloud, así que siempre está activo.

Gemini Spark se basa en el Gamini 3.5 y dice tener la capacidad de realizar tareas de largo recorrido y en segundo plano. Además, es capaz de integrarse con diferentes herramientas empezando por las de Google, y en las próximas semanas con las de terceros a través de MCP (Protocolo de contexto del modelo). Este año los usuarios de Android podrán hacer el seguimiento en directo de las novedades y el progreso de las tareas de Spark en un nuevo espacio de la interfaz llamado Android Halo, mientras que en verano Spark empezará a funcionar directamente dentro de Chrome, que ejercerá como un navegador agéntico.


Por otro lado tenemos a Gemini Omni, un nuevo modelo que puede crear contenido partiendo de cualquier entrada empezando por el vídeo. "Con Omni, puedes combinar imágenes, audio, vídeo y texto para generar vídeos de gran calidad fundamentados en los conocimientos de Gemini sobre el mundo real", explica Google. "También puedes editar fácilmente tus vídeos con una simple conversación". Omni Flash, el primer modelo de esta familia, se encuentra disponible para los suscriptores de Google AI Plus, Pro y Ultra a través de la app Gemini y de Google Flow. Esta semana se lanzará para los usuarios de YouTube Shorts y la app YouTube Create.

Google también ha presentado las siguientes funciones basadas en Gemini.

0 comentarios
Comentar »