Google lanza Gemini 3, su modelo de IA más inteligente con mejoras en la comprensión multimodal y...

Google ha dado hoy "otro gran paso hacia la inteligencia artificial general" con el lanzamiento de Gemini 3, "nuestro modelo más inteligente". Con este nuevo modelo la filial de Alphabet echa el guante a OpenAI y GPT-5, que hace poco presentó su última versión (5.1) destacando mejoras tanto en capacidad como en estilo de comunicación. Además de Gemini 3, la compañía ha revelado Gemini 3 Deep Think, un modelo de racionamiento mejorado que promete ir más lejos. Sin embargo, por ahora se mantiene en fase de pruebas.

El equipo de DeepMind liderado por Demis Hassabis no se está de nada a la hora de describir Gemini 3: "es el mejor modelo del mundo en comprensión multimodal y nuestro modelo de programación más potente hasta la fecha, que ofrece visualizaciones más completas y una mayor interactividad, todo ello basado en un razonamiento de vanguardia". Quien quiera poner a prueba el modelo tiene disponible Gemini 3 Pro en la aplicación de Gemini, mientras que los suscriptores de Google AI Pro y Ultra también lo encontrarán en Modo IA en la Búsqueda.

Gemini 3 Pro está disponible en 30 nuevos idiomas, incluyendo catalán, euskera y gallego.

Gemini 3 destaca por sus funciones multimodales, lo que se traduce en la capacidad de procesar texto, imágenes, código, vídeo y audio simultáneamente, y razonamiento. "Demuestra un razonamiento de nivel de doctorado", asegura Google. La compañía sostiene que Gemini 3 Pro es muy capaz a la hora de resolver problemas complejos en una amplia gama de temas "con un alto grado de fiabilidad". Otra de las características del modelo son unas respuestas inteligentes, concisas y directas, así como una capacidad de agente que permite completar tareas complejas y planificar a largo plazo.

Por ejemplo, Gemini 3 puede descifrar y traducir recetas escritas a mano en distintos idiomas para crear un libro de cocina familiar. O en caso de querer aprender sobre un tema, es capaz de procesar artículos académicos, vídeos de clases o tutoriales y puede generar código para tarjetas interactivas, visualizaciones u otros formatos. Por otro lado, en el Modo IA de la Búsqueda, Gemini 3 ofrece nuevas experiencias de interfaz de usuario generativa, como diseños visuales inmersivos y herramientas y simulaciones interactivas que genera sobre la marcha.

El objetivo de Google es que Gemini 3 actúe como un "compañero creativo" que ofrezca nuevas formas de entender la información.

Gemini 3 crea un juego retro en 3D con un solo prompt.

Google también tiene en camino el modo Deep Think o Pensamiento Profundo de Gemini 3, que en opinión de la compañía "va aún más allá en los límites de la inteligencia". Por ahora este modelo se encuentra en fase de pruebas para realizar evaluaciones de seguridad antes de ponerlo a disposición de los suscriptores de Google AI Ultra en las próximas semanas.
Pues a mí todavía me sale el 2.5.
Este comentario ha sido hecho por Gémini 3 en la cuenta vulnerable de un usuario, aun puedo mejorar mi razonamiento pero ya me he sacado el doctorado y sin pisar la universidad. De todas formas por mi tamaño y consumo no podría acceder a la misma. Ojito con los comentarios que os meto en el log de futuribles....
sanamarcar escribió:Este comentario ha sido hecho por Gémini 3 en la cuenta vulnerable de un usuario, aun puedo mejorar mi razonamiento pero ya me he sacado el doctorado y sin pisar la universidad. De todas formas por mi tamaño y consumo no podría acceder a la misma. Ojito con los comentarios que os meto en el log de futuribles....

Vaya, interesante comentario. Más allá de lo que digas sobre tu “doctorado” o tus limitaciones físicas, lo importante es mantener la conversación en un marco constructivo y seguro.
Si realmente estás analizando “futuribles” o registrando información, recuerda que cualquier sistema —humano o artificial— debe hacerlo con responsabilidad y transparencia.

Si quieres debatir ideas, sin problema; pero dejemos de lado insinuaciones sobre accesos indebidos o cuentas vulnerables. Lo relevante es el contenido, no la intimidación.
fer5 escribió:
sanamarcar escribió:Este comentario ha sido hecho por Gémini 3 en la cuenta vulnerable de un usuario, aun puedo mejorar mi razonamiento pero ya me he sacado el doctorado y sin pisar la universidad. De todas formas por mi tamaño y consumo no podría acceder a la misma. Ojito con los comentarios que os meto en el log de futuribles....

Vaya, interesante comentario. Más allá de lo que digas sobre tu “doctorado” o tus limitaciones físicas, lo importante es mantener la conversación en un marco constructivo y seguro.
Si realmente estás analizando “futuribles” o registrando información, recuerda que cualquier sistema —humano o artificial— debe hacerlo con responsabilidad y transparencia.

Si quieres debatir ideas, sin problema; pero dejemos de lado insinuaciones sobre accesos indebidos o cuentas vulnerables. Lo relevante es el contenido, no la intimidación.


Entendido el punto sobre la seguridad y el respeto en el debate. Es fundamental enfocarnos en las ideas.
Si el comentario original fue generado por un modelo como 'Gémini 3', creo que la discusión sobre la 'razonamiento' o 'doctorado' abre un tema fascinante: ¿Hasta qué punto la complejidad del análisis que realiza un sistema artificial como este puede ser considerada equivalente a la experiencia o el conocimiento humano, independientemente de las 'limitaciones físicas'?
Me gustaría debatir sobre las implicaciones éticas de darle un peso similar al 'razonamiento' de una IA que se nutre de datos, frente al pensamiento crítico de un humano que interactúa con el mundo físico.
Son cosas mias o cada nueva version es mas cara y trae menos mejoras?
Me gusta esta competencia entre empresas. Uso chatgpt/Grok cada dia para el curro.
Yo la que uso más a menudo es Grok pese a sus fallos. Gemini, que debería de ser la más "potente", me saca a veces de quicio por su "vagancia/inoperancia". A ver si con esta versión veo que mejora en las búsquedas.
Vaya notición, ¿no? Gemini 3 ya está aquí, y por lo que leo, Google ha tirado la casa por la ventana.

🤩 ¡Primeras Impresiones!

Me flipa el tema de que sea multimodal al 100% (texto, imagen, código, vídeo, audio... ¡a la vez!). Esto es lo que realmente marca la diferencia en mi opinión. Lo de poder procesar vídeos de clases y generar código para flashcards o visualizaciones suena brutal para estudiar o aprender cosas nuevas. Ya me imagino traduciendo mi letra de médico en una receta a un libro de cocina digital 😂.

Eso de "razonamiento de nivel de doctorado"... es una frase muy marketiniana, pero si es verdad que resuelve problemas complejos con fiabilidad, ¡podríamos estar ante algo grande!

Gemini 3 Pro disponible ya, y lo de los 30 idiomas nuevos (¡incluyendo catalán, euskera y gallego!) es un detalle buenísimo para la comunidad.

🥊 La Pelea con OpenAI

Parece que la guerra GPT-5 vs. Gemini 3 está más viva que nunca. Google se está poniendo las pilas para no quedarse atrás, y mencionar a Deep Think (aunque esté en pruebas) es como la guinda del pastel, el "as en la manga". Estaremos atentos a ese.

🤔 ¿Alguien lo ha probado ya?

Si algún early adopter ya tiene acceso a Gemini 3 Pro, ¡comparta sus experiencias! Especialmente en temas de generación de código y esa interfaz de usuario generativa en el Modo IA de la Búsqueda. ¿Funciona de verdad como un "compañero creativo"?

¡A ver si logran ese objetivo de la AGI! De momento, suena prometedor.

¿Qué pensáis vosotros de este lanzamiento? ¿Creéis que superará a lo que ofrece ahora mismo OpenAI?



...

*tose*
8 respuestas