OpenAI lanza GPT-5.4, su primer modelo orientado al control del ordenador del usuario mediante agentes

Alejo I
La lista de modelos de OpenAI sigue creciendo a velocidad de vértigo, ahora con la incorporación de GPT-5.4, una nueva versión que brinda las habituales mejoras en eficiencia de razonamiento (hacer más con menos tokens), programación y capacidad de trabajo general, pero con un as en la manga: es el primer modelo de OpenAI diseñado para controlar el PC mediante agentes.

En la práctica, esto supone que el GPT ya no solo es capaz de realizar labores en base a un prompt o proporcionar instrucciones, sino que puede generar entradas de teclado y ratón, desplazando el cursor sobre la pantalla buscando los iconos y menús adecuados para las funciones deseadas y haciendo todo tipo de trabajos, desde responder correos electrónicos a editar archivos, pasando por organizar calendarios. Todo ello como si lo estuviera haciendo el propio usuario.

Si bien la gestión del PC no es una novedad absoluta (hay otros modelos de propósito general con esta capacidad, al menos nominalmente), la adición de estas características a GPT-5.4 parece bastante más profunda y con un mayor potencial productivo que lo observado anteriormente. Para ello, eso sí, será necesario utilizar OpenAI Codex o la API de OpenAI, que facilitan la integración con herramientas como Google Drive o incluso Photshop para automatizar labores que anteriormente había que realizar a mano.


En cuanto a la fiabilidad, desde OpenAI se asegura que en la prueba OSWorld-Verified, utilizada para puntuar la navegación por un escritorio a través de capturas de pantalla y usando la combinación de teclado y ratón, el registro de GPT‑5.4 es del 75 %, superando así a los humanos (72,4 %), mientras que en el benchmark de navegación WebArena-Verified el éxito en las interacciones es del 67,3 % y en Online-Mind2Web llega al 92,8 %.

Las posibilidades de la utilización del PC en modo manos libres mediante IA son monumentales. Parafraseando a un redactor de PCWorld, bastaría por ejemplo con pedirle a GPT-5.4 "relléname los trimestrales" para que el PC lanzara VeriFactu y/o el programa correspondiente y se pusiera a trabajar en la declaración. Dicho esto, dada la novedad del asunto es comprensible que dejar las tributaciones en manos de una IA todavía sea un deporte de riesgo para muchos usuarios.
Fuente: OpenAI