OpenAI presenta el agente ChatGPT, que puede controlar el ordenador y realizar tareas por el usuario

Benzo
Dentro del campo de la IA hay dos grandes tendencias: los navegadores web como Comet de Perplexity y los agentes, que esperan abrir una nueva era. OpenIA está en las dos guerras y hoy ha presentado su nueva arma: el agente ChatGPT, una herramienta que por sus características y funciones que incluyen completar tareas complejas de varios pasos en nombre del usuario, va más allá de los chatbots. Eso sí, hay que tener en cuenta que es un producto experimental que puede tratar con datos personales y cuya seguridad no está garantizada.

El agente ChatGPT está alimentado por un nuevo modelo entrenado para la ocasión y que aún no ha sido bautizado. Sí sabemos que tiene a su disposición todas las herramientas web, incluyendo un navegador visual que interactúa con la web mediante una interfaz gráfica de usuario, un navegador basado en texto para consultas web basadas en el razonamiento y acceso directo a la API. OpenAI explica que el modelo que impulsa el agente "está entrenado específicamente para identificar y aprovechar las herramientas más eficaces para cada paso de la tarea, evaluando los resultados en lugar de seguir un único método fijo".

En resumen, el agente ChatGPT integra Operator, un agente experimental capaz de interactuar directamente con sitios web mediante su propio navegador, y Deep Research, una herramienta de razonamiento web en múltiples pasos. El triunvirato para ofrecer un sistema unificado y autónomo se completa con las habilidades conversacionales de ChatGPT. Gracias a sus características, el modelo que usa el agente aprende de forma dinámica mientras realiza las tareas y cada vez que las completa lo hace forma más eficiente.


¿Cómo se usa? OpenAI pone de ejemplo pedirle al agente ChatGPT que consulte el calendario e informe sobre las próximas reuniones con clientes en base a las últimas noticias, que planifique y compre ingredientes para hacer un desayuno japonés para cuatro personas, o que analice tres competidores y cree una presentación. Una vez hecha la consulta, el agente navegará por la web de "forma inteligente", filtrará los resultados, pedirá iniciar sesión cuando sea un requisito, ejecutará código, realizará análisis y si es necesario entregará una presentación visual o una hoja de cálculo con un resumen.

OpenAI asegura que el usuario tiene el control del agente ChatGPT, que siempre pide permiso antes de realizar acciones importantes. Además, el usuario puede interrumpir el proceso en cualquier momento, tomar el control o detener las tareas. A pesar de insistir en la seguridad, Sam Altman, director ejecutivo de OpenAI, dice en X que usar el agente expone al usuario a ciertos riesgos y asegura que se debe tratar la herramienta como algo "experimental". El ejecutivo comenta que un tercero podría engañar al agente de IA para que proporcione información privada o realice acciones que no debería "de maneras que no podemos predecir".

"Recomendamos dar a los agentes el acceso indispensable para completar una tarea con el objetivo de reducir los riesgos para la privacidad y la seguridad", dice Altman.

Respecto a la disponibilidad, el agente ChatGPT empieza hoy su despliegue para los usuarios Pro, Plus y Team, y llegará este mes a los Enterprise y Education. Por ahora no se puede activar en la Unión Europea. Los usuarios Pro tienen tareas "casi ilimitadas", mientras que el resto de usuarios de pago disponen de 50 tareas mensuales. Todos aquellos que lo usen deben saber que el agente está en fase inicial y debe tratarse como una beta. La próxima versión con resultados más pulidos, mejor formato y más opciones ya se encuentra en fase de entrenamiento.

Sobre el autor » Benzo

Empecé con una NES a finales de los 80 y todos los 90 los pasé junto a SNES, N64 y una PlayStation prestada. El nuevo siglo me trajo una PS2 y más adelante una Xbox. Jugador de PC desde hace años, seguidor de Blizzard, lector y seriéfilo.

Más publicaciones de Benzo »

Avatar de Benzo
Síguelo en