OpenAI presenta GPT-5.5, su modelo más intuitivo y el mejor en programación y uso autónomo del ordenador

Benzo
    8
Noticias » Tecnología
La carrera por poner en manos de los usuarios modelos de IA no se detiene. Un mes y medio después de lanzar GPT 5.4 y cuando aún resuena el anuncio de Claude Mythos por parte de Anthropic, OpenAI presenta GPT-5.5, un nuevo modelo que según la compañía es el mejor en programación, uso autónomo del ordenador e investigación científica.

GPT-5.5 es un modelo que asegura comprender más rápido lo que el usuario quiere hacer y tiene la capacidad de realizar una gran parte del trabajo por sí mismo. OpenAI dice que se trata de un modelo que destaca en escritura y programación de código, análisis de datos, investigación, creación de documentos y hojas de cálculo, uso de software y alternancia entre herramientas para completar una tarea. Los modelos de IA generativa actuales se están especializando en programación y en la capacidad de llevar a cabo tareas cada vez más complejas, cosa que consiguen empleando agentes y diferentes instrumentos.

"En lugar de gestionar con detalle cada paso, puedes asignarle a GPT-5.5 una tarea compleja y en múltiples partes, y confiar en que podrá planificar, usar las herramientas y verificar su propio trabajo, navegar a través de la ambigüedad y avanzar", dice OpenAI. Las mejoras de este modelo son "especialmente notables" en la programación con agentes, que son capaces de escribir, probar y modificar código sin apenas intervención humana, el uso autónomo de un ordenador o la investigación científica. En otras palabras, es mejor en áreas donde se requiere un razonamiento prolongado y toma de decisiones.


OpenAI asegura que el salto en inteligencia que ha dado GPT-5.5 no ha afectado a su velocidad, pues este nuevo modelo iguala la latencia por token de GPT-5.4. La latencia por token es el tiempo que un modelo de lenguaje tarda en generar texto (token). Además, la compañía sostiene que GPT-5.5 usa menos tokens para completar las mismas tareas de Codex, así que gana tanto en capacidad como en eficiencia. Codex es un agente de ingeniería de software basado en la nube capaz de escribir, corregir y ejecutar código.

GPT-5.5 llega acompañado de un conjunto de medidas de seguridad diseñado para reducir el mal uso en áreas como la ciberseguridad y biología. Cada vez que se lanza un nuevo modelo, ya sea de OpenAI, Anthropic, Google o cualquier otra compañía, se pone énfasis en la implantación de protecciones. Modelos como Claude Mythos han logrado encontrar de forma autónoma vulnerabilidades zero-day en sistemas operativos y navegadores. Se trata de una herramienta tremendamente poderosa, siempre que esté en manos correctas.


OpenAI ha mostrado el rendimiento de GPT‑5.5 y GPT‑5.5 Pro en diferentes benchmarks y como era de esperar ha ganado a la competencia. GPT‑5.5 se encuentra disponible desde hoy mismo para los usuarios Plus, Pro, Business y Enterprise de ChatGPT y Codex. El acceso mediante API requiere de medidas de seguridad y llegará más adelante.
8 comentarios
  1. 5.5? No me hagáis soltar el chiste... [666]
  2. un pasito menos para acercarse a Skynet... tic tac

    salu2
  3. La gente nota diferencia a estas alturas entre uno y otro? del 2 al 3 si habia diferencia pero esto ya parece cuando te compras unos auriculares de 1000 euros para notar una diferencia de un 1% solo en años bisiestos.
  4. En mayo termino la pro de claude y después de año y pico volveré a probar una sub de GPT a ver que tal está. A estas alturas ya todas procesan bien para mis necesidades, pero todas se atascan al subirle documentos de cientos de páginas, no logran leerlos enteros o memorizarlos. Aunque Claude me ha sorprendido en este aspecto, si GPT no la iguala como mínimo, vuelvo a ella.
  5. @SuperPadLand

    Ni gestionan archivos grandes sin tener que fraccionarlos.
  6. Antigravity de Google, eso sí que es una maravilla, es un Fork de Visual studio Code con agente IA, te analiza todo el proyecto al momento, te da un plan de los cambios y donde va cada cosa, luego tú ya confirmas o le pides nuevos cambios.
  7. Pararegistros escribió:@SuperPadLand

    Ni gestionan archivos grandes sin tener que fraccionarlos.


    No lo he necesitado, pero Gemini y Claude permiten darles acceso a Google drive y leer los archivos desde ahí, supongo que es la forma de que puedan leer archivos de varios gigas. Pero ni idea, lo mio pesa megas porque es "muxo texto" y ya.
  8. Yo creo que open ai va a ser de los que van a caer cuando explote la burbuja.. Claude y Gemini van mucho mejor en casi todo. A veces ser el primero no es tener la ventaja o ser el ganador

    Al menos no les va tan mal como a meta o Microsoft. Aunque estos 2 tienen la ventaja de tener un negocio diversificado en otras cosas no ia.
Ver más comentarios »