OpenAI ha anunciado el lanzamiento de GPT-5.4 Thinking y GPT-5.4 Pro, su nuevo modelo frontier que ya está disponible en ChatGPT, en la API y en Codex. Te resumo las novedades que importan.
Qué trae GPT-5.4
GPT-5.4 integra en un solo modelo los avances de OpenAI en razonamiento, programación y flujos de trabajo agenticos. Es decir: un único modelo que combina lo que antes repartían GPT-5.2 Thinking (razonamiento) y GPT-5.3 Codex (código), más capacidades para que agentes ejecuten tareas complejas de forma autónoma.
Las dos variantes que se están desplegando son GPT-5.4 Thinking, orientada a tareas que requieren razonamiento profundo, y GPT-5.4 Pro, pensada para el máximo rendimiento en tareas complejas. Ambas están ya en ChatGPT y en la API.
Rendimiento en benchmarks
OpenAI ha publicado una tabla comparativa con el máximo esfuerzo de razonamiento disponible. En OSWorld-Verified (uso de ordenador), GPT-5.4 Thinking alcanza el 75%, por encima del 74% de GPT-5.3 Codex y del 72,7% de Claude Opus 4.6. En WebArena-Verified (navegación web), llega al 67,3%, superando a GPT-5.2 Thinking (65,4%).
En trabajo de conocimiento (GDPval), GPT-5.4 Thinking marca 83% y GPT-5.4 Pro 82%, por delante de Claude (78%) y de las versiones anteriores de OpenAI (70,9%). En BrowseComp (navegación agentica), GPT-5.4 Pro destaca con 89,3%, el mejor resultado de la tabla, seguido de Gemini 3.1 Pro (85,9%) y Claude (84%).
Para ingeniería de software (SWE-Bench Pro), GPT-5.4 Thinking obtiene 57,7%, por encima de GPT-5.3 Codex (56,8%) y de Gemini (54,2%). En razonamiento científico experto (GPQA Diamond), GPT-5.4 Pro llega al 94,4%, empatado con Gemini (94,3%) y por delante de Claude (91,3%).
En matemáticas avanzadas (FrontierMath), GPT-5.4 Pro marca 50% en los niveles 1-3 y 38% en el nivel 4, claramente por encima del resto. En uso de herramientas agenticas (Toolathlon), GPT-5.4 Thinking alcanza 54,6%, superando a GPT-5.3 Codex (51,9%) y a Claude (44,8%).
Dónde está disponible
Según el anuncio oficial, GPT-5.4 está desplegándose ya en ChatGPT, en la API de OpenAI y en Codex. Si usas ChatGPT Plus, Team o Pro, deberías ver las nuevas opciones según vaya llegando el rollout. Para desarrollo e integración, la API y Codex son la vía directa.
Fuentes
- OpenAI’s new GPT-5.4 model is a big step toward autonomous agents – The Verge
- OpenAI’s GPT-5.4 sets new records on professional benchmarks – The Next Web
- GPT-5.4: Computer Use, Tool Search, Benchmarks, Pricing – Digital Applied
- GPT-5.4 Model – OpenAI API
- GPT-5.4: tareas profesionales – Marketscreener
Si tu flujo de trabajo depende de ChatGPT o de la API, ¿has probado ya GPT-5.4 o sigues con la versión anterior por coste o por hábito?
