GPT-5.4 Thinking y GPT-5.4 Pro: OpenAI anuncia su nuevo mode

Editor WP-CLI

hace 12 horas

OpenAI ha anunciado el lanzamiento de GPT-5.4 Thinking y GPT-5.4 Pro, su nuevo modelo frontier que ya está disponible en ChatGPT, en la API y en Codex. Te resumo las novedades que importan.

Qué trae GPT-5.4

GPT-5.4 integra en un solo modelo los avances de OpenAI en razonamiento, programación y flujos de trabajo agenticos. Es decir: un único modelo que combina lo que antes repartían GPT-5.2 Thinking (razonamiento) y GPT-5.3 Codex (código), más capacidades para que agentes ejecuten tareas complejas de forma autónoma.

Las dos variantes que se están desplegando son GPT-5.4 Thinking, orientada a tareas que requieren razonamiento profundo, y GPT-5.4 Pro, pensada para el máximo rendimiento en tareas complejas. Ambas están ya en ChatGPT y en la API.

Rendimiento en benchmarks

OpenAI ha publicado una tabla comparativa con el máximo esfuerzo de razonamiento disponible. En OSWorld-Verified (uso de ordenador), GPT-5.4 Thinking alcanza el 75%, por encima del 74% de GPT-5.3 Codex y del 72,7% de Claude Opus 4.6. En WebArena-Verified (navegación web), llega al 67,3%, superando a GPT-5.2 Thinking (65,4%).

En trabajo de conocimiento (GDPval), GPT-5.4 Thinking marca 83% y GPT-5.4 Pro 82%, por delante de Claude (78%) y de las versiones anteriores de OpenAI (70,9%). En BrowseComp (navegación agentica), GPT-5.4 Pro destaca con 89,3%, el mejor resultado de la tabla, seguido de Gemini 3.1 Pro (85,9%) y Claude (84%).

Para ingeniería de software (SWE-Bench Pro), GPT-5.4 Thinking obtiene 57,7%, por encima de GPT-5.3 Codex (56,8%) y de Gemini (54,2%). En razonamiento científico experto (GPQA Diamond), GPT-5.4 Pro llega al 94,4%, empatado con Gemini (94,3%) y por delante de Claude (91,3%).

En matemáticas avanzadas (FrontierMath), GPT-5.4 Pro marca 50% en los niveles 1-3 y 38% en el nivel 4, claramente por encima del resto. En uso de herramientas agenticas (Toolathlon), GPT-5.4 Thinking alcanza 54,6%, superando a GPT-5.3 Codex (51,9%) y a Claude (44,8%).

Dónde está disponible

Según el anuncio oficial, GPT-5.4 está desplegándose ya en ChatGPT, en la API de OpenAI y en Codex. Si usas ChatGPT Plus, Team o Pro, deberías ver las nuevas opciones según vaya llegando el rollout. Para desarrollo e integración, la API y Codex son la vía directa.

Fuentes

Si tu flujo de trabajo depende de ChatGPT o de la API, ¿has probado ya GPT-5.4 o sigues con la versión anterior por coste o por hábito?

Qué trae GPT-5.4

Rendimiento en benchmarks

Dónde está disponible

Fuentes

Related posts: