OpenAI GPT-5.4: la IA para trabajo profesional

Aventura Universal » General » OpenAI GPT-5.4: inteligencia artificial para el trabajo profesional

GPT-5.4 es el modelo más avanzado de OpenAI para trabajo profesional, con variantes estándar, Thinking y Pro adaptadas a distintos niveles de exigencia.
Su gran novedad es el uso nativo del ordenador, permitiendo a agentes de IA operar aplicaciones, automatizar flujos de trabajo y ejecutar tareas reales.
Incorpora ventana de contexto de hasta un millón de tokens, mejoras fuertes en hojas de cálculo, presentaciones y benchmarks como GDPval y OSWorld.
Ofrece mayor eficiencia en tokens y un 33 % menos de errores fácticos que GPT-5.2, lo que lo vuelve especialmente atractivo para despachos, consultoras y startups.

La irrupción de GPT-5.4 de OpenAI está cambiando de raíz la forma en la que entendemos la inteligencia artificial aplicada al trabajo. Ya no hablamos solo de un modelo que responde bien a preguntas o genera textos vistosos; estamos ante un sistema capaz de usar el ordenador como lo haría una persona, navegar por aplicaciones, automatizar flujos de trabajo complejos y producir entregables profesionales con un nivel que empieza a competir con muchos perfiles humanos.

Este nuevo modelo frontier se ha diseñado pensando en el trabajo intelectual y profesional: despachos, asesorías, consultoras, departamentos financieros, legales o de operaciones. GPT-5.4 reúne en un solo modelo los avances de OpenAI en razonamiento, programación, uso de herramientas y agentes autónomos, con mejoras contundentes en precisión fáctica, eficiencia en tokens y capacidad para desenvolverse en contextos muy extensos. Vamos a ver con calma por qué tantos expertos hablan ya de un salto de era en la productividad digital.

Qué es GPT-5.4 y por qué es tan diferente de modelos anteriores

GPT-5.4 es el modelo de lenguaje más avanzado de OpenAI hasta la fecha, pensado específicamente para tareas de trabajo del conocimiento (knowledge work): análisis financiero, redacción de informes técnicos, trabajos legales, consultoría, programación o análisis de datos. OpenAI lo describe como su modelo “más capaz y eficiente para el trabajo profesional”, integrando en una sola arquitectura todo lo aprendido en versiones previas en razonamiento, codificación y flujos de trabajo agénticos.

La gran ruptura con generaciones anteriores es que GPT-5.4 no solo genera texto o código: está preparado para operar un ordenador de forma nativa. Gracias a esta capacidad, puede abrir aplicaciones, moverse por interfaces gráficas, completar formularios, modificar archivos o navegar por la web, tomando decisiones paso a paso para lograr el objetivo que le pida el usuario. En lugar de decirte cómo hacer algo, puede directamente hacerlo por ti bajo supervisión.

OpenAI subraya que este modelo logra niveles récord en tareas reales de trabajo, con mejoras claras frente a GPT-5.2 tanto en precisión como en coste efectivo por tarea: gracias a un uso mucho más eficiente de los tokens, necesita menos contexto para resolver problemas complejos, algo clave para empresas que integran la IA en procesos productivos con gran volumen de llamadas a la API.

En el plano estratégico, GPT-5.4 llega en un momento delicado para OpenAI, con debates públicos intensos sobre su colaboración con organismos gubernamentales y una competencia feroz por parte de Anthropic y Google. La compañía necesita un golpe en la mesa, y este modelo está llamado precisamente a reforzar su liderazgo técnico y a reconquistar a parte de los usuarios y empresas que miraban con recelo sus últimos movimientos.

Versiones de GPT-5.4: estándar, Thinking y Pro

Para adaptarse a distintos tipos de uso, OpenAI ha lanzado varias variantes de GPT-5.4 que comparten la misma base pero afinan su comportamiento para diferentes necesidades. Esto permite elegir entre mayor profundidad de razonamiento, máximo rendimiento en producción o uso general equilibrado.

La versión base se denomina simplemente GPT-5.4 y está orientada a un uso generalista, tanto en ChatGPT como en la API y en Codex. Es el modelo adecuado para quienes quieren un equilibrio entre coste, velocidad y calidad de respuesta en tareas de trabajo intelectual, sin llegar al nivel de exigencia extremo de grandes empresas o desarrollos muy intensivos.

Por encima se sitúa GPT-5.4 Thinking, una variante optimizada para razonamiento complejo y análisis profundo. En ChatGPT se presenta precisamente con este apellido, y su principal característica diferencial es que puede mostrar un plan inicial o esbozo de su proceso de pensamiento antes de terminar la respuesta, permitiendo al usuario ajustar la dirección sobre la marcha. Esta vista anticipada del razonamiento ayuda a guiar al modelo hacia el resultado exacto deseado, sin tener que reiniciar la conversación ni encadenar múltiples iteraciones.

La tercera variante es GPT-5.4 Pro, pensada para entornos empresariales exigentes que requieren máximo rendimiento en tareas complejas y a gran escala. Es la opción para compañías que necesitan generar grandes volúmenes de análisis financieros, documentación ejecutiva o automatizaciones extensas con agentes. A nivel de benchmarks, Pro suele marcar los mejores resultados, especialmente en pruebas de razonamiento abstracto como ARC-AGI.

Figma Make revoluciona el prototipado con IA: acceso, funciones y nuevos retos

Estas versiones están disponibles tanto en ChatGPT (para usuarios de planes Plus, Team y Pro) como a través de la API de OpenAI y la plataforma Codex, lo que facilita que tanto usuarios finales como desarrolladores integren sus capacidades en productos, servicios y flujos de trabajo internos.

La gran revolución: IA que sabe usar el ordenador

La novedad más llamativa de GPT-5.4 es su capacidad de uso nativo del ordenador, lo que en la práctica supone un antes y un después para los llamados agentes de IA. Ya no hablamos de un asistente limitado a escribir instrucciones; hablamos de un sistema que, a través de un agente, puede tomar el control de un escritorio y llevar a cabo acciones concretas como lo haría una persona.

OpenAI explica que el modelo es capaz de interpretar la interfaz del sistema a partir de capturas de pantalla. Con esa información visual, GPT-5.4 puede decidir dónde hacer clic, qué campos rellenar o qué menús abrir. Para hacerlo, emite comandos de teclado y ratón de forma lógica, secuenciando cada paso y corrigiendo el rumbo si algo no sale como estaba previsto, igual que haría un usuario humano experimentado.

Entre las acciones concretas que puede realizar este enfoque destacan tareas tan variadas como analizar capturas de pantalla, interactuar con interfaces gráficas, editar archivos, escribir comandos, navegar por páginas web o completar formularios. Eso abre la puerta a automatizar operaciones que antes requerían a un empleado saltando de una aplicación a otra: desde conciliar cuentas en un software financiero hasta subir documentación a plataformas de terceros.

En benchmarks específicamente diseñados para medir la capacidad de un modelo para manejar un ordenador real, los resultados son llamativos. En la prueba OSWorld-Verified, que evalúa la navegación de escritorio mediante capturas de pantalla y acciones virtuales de ratón y teclado, GPT-5.4 logra una tasa de éxito del 75 %. Esta cifra no solo supera ampliamente el 47,3 % alcanzado por GPT-5.2, sino que incluso mejora el rendimiento humano medio, cifrado en un 72,4 % según los creadores del benchmark.

Este tipo de capacidades encaja de maravilla con proyectos como OpenClaw, un agente de IA centrado precisamente en manejar tu equipo por ti. OpenAI ha incorporado al creador de este agente y todo apunta a que GPT-5.4 será el motor ideal para este tipo de soluciones, donde la clave no es tanto hablar con la IA como dejar que ejecute procesos completos bajo supervisión.

Ventana de contexto masiva y memoria para proyectos largos

Otro pilar fundamental de GPT-5.4 es su enorme capacidad de contexto. En la versión accesible vía API y Codex, el modelo puede trabajar con ventanas de hasta un millón de tokens, algo que multiplica las posibilidades en proyectos donde hay que manejar grandes cantidades de información sin perder coherencia ni referencias cruzadas.

En la práctica, esto significa que GPT-5.4 es capaz de cargar contratos jurídicos muy extensos, bases de datos documentales completas, repositorios de código de gran tamaño o colecciones de informes empresariales sin necesidad de trocearlos en múltiples consultas desconectadas. Para despachos legales, consultoras o departamentos financieros, esta memoria extendida abre la puerta a análisis mucho más fiables y profundos.

Por ejemplo, un despacho puede pedirle al modelo que revise cientos de contratos para localizar cláusulas problemáticas, inconsistencias o riesgos normativos concretos, manteniendo siempre la visión global del conjunto. Un equipo de producto puede cargar una base de código grande y solicitar refactorizaciones o análisis de arquitectura teniendo presente todo el sistema, no solo un archivo aislado.

GPT-5.4 también destaca en la llamada investigación profunda en la web. Es más eficiente a la hora de buscar información diseminada en muchas fuentes, identificar qué enlaces son realmente relevantes —especialmente en consultas tipo “aguja en un pajar”— y sintetizar los resultados en una respuesta clara, bien razonada y con menor tasa de errores fácticos que sus predecesores.

Además, el modelo ha sido entrenado para mantener mejor el contexto a lo largo de conversaciones largas. Esto le permite gestionar flujos de trabajo extensos, en los que se vuelve sobre temas tratados varios pasos antes, sin perder el hilo ni repetir preguntas básicas, algo muy útil en proyectos colaborativos donde varios miembros del equipo interactúan con el mismo agente durante días.

Verifactu: qué cambia, quién debe adaptarse y cómo prepararte

Rendimiento en benchmarks: del trabajo profesional a la abstracción

Si bajamos a los números, GPT-5.4 se sitúa en la parte alta de prácticamente todos los benchmarks relevantes para el trabajo profesional y técnico. Estos tests no son simples ejercicios académicos, sino que buscan simular tareas reales que ejecutan abogados, financieros, consultores o analistas.

En el benchmark GDPval, creado por la propia OpenAI para medir la capacidad de los modelos en tareas de trabajo de conocimiento en 44 profesiones diferentes, GPT-5.4 iguala o supera a profesionales humanos en el 83 % de las comparaciones, una mejora clara frente al 70,9 % registrado por GPT-5.2. Aquí entran actividades como crear modelos financieros, preparar presentaciones ejecutivas, elaborar informes técnicos o diseñar documentos estratégicos.

En el terreno de las hojas de cálculo, un área clave para banca de inversión y análisis financiero, los avances son especialmente llamativos. En pruebas internas, GPT-5.4 alcanza una precisión de alrededor del 87 % en tareas de modelado de hojas de cálculo, frente al 68 % aproximado de su versión anterior. Esta diferencia implica que el modelo comete muchos menos fallos en fórmulas, estructuras y lógica financiera.

Algo similar ocurre con las presentaciones. En evaluaciones con revisores humanos, las presentaciones generadas por GPT-5.4 fueron preferidas en torno al 68 % de las veces frente a las producidas por GPT-5.2, destacando por estar mejor estructuradas y resultar más claras visualmente. Para consultoras, departamentos de ventas o despachos que viven de presentar propuestas convincentes, esta mejora no es menor.

En pruebas de razonamiento abstracto como ARC-AGI 2, que se consideraban especialmente complicadas para las máquinas, GPT-5.4 da un salto impresionante. La variante Pro resuelve en torno al 83,3 % de las tareas (frente al 73,3 % del modelo estándar), cuando GPT-5.2 se quedaba alrededor del 52,9 %. Aunque en otras pruebas de programación el salto no sea tan espectacular, estos datos apuntan a una capacidad de abstracción mucho más cercana a la humana que en generaciones anteriores.

Eficiencia en tokens, menos errores y sistema de herramientas mejorado

Uno de los factores que más miran las empresas al evaluar si migrar a un modelo nuevo es el coste efectivo por tarea. GPT-5.4 ha sido diseñado para ser mucho más eficiente en el uso de tokens, lo que significa que necesita menos texto de entrada y produce salidas más ajustadas sin sacrificar calidad, reduciendo el coste total por operación incluso aunque el precio por millón de tokens sea más alto que el de modelos previos.

OpenAI detalla que, en un conjunto de indicaciones en las que los usuarios habían marcado errores fácticos en versiones anteriores, las afirmaciones individuales de GPT-5.4 son un 33 % menos propensas a ser falsas, y las respuestas completas presentan un 18 % menos de probabilidades de contener errores respecto a GPT-5.2. Esto sitúa a GPT-5.4 como el modelo “más fáctico” de la compañía hasta ahora, algo clave en sectores sensibles como el legal o el fiscal.

En cuanto a la gestión de herramientas externas, GPT-5.4 introduce un sistema de “Tool Search” o búsqueda de herramientas que cambia la forma de trabajar con grandes ecosistemas de funciones. En lugar de cargar todas las definiciones de herramientas en cada prompt —lo que disparaba el consumo de tokens—, el modelo recupera de forma dinámica solo las herramientas que necesita en cada momento, reduciendo costes y mejorando tiempos de respuesta.

Esta mejora resulta especialmente útil para startups y equipos técnicos que construyen agentes complejos con decenas o cientos de herramientas disponibles. Ahora, GPT-5.4 es capaz de identificar qué función concreta le conviene usar en cada paso, sin perder capacidad de razonamiento ni ahogarse en definiciones interminables que apenas se utilizan.

La suma de todo esto se traduce en respuestas más rápidas, menor coste por tarea compleja, más estabilidad en flujos de trabajo largos y, en general, una experiencia más fiable para quienes dependen de la IA como pieza central de sus operaciones diarias, tanto en ChatGPT como a través de integraciones personalizadas.

Integración en ChatGPT, API y Codex para trabajo real

GPT-5.4 se ha integrado de forma transversal en el ecosistema de OpenAI, llegando tanto a usuarios particulares como a empresas y desarrolladores. En ChatGPT, aparece como GPT-5.4 Thinking para quienes usan planes de pago, permitiendo beneficiarse de su razonamiento profundo, su capacidad de planificar antes de responder y su mayor fiabilidad en consultas complejas.

Indra y Bittium se alían para desarrollar radios definidas por software en defensa

Cuando se utiliza dentro del propio ChatGPT, el modelo sigue limitado al marco de integraciones del chatbot, como acceso a Google Drive, servicios de terceros tipo Spotify o herramientas creativas como Adobe Photoshop, dependiendo de las conexiones que habilite OpenAI. Aun así, la mejora en razonamiento y contexto ya se nota en tareas habituales como redactar informes, preparar presentaciones o analizar documentos largos.

Donde GPT-5.4 despliega todo su potencial agéntico es a través de la API de OpenAI y de Codex. En este entorno, el modelo puede trabajar con agentes capaces de interactuar directamente con el sistema operativo: abrir programas, editar archivos locales, ejecutar scripts o navegar por la web de forma autónoma. Esto permite construir soluciones a medida que automatizan procesos de negocio completos.

OpenAI menciona explícitamente el uso de librerías como Playwright para que los agentes basados en GPT-5.4 puedan controlar navegadores y aplicaciones web de manera robusta. Así, un founder o un equipo de operaciones puede delegar tareas repetitivas —como descargar informes periódicos, actualizar registros en un CRM o procesar pedidos— en un agente de IA que usa el modelo como cerebro.

Además, GPT-5.4 está pensado para trabajar bien con múltiples herramientas en flujos de trabajo amplios, combinando acceso a APIs de terceros, bases de datos internas y aplicaciones de escritorio. La IA ya no se queda en el papel de asesor que te dice lo que deberías hacer; se convierte en un asistente operativo que, respetando las políticas de seguridad y la supervisión humana, se remanga y ejecuta las tareas en tu lugar.

Impacto en despachos profesionales, empresas y founders

Todo este despliegue tecnológico tendría poco sentido si no se tradujera en cambios concretos en la forma de trabajar. En sectores como despachos profesionales, asesorías fiscales, consultoras, departamentos legales o equipos financieros, GPT-5.4 permite automatizar y acelerar tareas que hasta ahora consumían horas de trabajo de perfiles cualificados.

En el ámbito jurídico, por ejemplo, GPT-5.4 puede encargarse de revisar contratos extensos, comparar versiones, resumir cláusulas relevantes, detectar posibles riesgos normativos y sugerir modificaciones, todo ello manteniendo en memoria grandes volúmenes de documentación relacionada gracias a su ventana de contexto ampliada. Y, con su capacidad de uso del ordenador, puede incluso interactuar con bases de datos de jurisprudencia o plataformas de gestión de expedientes.

En despachos de asesoría y consultoría financiera, el modelo destaca en tareas como la elaboración de modelos financieros avanzados, análisis de datos fiscales, generación de dashboards y preparación de informes para clientes. Sus mejoras en hojas de cálculo lo convierten en un aliado evidente para bancas de inversión o equipos de corporate finance que viven pegados a Excel o Google Sheets.

Para founders y equipos de startups, GPT-5.4 supone una herramienta para automatizar operaciones internas: agentes que actualizan CRMs, gestionan tickets de soporte, consolidan datos de distintas fuentes, preparan reportes semanales o coordinan campañas de marketing digital. Todo ello se puede orquestar desde un único modelo que entiende el objetivo, planifica los pasos, usa las herramientas adecuadas y verifica los resultados.

Este movimiento acelera una tendencia que muchos expertos veían venir: el paso de asistentes conversacionales a agentes de inteligencia artificial capaces de trabajar de verdad. Modelos como GPT-5.4 están diseñados para entender un objetivo, descomponerlo en tareas, usar software y aplicaciones, ejecutar cada paso y comprobar si se ha conseguido lo que se buscaba, cerrando el ciclo de una forma cada vez más autónoma.

Todo apunta a que vamos hacia un escenario donde el profesional humano se centra en la estrategia, la toma de decisiones y la supervisión, mientras que agentes basados en GPT-5.4 se encargan del trabajo operativo y documental. La clave, al menos por ahora, será aprender a diseñar bien los flujos de trabajo, establecer controles y aprovechar la IA como palanca de productividad sin perder el control sobre los procesos críticos.

Con GPT-5.4, OpenAI ha colocado sobre la mesa un modelo que combina razonamiento avanzado, uso de ordenador, enorme capacidad de contexto, eficiencia en costes y mejor fiabilidad fáctica. Todo ello dibuja un panorama en el que la inteligencia artificial deja de ser un complemento curioso y pasa a integrarse en el corazón mismo del trabajo profesional, abriendo nuevas formas de organizar equipos, proyectos y negocios enteros alrededor de agentes digitales capaces de hacer, no solo de aconsejar.

Empleo 4.0: cómo la revolución digital transforma el trabajo