OpenAI presentó el 5 de marzo de 2026 GPT‑5.4, su modelo de punta diseñado para tareas profesionales y disponible desde hoy en ChatGPT (como GPT‑5.4 Thinking), en la API (gpt-5.4) y en Codex. La compañía también puso en marcha una versión de mayor rendimiento, GPT‑5.4 Pro, dirigida a desarrolladores y a casos de uso más complejos.
Qué es GPT‑5.4 y qué cambia
GPT‑5.4 es un modelo de lenguaje grande (LLM, por sus siglas en inglés) que combina mejoras en razonamiento, programación y en la capacidad para trabajar con «agentes»: software que puede ejecutar flujos de trabajo en aplicaciones, navegar en páginas web y operar interfaces.
En términos sencillos, OpenAI describe al agente como una extensión del modelo que puede interactuar con herramientas externas —por ejemplo, abrir una hoja de cálculo, leer correos o hacer clic en una página— para completar tareas de varios pasos.
Entre las novedades técnicas destacan: contexto de hasta 1 millón de tokens (permitiendo trabajar en tareas largas), mejoras en eficiencia del razonamiento (usa menos tokens que GPT‑5.2) y capacidades nativas para «usar computadoras», como generar código con bibliotecas tipo Playwright y emitir comandos de ratón y teclado a partir de capturas de pantalla.
Rendimiento en tareas profesionales
OpenAI publica comparaciones con versiones anteriores y métricas de evaluación interna. En la prueba GDPval, que mide la capacidad de producir trabajo especializado en 44 ocupaciones, GPT‑5.4 igualó o superó a profesionales de la industria en 83.0% de las comparaciones (GPT‑5.2 obtuvo 70.9%).
En tareas de modelado de hojas de cálculo que realizaría un analista junior, GPT‑5.4 alcanzó 87.5% frente al 68.4% de GPT‑5.2. En evaluación de presentaciones, los evaluadores humanos prefirieron las de GPT‑5.4 el 68.0% de las veces sobre las de GPT‑5.2.
OpenAI también reporta mejoras en la precisión: en un conjunto de prompts anonimizados las afirmaciones individuales de GPT‑5.4 fueron 33% menos propensas a ser falsas y las respuestas completas 18% menos propensas a contener errores, comparado con GPT‑5.2.
Uso de la computadora, visión y agentes
GPT‑5.4 es, según OpenAI, el primer modelo de propósito general con capacidades nativas para operar computadoras y ejecutar flujos de trabajo en distintos entornos.
Esto incluye generación de scripts, interacción con interfaces a partir de capturas de pantalla y soporte para ajustar el comportamiento mediante mensajes de desarrollador y políticas de seguridad.
En pruebas de navegación y control de interfaz, GPT‑5.4 alcanzó 75.0% en OSWorld‑Verified (frente a 47.3% de GPT‑5.2) y superó el rendimiento humano reportado en esa evaluación (72.4%). En pruebas de uso de navegador también reportó mejoras (por ejemplo, Online‑Mind2Web 92.8% frente a 84.0% de un sistema anterior).
Además, la capacidad visual del modelo mejora la comprensión de imágenes densas y de alta resolución: la API ahora admite una fidelidad de entrada que, en el nivel “original”, permite hasta 10 millones de píxeles totales o una dimensión máxima de 6.000 píxeles.
Trabajo con herramientas y búsqueda de herramientas
Una mejora significativa es la «búsqueda de herramientas» en la API: en lugar de enviar al modelo la definición completa de decenas de miles de herramientas en cada solicitud, se le proporciona una lista ligera y una función para buscar la definición cuando la necesite.
OpenAI informa que, en una evaluación con 36 servidores MCP y 250 tareas, esto redujo el uso total de tokens un 47% manteniendo la precisión.
También se reportan mejoras en la llamada a herramientas por parte de agentes (es decir, decidir cuándo y cómo invocar APIs o conectores), con menor cantidad de turnos y mejor precisión en evaluaciones de flujos de trabajo reales.
Seguridad, disponibilidad y precios
OpenAI indica que despliega GPT‑5.4 con salvaguardas ampliadas: lo trata como de “alta capacidad cibernética” dentro de su marco de preparación, con controles de acceso, monitoreo y bloqueo o enrutamiento de solicitudes de mayor riesgo para ciertos clientes.
La empresa evaluó la posibilidad de que el modelo ofusque su razonamiento (Chain‑of‑Thought, CoT) y afirma que la «capacidad de controlabilidad de CoT» de GPT‑5.4 es baja, lo que consideran positivo para la supervisión.
En disponibilidad, GPT‑5.4 se implementa gradualmente en ChatGPT y Codex; en la API ya está como gpt-5.4 y gpt-5.4‑pro. En ChatGPT, la versión Thinking está disponible para suscriptores Plus, Team y Pro; Pro y Enterprise pueden acceder también a GPT‑5.4 Pro.
OpenAI publicó una tabla de precios por token para la API (por ejemplo, salida de gpt‑5.4: USD 15 / millón de tokens; gpt‑5.4‑pro: USD 180 / millón en salida).
Qué supone para las personas
Según la propia descripción de OpenAI, GPT‑5.4 apunta a mejorar tareas profesionales cotidianas —crear y editar documentos, hojas de cálculo, presentaciones y búsquedas web complejas— con respuestas más rápidas y menos iteraciones.
Para usuarios finales esto puede traducirse en asistentes más capaces al preparar informes, análisis sencillos o búsquedas profundas, siempre con las limitaciones y salvaguardas que OpenAI ha señalado.
Nota de Transparencia
Esta nota fue generada 100% con IA. La fuente fue aprobada por Diario Occidente y el contenido final fue revisado por un miembro del equipo de redacción.

El Resumen de Noticias sobre Inteligencia Artificial e Innovación Tecnológica, aquí 

Curaduría editorial
La curaduría y revisión editorial de estas notas está a cargo de Rosa María Agudelo Ayerbe, comunicadora social y periodista, con maestría en Transformación Digital y especialización en Inteligencia Artificial.
Desde su rol como líder del equipo de innovación y transformación digital del Diario Occidente, y a través de la unidad estratégica DO Tech, realiza un seguimiento permanente a las principales novedades en tecnología e inteligencia artificial a nivel global.
Estas notas se apoyan en un agente de investigación basado en inteligencia artificial, diseñado para monitorear semanalmente avances, lanzamientos y debates clave del sector.
El contenido es posteriormente leído, analizado, contextualizado y validado editorialmente antes de su publicación.
Este proceso forma parte del mecanismo de actualización continua que permite interpretar los desarrollos tecnológicos desde una mirada periodística, crítica y comprensible para audiencias no especializadas.

The post OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras appeared first on Diario Occidente.
OpenAI presentó el 5 de marzo de 2026 GPT‑5.4, su modelo de punta diseñado para tareas profesionales y disponible desde hoy en ChatGPT (como GPT‑5.4 Thinking), en la API (gpt-5.4) y en Codex. La compañía también puso en marcha una versión de mayor rendimiento, GPT‑5.4 Pro, dirigida a desarrolladores y a casos de uso más…
The post OpenAI lanza GPT‑5.4, un modelo pensado para trabajo profesional con agentes que pueden “usar” computadoras appeared first on Diario Occidente.
OpenAI presentó el 5 de marzo de 2026 GPT‑5.4, su modelo de punta diseñado para tareas profesionales y disponible desde hoy en ChatGPT (como GPT‑5.4 Thinking), en la API (gpt-5.4) y en Codex. La compañía también puso en marcha una versión de mayor rendimiento, GPT‑5.4 Pro, dirigida a desarrolladores y a casos de uso más complejos.
Qué es GPT‑5.4 y qué cambia
GPT‑5.4 es un modelo de lenguaje grande (LLM, por sus siglas en inglés) que combina mejoras en razonamiento, programación y en la capacidad para trabajar con «agentes»: software que puede ejecutar flujos de trabajo en aplicaciones, navegar en páginas web y operar interfaces.
En términos sencillos, OpenAI describe al agente como una extensión del modelo que puede interactuar con herramientas externas —por ejemplo, abrir una hoja de cálculo, leer correos o hacer clic en una página— para completar tareas de varios pasos.
Entre las novedades técnicas destacan: contexto de hasta 1 millón de tokens (permitiendo trabajar en tareas largas), mejoras en eficiencia del razonamiento (usa menos tokens que GPT‑5.2) y capacidades nativas para «usar computadoras», como generar código con bibliotecas tipo Playwright y emitir comandos de ratón y teclado a partir de capturas de pantalla.
Rendimiento en tareas profesionales
OpenAI publica comparaciones con versiones anteriores y métricas de evaluación interna. En la prueba GDPval, que mide la capacidad de producir trabajo especializado en 44 ocupaciones, GPT‑5.4 igualó o superó a profesionales de la industria en 83.0% de las comparaciones (GPT‑5.2 obtuvo 70.9%).
En tareas de modelado de hojas de cálculo que realizaría un analista junior, GPT‑5.4 alcanzó 87.5% frente al 68.4% de GPT‑5.2. En evaluación de presentaciones, los evaluadores humanos prefirieron las de GPT‑5.4 el 68.0% de las veces sobre las de GPT‑5.2.
OpenAI también reporta mejoras en la precisión: en un conjunto de prompts anonimizados las afirmaciones individuales de GPT‑5.4 fueron 33% menos propensas a ser falsas y las respuestas completas 18% menos propensas a contener errores, comparado con GPT‑5.2.
Uso de la computadora, visión y agentes
GPT‑5.4 es, según OpenAI, el primer modelo de propósito general con capacidades nativas para operar computadoras y ejecutar flujos de trabajo en distintos entornos.
Esto incluye generación de scripts, interacción con interfaces a partir de capturas de pantalla y soporte para ajustar el comportamiento mediante mensajes de desarrollador y políticas de seguridad.
En pruebas de navegación y control de interfaz, GPT‑5.4 alcanzó 75.0% en OSWorld‑Verified (frente a 47.3% de GPT‑5.2) y superó el rendimiento humano reportado en esa evaluación (72.4%). En pruebas de uso de navegador también reportó mejoras (por ejemplo, Online‑Mind2Web 92.8% frente a 84.0% de un sistema anterior).
Además, la capacidad visual del modelo mejora la comprensión de imágenes densas y de alta resolución: la API ahora admite una fidelidad de entrada que, en el nivel “original”, permite hasta 10 millones de píxeles totales o una dimensión máxima de 6.000 píxeles.
Trabajo con herramientas y búsqueda de herramientas
Una mejora significativa es la «búsqueda de herramientas» en la API: en lugar de enviar al modelo la definición completa de decenas de miles de herramientas en cada solicitud, se le proporciona una lista ligera y una función para buscar la definición cuando la necesite.
OpenAI informa que, en una evaluación con 36 servidores MCP y 250 tareas, esto redujo el uso total de tokens un 47% manteniendo la precisión.
También se reportan mejoras en la llamada a herramientas por parte de agentes (es decir, decidir cuándo y cómo invocar APIs o conectores), con menor cantidad de turnos y mejor precisión en evaluaciones de flujos de trabajo reales.
Seguridad, disponibilidad y precios
OpenAI indica que despliega GPT‑5.4 con salvaguardas ampliadas: lo trata como de “alta capacidad cibernética” dentro de su marco de preparación, con controles de acceso, monitoreo y bloqueo o enrutamiento de solicitudes de mayor riesgo para ciertos clientes.
La empresa evaluó la posibilidad de que el modelo ofusque su razonamiento (Chain‑of‑Thought, CoT) y afirma que la «capacidad de controlabilidad de CoT» de GPT‑5.4 es baja, lo que consideran positivo para la supervisión.
En disponibilidad, GPT‑5.4 se implementa gradualmente en ChatGPT y Codex; en la API ya está como gpt-5.4 y gpt-5.4‑pro. En ChatGPT, la versión Thinking está disponible para suscriptores Plus, Team y Pro; Pro y Enterprise pueden acceder también a GPT‑5.4 Pro.
OpenAI publicó una tabla de precios por token para la API (por ejemplo, salida de gpt‑5.4: USD 15 / millón de tokens; gpt‑5.4‑pro: USD 180 / millón en salida).
Qué supone para las personas
Según la propia descripción de OpenAI, GPT‑5.4 apunta a mejorar tareas profesionales cotidianas —crear y editar documentos, hojas de cálculo, presentaciones y búsquedas web complejas— con respuestas más rápidas y menos iteraciones.
Para usuarios finales esto puede traducirse en asistentes más capaces al preparar informes, análisis sencillos o búsquedas profundas, siempre con las limitaciones y salvaguardas que OpenAI ha señalado.
Nota de Transparencia
Esta nota fue generada 100% con IA. La fuente fue aprobada por Diario Occidente y el contenido final fue revisado por un miembro del equipo de redacción.

🔊 El Resumen de Noticias sobre Inteligencia Artificial e Innovación Tecnológica, aquí 👇🏻
Tu navegador no soporta el elemento de video.
Curaduría editorial
La curaduría y revisión editorial de estas notas está a cargo de Rosa María Agudelo Ayerbe, comunicadora social y periodista, con maestría en Transformación Digital y especialización en Inteligencia Artificial.
Desde su rol como líder del equipo de innovación y transformación digital del Diario Occidente, y a través de la unidad estratégica DO Tech, realiza un seguimiento permanente a las principales novedades en tecnología e inteligencia artificial a nivel global.
Estas notas se apoyan en un agente de investigación basado en inteligencia artificial, diseñado para monitorear semanalmente avances, lanzamientos y debates clave del sector.
El contenido es posteriormente leído, analizado, contextualizado y validado editorialmente antes de su publicación.
Este proceso forma parte del mecanismo de actualización continua que permite interpretar los desarrollos tecnológicos desde una mirada periodística, crítica y comprensible para audiencias no especializadas.

Comments
Tecnología – Diario Occidente
