- Codex se actualiza con control del ordenador en segundo plano y manejo autónomo de apps de escritorio en macOS.
- La herramienta integra navegador propio, generación de imágenes con gpt-image-1.5 y más de 90 nuevos plugins.
- OpenAI introduce memoria, sugerencias proactivas y flujos de trabajo avanzados centrados en desarrolladores.
- Algunas funciones, como el uso del ordenador y la personalización, se retrasan en la UE y Reino Unido por regulación de datos.

OpenAI ha dado un paso importante en la evolución de Codex como asistente de inteligencia artificial para ordenador, llevando sus capacidades más allá de la simple generación de código. La compañía ha anunciado una gran actualización de su aplicación de escritorio, centrada en el control del ordenador, la automatización de tareas y la integración con herramientas habituales de trabajo.
Con esta versión, Codex pasa a comportarse como una especie de “superaplicación” capaz de ver la pantalla, mover el cursor y operar aplicaciones de forma autónoma, al tiempo que genera imágenes, recuerda preferencias del usuario y mantiene flujos de trabajo de larga duración. El movimiento refuerza la estrategia de OpenAI para competir con rivales como Anthropic en el terreno de los agentes de desarrollo avanzados.
Codex toma el control del ordenador en segundo plano
La novedad más llamativa de la actualización es la función de uso del ordenador en segundo plano. Codex puede ver lo que ocurre en la pantalla, desplazar y utilizar su propio cursor virtual, hacer clic y escribir en prácticamente cualquier aplicación instalada en macOS, sin interferir con lo que el usuario está haciendo en ese momento.
Este control de escritorio está pensado especialmente para tareas que hasta ahora requerían intervención manual constante: pruebas de aplicaciones, iteración de interfaces frontend o trabajos con herramientas sin API. En lugar de limitarse al entorno de edición de código, el agente puede abrir programas, navegar por menús, rellenar formularios o lanzar scripts, encadenando acciones por su cuenta.
Otra pieza clave del nuevo enfoque es la posibilidad de ejecutar varios agentes de Codex en paralelo. Cada uno puede encargarse de una parte del flujo de trabajo —por ejemplo, revisar una pull request, preparar un entorno de pruebas o recopilar información en la web— mientras el usuario continúa con otras tareas en el ordenador.
OpenAI destaca que este modelo de agentes concurrentes resulta especialmente útil para flujos de trabajo que implican muchas comprobaciones repetitivas, como validación de interfaces, secuencias de pruebas sobre diferentes versiones de una aplicación o automatización de procesos administrativos internos.
Navegador integrado y trabajo directo sobre páginas web
Junto al control del sistema, Codex incorpora un navegador integrado dentro de la propia aplicación de escritorio. En lugar de limitarse a recibir instrucciones por texto, el agente permite que el usuario interactúe directamente sobre la página web: se pueden seleccionar elementos, añadir comentarios y dar órdenes precisas in situ.
En el ámbito del desarrollo web, esto abre la puerta a flujos mucho más visuales. Por ejemplo, un desarrollador puede marcar un botón, un bloque de texto o un componente y describir cómo quiere cambiarlo —tipografía, colores, disposición, comportamiento— para que Codex se encargue de modificar el código correspondiente.
OpenAI explica que, por ahora, este navegador está especialmente orientado a tareas de desarrollo frontend y creación de videojuegos, pero la intención es ir ampliando progresivamente el control hasta cubrir más casos de uso en la navegación web general.
Generación de imágenes con gpt-image-1.5 integrada en el flujo
Otra de las mejoras destacadas es la integración directa del modelo gpt-image-1.5 para generación y edición de imágenes en la app de Codex. Ya no es necesario recurrir a servicios externos ni a claves de API adicionales: todo se gestiona desde la misma interfaz, asociada a la cuenta de ChatGPT.
Esta capacidad permite combinar capturas de pantalla, fragmentos de código y descripciones de producto para crear rápidamente bocetos de interfaces, diagramas de arquitectura, maquetas de aplicaciones, gráficos explicativos o elementos visuales para videojuegos sin salir del entorno de trabajo.
Además de generar imágenes desde cero, Codex puede modificar y refinar visuales existentes, ajustando detalles a partir de comentarios sucesivos. Esto facilita que equipos de diseño y desarrollo colaboren sobre el mismo material, reduciendo el tránsito entre herramientas y acelerando el ciclo de iteración.
Memoria, contexto prolongado y automatización proactiva
La actualización introduce un nuevo modo de funcionamiento más cercano a un asistente personal persistente. Codex puede reutilizar conversaciones anteriores y conservar el contexto acumulado para continuar tareas en otro momento, incluso si han pasado días o semanas desde la última interacción.
En la práctica, esto significa que el agente puede programar acciones futuras y reactivarse por sí mismo cuando llega el momento de retomar un proyecto de larga duración, gestionar pull requests que siguen abiertas o revisar hilos de conversación pendientes en herramientas de comunicación.
OpenAI también ha activado una función de memoria en fase de vista previa. Esta característica permite a Codex recordar información útil de experiencias previas: preferencias de estilo, herramientas favoritas, correcciones frecuentes o datos que costó tiempo recopilar en proyectos anteriores.
Con este contexto persistente, el sistema está en condiciones de ofrecer sugerencias proactivas, como proponer retomar un proyecto inacabado, revisar cambios recién enviados a GitHub o consolidar comentarios repartidos entre Google Docs, Slack o Notion en una lista de tareas priorizada.
Flujos de trabajo para desarrolladores y paneles avanzados
La nueva versión de Codex llega claramente orientada a la comunidad de desarrollo de software. El propio director del proyecto, Thibault Sottiaux, ha explicado que el foco inicial está en los desarrolladores, con la idea de extender más adelante estas capacidades a un público general.
Entre las mejoras de productividad se incluye soporte específico para revisión de solicitudes de extracción en GitHub, posibilidad de responder directamente a comentarios en revisiones de código y una gestión más cómoda de múltiples pestañas de terminal dentro de la aplicación.
Codex también incorpora conexiones SSH en fase alfa para acceder a entornos de desarrollo remoto, lo que permite lanzar comandos, desplegar nuevas versiones de aplicaciones o supervisar servicios en servidores externos desde el mismo espacio de trabajo.
Los archivos que se abren desde el proyecto —incluyendo PDF, hojas de cálculo, presentaciones y otros documentos— pueden visualizarse con vistas previas enriquecidas en la barra lateral. Esto facilita revisar documentación, especificaciones o resultados sin abandonar la ventana principal de Codex.
OpenAI remarca que el objetivo es cubrir el mayor tramo posible del ciclo de vida del desarrollo de software en un único entorno: desde la escritura inicial del código hasta la comprobación de resultados, la revisión de cambios y la coordinación con otros miembros del equipo.
Más de 90 nuevos plugins y ampliación del ecosistema
Para complementar estas funciones, la compañía ha lanzado más de 90 nuevos plugins para Codex. Se trata de extensiones que combinan habilidades propias del agente con integraciones de aplicaciones externas y servidores MCP, ampliando el alcance de lo que la IA puede ver y ejecutar.
Entre las integraciones destacan Microsoft Suite, GitLab Issues, Neon by Databricks, Render, Superpowers y otras aplicaciones habituales en entornos de desarrollo y trabajo colaborativo. Gracias a estos complementos, Codex puede reunir contexto de distintas fuentes y actuar sobre ellas de forma coordinada.
El diseño de estos plugins busca que la herramienta pueda leer, interpretar y modificar información a lo largo de todo el conjunto de herramientas del desarrollador, desde la gestión de incidencias y la documentación hasta la infraestructura en la nube.
OpenAI subraya que esta expansión del ecosistema se enmarca en su objetivo de acercar lo que los usuarios imaginan a lo que realmente pueden construir, reduciendo la fricción entre ideas, herramientas y automatización.
Relación con otros agentes de código y contexto competitivo
La actualización de Codex llega en un momento de fuerte competencia en el ámbito de los agentes de programación asistidos por IA. El rival más directo en el segmento de herramientas cerradas es Claude Code, de Anthropic, que ofrece un asistente basado en terminal capaz de leer bases de código completas, editar archivos, ejecutar pruebas y hacer commits en GitHub.
Anthropic ha introducido también su propia función de uso del ordenador para Claude, disponible en vista previa para suscriptores Pro y Max en macOS. Sin embargo, OpenAI opta por empaquetar estas capacidades de forma diferente, concentrando control de ordenador, navegación, generación de imágenes y programación en una única aplicación de escritorio conectada a la cuenta de ChatGPT.
En paralelo, el movimiento de OpenAI se cruza con el auge de frameworks de agentes de código abierto como OpenClaw, que se popularizó por permitir ejecutar agentes persistentes de forma local, vinculados a aplicaciones de mensajería, ficheros, navegadores y comandos de shell. La filosofía de agentes que manejan gran parte del entorno digital del usuario se refleja claramente en la dirección que está tomando Codex.
En este contexto, OpenAI insiste en que su meta es elevar la calidad de los resultados a niveles que antes requerían instrucciones muy detalladas, apoyándose en memoria, contexto extendido y una integración más profunda con el sistema operativo.
Disponibilidad, macOS como punto de partida y situación en Europa
La nueva versión de la aplicación de escritorio de Codex se está desplegando progresivamente para usuarios que inicien sesión con su cuenta de ChatGPT. El uso avanzado del ordenador está disponible inicialmente en macOS, mientras que el soporte para otros sistemas operativos, como Windows, se espera más adelante.
En cuanto al modelo de acceso, OpenAI indica que las funciones más avanzadas suelen vincularse a planes de pago, aunque la disponibilidad concreta puede variar según la suscripción de cada usuario y la evolución de los productos de la compañía.
Uno de los puntos sensibles es la situación en la Unión Europea y el Reino Unido. Para estos mercados, algunas de las características más potentes, como la personalización, las sugerencias contextuales, la memoria y el control del ordenador, llegarán más adelante. El retraso responde a la necesidad de alinear el funcionamiento de Codex con las normativas locales de protección de datos.
Mientras se adaptan estos requisitos, los usuarios europeos podrán acceder a parte de las nuevas funciones, pero no al conjunto completo desde el primer día. OpenAI no ha ofrecido una fecha cerrada, aunque ha señalado que su objetivo es ampliar el acceso “pronto” una vez se cumplan las exigencias regulatorias.
Con esta actualización, Codex se afianza como una herramienta que pretende centralizar tareas de programación, automatización, navegación y creación de contenido visual en un mismo entorno, con una orientación clara hacia mejorar la productividad de los desarrolladores y, a medio plazo, de cualquier usuario que trabaje a diario con su ordenador.
