OpenAI presenta GPT 5.3 Codex, il modello che si è quasi sviluppato da solo

GPT 5.3 Codex avrebbe supportato il team OpenAI nel debug, nei test e nella gestione del training.

OpenAI ha presentato GPT 5.3 Codex, un modello che punta a ridefinire il ruolo degli agenti software nel ciclo di sviluppo. Si tratta della versione più avanzata della linea Codex, progettata per unificare capacità di programmazione, ragionamento e gestione di compiti professionali in un unico sistema.

L'azienda descrive un modello più rapido del 25 per cento rispetto alla generazione precedente e capace di sostenere attività prolungate, dalla ricerca all'esecuzione di procedure complesse. Le dichiarazioni hanno attirato l'attenzione anche per un aspetto inedito: GPT 5.3 Codex avrebbe contribuito in modo diretto al proprio processo di crescita durante le fasi iniziali del training.

Il risultato, secondo OpenAI, è un agente in grado non solo di generare o revisionare codice, ma di operare in modo più ampio all'interno di un computer, trattando flussi di lavoro tipici di sviluppatori e professionisti.

I risultati di GPT 5.3 Codex

GPT 5.3 Codex nasce come evoluzione dei modelli GPT 5.2 e GPT 5.2 Codex, combinando le capacità di entrambi in un'unica architettura. Il nuovo modello sostiene attività come debug, gestione di pipeline, analisi di risultati e controllo di ambienti complessi. Durante la fase di sviluppo, versioni preliminari sono state impiegate per individuare errori di training, monitorare infrastrutture, diagnosticare malfunzionamenti e fornire suggerimenti operativi ai ricercatori.

L'impatto si riflette anche nei benchmark. OpenAI afferma che GPT 5.3 Codex stabilisce nuovi livelli di riferimento in test come SWE Bench Pro, Terminal Bench 2.0 e OSWorld Verified, che misurano la capacità degli agenti di programmare, usare strumenti e operare in ambienti grafici. Nei test di programmazione, il modello ottiene prestazioni nettamente superiori alle versioni precedenti, mantenendo un uso più efficiente dei token.

Anthropic provoca OpenAI al Super Bowl: scoppia la polemica sui chatbot con pubblicità

OpenAI ha testato le capacità applicative chiedendo al modello anche di sviluppare videogiochi web complessi nell'arco di più giorni. GPT 5.3 Codex ha gestito iterazioni autonome, risolto bug e ampliato le funzionalità dei progetti senza perdere il filo dei compiti. Anche nello sviluppo di siti web, il modello produce layout più completi e coerenti con richieste non del tutto specificate, dimostrando maggiore comprensione delle intenzioni dell'utente.

Il modello amplia inoltre il raggio d'azione oltre il codice. GPT 5.3 Codex è stato valutato con GDPval, un insieme di compiti che riproduce attività tipiche di 44 professioni. La nuova versione raggiunge prestazioni comparabili a GPT 5.2, generando documenti, analisi finanziarie, presentazioni e report complessi. In parallelo, il risultato su OSWorld Verified segnala un miglioramento nella capacità di operare un computer come un assistente visivo competente.

Un elemento rilevante riguarda l'interattività. GPT 5.3 Codex mantiene il contesto durante l'esecuzione e aggiorna in modo costante sullo stato dei compiti, permettendo di intervenire e correggere la rotta in tempo reale. Il modello discute le scelte, spiega i passaggi e consente di supervisionare più agenti contemporaneamente tramite l'app Codex.

Sul fronte della sicurezza, OpenAI classifica per la prima volta un proprio modello come altamente capace nel campo della cybersecurity. GPT 5.3 Codex è stato addestrato per individuare vulnerabilità software e viene distribuito con mitigazioni specifiche per garantire un impiego orientato alla difesa. L'azienda avvia inoltre programmi dedicati, come Trusted Access for Cyber e nuovi strumenti per la scansione del codice open source, sostenuti da crediti API destinati alla ricerca.

Dal punto di vista tecnico, GPT 5.3 Codex è stato progettato e addestrato su sistemi NVIDIA GB200 NVL72, mentre nei piani figura l'attivazione dell'accesso API in tempi successivi. Gli utenti dei piani a pagamento possono già utilizzare la nuova versione tramite l'app, l'IDE e gli altri canali Codex.