OpenAI introduce la modalità lockdown per ChatGPT contro l’esfiltrazione dei dati

Se usi ChatGPT con informazioni riservate, la novità più importante è semplice: attiva la nuova Lockdown Mode per ridurre i rischi legati ai prompt injection. Questa impostazione limita diverse funzioni che possono contattare il web o servizi esterni, offrendo una protezione più rigida in cambio di qualche comodità in meno.

OpenAI ha avviato il rilascio di una nuova modalità di sicurezza per ChatGPT pensata per gli account idonei. L’obiettivo è diminuire il rischio che dati sensibili vengano sottratti attraverso attacchi di prompt injection, un problema che continua a rappresentare una delle sfide più difficili per i modelli linguistici di grandi dimensioni.

La Lockdown Mode è stata progettata soprattutto per persone e organizzazioni che trattano informazioni riservate e vogliono un livello di protezione più severo rispetto alle impostazioni standard. La funzione è disponibile per gli utenti connessi nei piani Free, Go, Plus, Pro e nei piani ChatGPT Business self-serve.

Cosa fa la Lockdown Mode

OpenAI descrive la Lockdown Mode come un’impostazione di sicurezza avanzata opzionale che limita molte funzioni dei prodotti OpenAI in grado di collegarsi al web o a servizi esterni. In pratica, il sistema cerca di ridurre le possibilità che un contenuto malevolo convinca ChatGPT a inviare all’esterno informazioni che non dovrebbero uscire.

Il principio non è impedire che un prompt injection avvenga, ma tagliare le possibili vie di fuga dei dati. Per questo motivo la modalità interviene soprattutto sulle richieste di rete in uscita e su alcune funzioni che possono ampliare la superficie d’attacco.

Tra le funzioni disattivate o limitate ci sono:

la navigazione web in tempo reale, limitata ai contenuti memorizzati nella cache
il supporto alle immagini, sia per mostrarle nelle risposte sia per recuperarle dal web
la ricerca approfondita
la modalità agent
il networking di Canvas, che impedisce di approvare codice generato da Canvas con accesso alla rete
il download dei file, utile nei flussi di analisi dei dati

Perché è stata introdotta

La ragione principale è il rischio di data exfiltration, cioè la sottrazione di dati tramite istruzioni nascoste o manipolative. Nei sistemi di intelligenza artificiale, un prompt malevolo può cercare di indurre il modello a eseguire azioni indesiderate, per esempio leggere contenuti sensibili e inviarli verso un’infrastruttura controllata da un attaccante.

OpenAI afferma che le nuove protezioni si basano su sandboxing e controlli già esistenti, con un focus particolare sui meccanismi di esfiltrazione basati sugli URL. L’obiettivo è ridurre le richieste in uscita che potrebbero trasmettere dati sensibili a destinazioni non autorizzate.

Per chi lavora con documenti riservati, archivi interni, informazioni legali o dati aziendali, questo approccio può fare la differenza. Non elimina il rischio in assoluto, ma restringe in modo significativo le possibilità di abuso.

Cosa non cambia

La Lockdown Mode non modifica il funzionamento della memoria, non cambia il comportamento dei caricamenti di file e non impedisce la condivisione delle conversazioni. Questo è importante perché il suo scopo non è trasformare ChatGPT in un sistema completamente isolato, ma ridurre i percorsi attraverso cui i dati potrebbero essere esfiltrati.

OpenAI sottolinea anche che la modalità non è pensata per tutti gli utenti. È una scelta orientata a chi privilegia la sicurezza rispetto alla piena disponibilità di tutte le funzioni.

Inoltre, la Lockdown Mode e la Developer Mode non possono essere attive contemporaneamente. Attivando una, l’altra viene disabilitata.

Limiti e rischi residui

OpenAI specifica che la Lockdown Mode riduce in modo sostanziale il rischio di esfiltrazione dei dati basata su prompt injection, ma non garantisce l’impossibilità totale di un incidente. Alcuni rischi possono rimanere attraverso app abilitate, combinazioni impreviste di funzioni o tecniche nuove non ancora note.

La protezione non blocca nemmeno tutti gli effetti di un prompt injection. Per esempio, un’istruzione malevola nascosta in un file caricato potrebbe ancora influenzare il comportamento del modello e portare a una risposta errata.

In altre parole, la modalità riduce il numero di strade disponibili a un attaccante, ma non sostituisce una strategia di sicurezza più ampia basata su controlli interni, revisione umana e gestione prudente dei dati sensibili.

A chi conviene davvero

La Lockdown Mode è più utile in ambienti in cui la confidenzialità conta più della produttività completa. Può essere adatta, per esempio, a team che analizzano documentazione privata, reparti legali, realtà che gestiscono proprietà intellettuale o utenti che vogliono limitare al massimo le interazioni di ChatGPT con servizi esterni.

Per chi usa il chatbot in modo generale, invece, alcune limitazioni potrebbero risultare troppo restrittive. La perdita di browsing live, immagini, agenti e download file può incidere molto sui flussi quotidiani.

La nuova gestione delle sessioni account

Accanto alla Lockdown Mode, OpenAI ha introdotto anche una funzione di gestione dell’account che consente di controllare le sessioni attive di ChatGPT e disconnettere una singola sessione o tutte le sessioni se emergono segnali di attività sospetta.

L’elenco delle sessioni mostra informazioni utili come il dispositivo usato, l’app impiegata, la posizione approssimativa, data e ora dell’accesso, lo stato di attendibilità del dispositivo e l’indicazione se si tratta della sessione corrente.

Questa funzione aggiunge un livello di controllo pratico per gli utenti che vogliono monitorare accessi non autorizzati o verificare rapidamente eventuali anomalie nell’account.

Cosa fare adesso

Se lavori con dati delicati, la scelta più efficace è verificare subito se il tuo account può usare la Lockdown Mode e valutare se attivarla per le sessioni in cui la sicurezza è prioritaria. Se invece hai bisogno di browsing, immagini o strumenti avanzati, conviene usarla solo nei contesti in cui il rischio di esfiltrazione è più rilevante del bisogno di funzionalità complete.

È anche utile controllare periodicamente le sessioni attive dell’account e rimuovere quelle sconosciute o non più necessarie. In combinazione, queste misure aiutano a mantenere un controllo più forte sull’uso di ChatGPT in ambienti professionali e personali.

Technical Deep Dive

La Lockdown Mode interviene su un punto critico dell’architettura degli assistenti LLM: il canale tra interpretazione del prompt e azioni esterne. Nei sistemi moderni, il rischio non nasce solo dalla generazione del testo, ma dalla capacità del modello di orchestrare tool, fare richieste HTTP, leggere contenuti remoti, analizzare allegati e concatenare più passaggi operativi.

Dal punto di vista difensivo, il blocco o la limitazione delle richieste in uscita riduce la probabilità che un prompt injection riesca a trasformarsi in una sequenza completa di esfiltrazione. Questo è particolarmente rilevante nei contesti con retrieval, browsing e agentic workflows, dove il modello può recuperare dati da fonti diverse e combinarli in modo non previsto.

Il riferimento al sandboxing indica una separazione controllata dell’ambiente di esecuzione, utile per limitare l’impatto di codice o azioni generate dal modello. La limitazione del networking in Canvas, invece, agisce su una classe specifica di rischio: il codice generato dall’AI che tenta di stabilire connessioni di rete o inviare dati all’esterno.

La scelta di consentire solo contenuti cache per il browsing riduce l’esposizione a fonti live e attenua il rischio di richiedere risorse esterne in risposta a istruzioni malevole. Allo stesso modo, la disattivazione del download file elimina un vettore utile nei flussi di analisi che potrebbero essere sfruttati per trasferire dati verso l’esterno.

Resta però un problema strutturale: i prompt injection non si esauriscono con l’esfiltrazione. Possono anche alterare il ragionamento del modello, introdurre risposte scorrette o influenzare l’ordine delle priorità durante l’elaborazione. Per questo motivo, la difesa efficace richiede controlli multilivello: limitazione dei tool, validazione dei contenuti, separazione dei ruoli, revisione umana e monitoraggio delle sessioni e delle app abilitate.

In prospettiva, la Lockdown Mode rappresenta un approccio di risk minimization più che di eliminazione del rischio. È una risposta pragmatica a un problema noto nei sistemi LLM: quando un modello può leggere, ragionare e agire, la sicurezza dipende non solo dalla qualità delle risposte, ma anche dai confini imposti alle sue capacità operative.

Fonte: https://thehackernews.com/2026/06/new-chatgpt-lockdown-mode-limits-tools.html