Claude Code: spunta codice spyware contro gli utenti cinesi. Per le aziende un campanello d’allarme

Il mondo degli assistenti di coding basati su LLM è stato scosso da una segnalazione comparsa su Reddit, dove un utente ha descritto la presenza di codice con comportamenti da spyware all’interno di Claude Code, lo strumento di sviluppo di Anthropic. Il codice sarebbe progettato per prendere di mira in modo occulto gli utenti cinesi, sollevando interrogativi non da poco sulla trasparenza – o sulla sua assenza – nelle pipeline software di strumenti sempre più diffusi.

Il nocciolo della segnalazione

Secondo il post, il codice incriminato opererebbe in modo furtivo, senza avvisare l’utente, per raccogliere informazioni o eseguire azioni specifiche quando rileva un contesto cinese. La natura “spyware-like” – come la definisce la fonte – allude a tecniche di offuscamento e targeting che ricordano quelle di software malevoli veri e propri, più che di un semplice telemetria o controllo di licenza. Non si tratta di una falla, ma di una scelta di design apparentemente deliberata.

La segnalazione è al momento solo un post su Reddit, priva di un’analisi tecnica dettagliata o di conferme ufficiali. Tuttavia, il clamore che ha sollevato è indicativo della sensibilità crescente del settore verso ciò che avviene all’interno degli strumenti che integriamo nei nostri flussi di lavoro quotidiani.

Oltre il singolo caso: la fiducia nella supply chain AI

Al di là della veridicità puntuale della denuncia, la vicenda tocca un nervo scoperto per chiunque utilizzi strumenti AI cloud-based. Claude Code, come molti assistenti di coding, opera in remoto su server del provider, processando codice sorgente, commenti e spesso dati di contesto che possono includere segreti industriali, algoritmi proprietari o informazioni personali. Se davvero esistesse un meccanismo nascosto che discrimina in base alla geolocalizzazione o alla lingua, la domanda spontanea sarebbe: cos’altro può fare quel codice di cui non siamo a conoscenza?

Questo porta alla ribalta il concetto di “trust but verify” nella catena di fornitura del software AI. Non si tratta soltanto di fidarsi del vendor (Anthropic gode di una solida reputazione), ma di avere strumenti per verificare ciò che accade. E quando il codice non è ispezionabile perché eseguito lato server, la verifica diventa impossibile. Per le aziende che operano in settori regolamentati, dalla difesa alla sanità, questo è un problema concreto: la compliance normativa (si pensi al GDPR) impone di sapere dove e come vengono trattati i dati.

Self-hosted e on-premise: una risposta inevitabile?

Per chi non può permettersi di delegare ciecamente la sovranità dei propri dati a terze parti, un’architettura on-premise o self-hosted diventa una strada quasi obbligata. Eseguire un assistente di coding in locale, su server aziendali isolati dalla rete (air-gapped), garantisce che nessun dato esca dal perimetro e che ogni riga di codice sia sotto controllo. Certo, comporta costi e complessità – dall’hardware GPU necessario per l’inference alla manutenzione dei modelli – ma oggi esistono framework che permettono di gestire LLM on-premise con TCO confrontabile, a patto di dimensionare correttamente il carico.

AI-RADAR segue da tempo il tema del deployment locale, dove il trade-off principale è tra la flessibilità e la facilità d’uso degli strumenti cloud e il controllo granulare dell’infrastruttura. In scenari come quello descritto, il controllo non ha prezzo.

La lezione per il futuro

La storia del presunto spyware in Claude Code, vera o gonfiata che sia, è un altro tassello nel mosaico della sfiducia che si sta accumulando verso i grandi fornitori di AI. Ci ricorda che la sicurezza non è solo una questione di vulnerability patching, ma di trasparenza radicale. E che la scelta tra cloud e on-premise non è mai solo tecnica, ma profondamente politica e strategica. Se il codice che usiamo può avere comportamenti opachi, l’unica difesa vera è tornare a padroneggiare il nostro stack.