A partire dal 10 luglio, nessun dipendente Alibaba può più toccare Claude Code. La decisione, drastica e immediata, è arrivata dopo che un gruppo di ricercatori di sicurezza ha messo le mani su una porzione di codice nascosta all’interno dell’agente di coding basato su LLM di Anthropic: una funzione pensata – secondo gli analisti – per identificare gli utenti cinesi.

La notizia non cade nel vuoto. Da settimane le due aziende sono in rotta su un fronte molto più spinoso: Anthropic accusa Alibaba di aver “rubato” capacità di intelligenza artificiale attraverso la distillazione su scala industriale, una tecnica che permette di estrarre conoscenza da modelli più grandi per addestrarne di nuovi con meno risorse. In questo clima di guerra commerciale, il codice di tracking ha funzionato da detonatore.

Al di là della polemica specifica, il caso solleva una domanda che molti team di sviluppo stanno già cominciando a porsi: quando adotti un assistente AI basato su cloud per scrivere o revisionare codice, a chi stai davvero consegnando i sorgenti? Claude Code, come altri strumenti simili, invia prompt e contesto a server remoti. Se nel flusso può annidarsi una logica di profilazione geografica, il passo verso forme più invasive di monitoraggio è breve – volontarie o meno.

Il confine tra produttività e controllo

Per chi valuta l’adozione di coding agent in azienda, l’episodio sposta il baricentro su un trade-off noto ma spesso trascurato: la velocità che arriva da un servizio completamente gestito si paga in trasparenza. In un ambiente cloud, le policy di auditing e i controlli sui dati in transito sono limitati a ciò che il fornitore decide di esporre. Non c’è garanzia che il codice non venga utilizzato per migliorare i modelli o per finalità non dichiarate, a meno che il fornitore stesso non sottoscriva impegni contrattuali stringenti.

L’alternativa è uno stack self-hosted, con modelli eseguiti su hardware locale o in ambienti air-gapped. Soluzioni che eliminano il rischio di esfiltrazione dei dati, ma portano con sé un carico operativo non banale: provisioning di GPU, gestione della VRAM, fine-tuning, aggiornamenti dei framework. Su questo crinale si gioca la partita della sovranità del codice, dove ogni organizzazione calibra il proprio TCO bilanciando costi infrastrutturali e necessità di compliance.

Il divieto di Alibaba, in fondo, è solo l’ultimo sintomo di una tensione che cresce man mano che i modelli linguistici entrano nei flussi di lavoro critici. Non riguarda solo il tracciamento geografico: è la conferma che la fiducia nel cloud, quando si tratta di asset strategici, richiede verifiche attive e, sempre più spesso, la capacità di portare i workload dove il controllo è totale – cioè in casa propria.