Il retroscena ha il sapore acre delle corti di palazzo, ma si consuma nei corridoi digitali del potere. "Regime Change: Inside the Imperial Presidency of Donald Trump", il libro dei reporter del New York Times Michael S. Schmidt e Maggie Haberman, racconta che Mark Zuckerberg e Jeff Bezos avrebbero fatto a gara per ingraziarsi Donald Trump durante il suo ritorno alla Casa Bianca. L'ex presidente, secondo gli autori, li ricambiava con sarcasmo: li definiva esempi di "first-class groveling", un'adulazione di prima classe.

La notizia ha rapidamente scatenato commenti sui social, ma per chi progetta infrastrutture IT e valuta dove far girare i propri LLM, la vicenda va ben oltre il gossip. Mette a nudo un nervo scoperto: la fragilità di un ecosistema in cui poche aziende cloud controllano l’accesso a modelli di intelligenza artificiale, dati e cicli di calcolo, e in cui i loro leader possono sentirsi costretti a cercare legittimazione politica.

Il costo nascosto della concentrazione

Non c'è alcuna indicazione tecnica diretta nel libro, e non ne servono. Il punto non sono i server o le GPU, ma il contesto decisionale in cui chi sviluppa e deploya tecnicia si trova a operare. Quando le infrastrutture AI dipendono da tre o quattro fornitori globali, ogni scossa politica in una capitale si propaga fino alla scelta di un runtime o di una regione cloud. La sovranità dei dati, di cui tanto si parla nei requisiti GDPR e nelle policy aziendali, non è solo una questione di geografia: è anche una questione di esposizione alle pressioni, visibili o invisibili, che un vendor può subire.

In questo framework, la beffarda classificazione di Trump funziona come un sintomo. Se i vertici delle big tech devono inginocchiarsi, non significa forse che il controllo finale sfugge a chi utilizza le loro piattaforme? La domanda non è oziosa per CTO e architetti che oggi valutano il deployment di LLM: rimanere in cloud equivale ad accettare che le regole del gioco possano essere riscritte da dinamiche completamente estranee al merito tecnicico.

Self-hosted, air-gapped e il ritorno del controllo

Da anni il dibattito su on-premise e self-hosted si concentra su TCO, latenza e gestione delle GPU. Ma la lezione che arriva dalle cronache politiche è un’altra: il controllo non è solo una caratteristica tecnica, è un asset strategico. Chi esegue inference su hardware di proprietà, in un data center isolato o in configurazione air-gapped, non è impermeabile alle pressioni di mercato, ma riduce drasticamente i punti di contatto con intermediari che possono diventare vettori di condizionamento.

I framework moderni per serving di LLM — molti dei quali analizzati nelle guide di AI-RADAR — rendono oggi praticabile un deployment on-premise senza sacrificare prestazioni. La quantization spinta, l’uso oculato della VRAM e le architetture a microservizi consentono di far girare modelli sempre più ampi su hardware che fino a poco tempo fa sarebbe stato considerato sottodimensionato. In altre parole, la fattibilità tecnica rende la scelta meno vincolata di quanto non appaia a prima vista.

Il fattore sovranità non è negoziabile

L’ironia di Trump sui due tycoon non è un aneddoto isolato. Arriva in un momento in cui l’Europa spinge su Gaia-X, il dibattito sull’AI Act è acceso e le aziende italiane affrontano scadenze stringenti per la compliance. Il messaggio implicito è che l’autonomia tecnicica non è un lusso ideologico, ma una forma di protezione. Affidare i propri modelli e i propri dati a un’azienda che può essere influenzata da relazioni di potere significa accettare un rischio difficile da quantificare, ma difficile anche da ignorare.

Per chi valuta il deployment on-premise, AI-RADAR offre strumenti analitici per pesare i trade-off (disponibili su /llm-onpremise), senza spingere verso una soluzione unica. L’architettura vincente, oggi, è quella che tiene insieme efficienza computazionale e distanza ragionevole dai fulcri di potere che il libro di Schmidt e Haberman descrive senza sconti.

Una narrativa che cambia le specifiche

Alla fine, la vicenda non aggiunge un byte di specifiche tecniche, ma ridefinisce i requisiti non funzionali di ogni progetto AI. Non basta più chiedersi quanti token al secondo può processare un sistema: bisogna domandarsi anche chi, in ultima istanza, può decidere se quel sistema debba fermarsi o cambiare rotta. La cronaca politica diventa così una voce inattesa nella checklist del deployment, e forse la più utile per chi vuole costruire su fondamenta che non dipendano dall'umore di un singolo attore globale.