La strategia è tanto spregiudicata quanto efficace: offrire ai clienti condizioni economiche così vantaggiose da rendere quasi impossibile dire di no. È esattamente ciò che Nvidia ha fatto per anni per piazzare le sue GPU nei data center di mezzo mondo. Ora Google la sta copiando, con l’obiettivo dichiarato di scalzare il rivale e imporre i propri chip, i Tensor Processing Unit, nel mercato dell’AI cloud.

L’inchiesta del Wall Street Journal ha messo a nudo i meccanismi: garanzie sui volumi di acquisto, sconti legati a contratti di lungo termine e un ingegnoso sistema di ‘finanziamento circolare’, in cui Google stessa fornisce capitali ai clienti perché comprino la sua infrastruttura, creando un circuito chiuso che amplifica la domanda. Una mossa che ricorda da vicino la parabola di Nvidia, la cui ascesa è stata alimentata non solo dalla qualità tecnica delle GPU, ma da una macchina commerciale che lega a sé hyperscaler e aziende con incentivi finanziari quasi inestricabili.

La leva finanziaria come arma competitiva

Nel mondo dei semiconduttori per l’AI, la supremazia non si gioca solo sui transistor o sui teraflop. Conta la capacità di costruire un ecosistema che intrappoli il cliente. Nvidia ha perfezionato questo approccio con la piattaforma CUDA, con le librerie ottimizzate e, soprattutto, con accordi commerciali che rendono proibitivo cambiare fornitore. Chi ha scommesso sulle GPU Nvidia per addestrare e servire LLM ha investito in competenze, pipeline di sviluppo e contratti di fornitura che creano un costo di uscita altissimo.

Google sta cercando di replicare questa dinamica con i propri TPU. Non si limita a offrire chip: mette sul piatto un pacchetto completo di servizi cloud, framework come JAX e TensorFlow, e ora anche incentivi economici modellati su quelli del leader di mercato. Il ‘finanziamento circolare’ – in pratica, Google presta denaro ai clienti perché acquistino potenza di calcolo sui suoi server – è la versione moderna di una pratica che ha fatto scuola nel settore enterprise.

Cosa significa per chi sviluppa AI

Per le aziende che valutano dove far girare i propri carichi di inference o addestramento, questa mossa introduce una variabile nuova. Da una parte, una maggiore concorrenza potrebbe tradursi in prezzi più bassi per l’accesso a GPU e TPU nel cloud. Dall’altra, la dipendenza da un unico ecosistema si sposta: chi abbraccerà la soluzione Google resterà comunque legato a un’architettura proprietaria, con poco margine per portare i modelli in ambienti on-premise o multi-cloud senza costosi refactoring.

AI-RADAR segue da vicino queste dinamiche. Per chi valuta deployment on-premise, la sfida è chiara: la concentrazione del mercato chip rende vulnerabile qualsiasi strategia che si affidi a un solo fornitore. Le TPU di Google, per ora, restano confinate al cloud, ma la pressione competitiva su Nvidia potrebbe accelerare l’innovazione anche sugli acceleratori che un giorno saranno disponibili per l’acquisto diretto.

L’ombra lunga della dipendenza strategica

L’operazione di Google, se avrà successo, non farà che rafforzare un modello di lock-in soft: si cambia padrone, ma la gabbia rimane. Le imprese con requisiti stringenti di sovranità dei dati – per esempio in ambito pubblico o finanziario, dove il GDPR impone controllo fisico sugli endpoint – guardano con diffidenza a soluzioni cloud-only, per quanto convenienti. La vera via d’uscita dal monopolio Nvidia, forse, non passerà da un altro gigante che ne imita le tattiche, ma da un ecosistema più aperto, con alternative on-premise realmente competitive a livello di TCO.

Nel frattempo, l’effetto immediato è un surriscaldamento della competizione sui prezzi. I clienti cloud potrebbero beneficiarne, mentre il mercato attende che questa guerra commerciale produca ricadute anche sul fronte hardware per i deployment locali.