Geely e la svolta nell'automotive: meno fabbriche, più efficienza e TCO

Li Shufu, il miliardario presidente di Geely Holding Group, l'uomo che nel 2010 ha acquisito Volvo Cars da Ford per 1,8 miliardi di dollari, ha raggiunto una conclusione che molti dei suoi pari nell'industria automobilistica globale hanno tardato a formulare. Il mondo, a suo avviso, dispone di un numero eccessivo di fabbriche automobilistiche e costruirne di nuove non rappresenta più la strategia più efficace. Questa visione ha portato Geely a un cambio di rotta significativo: l'azienda intende cessare la costruzione di nuovi impianti produttivi, optando invece per l'utilizzo delle strutture esistenti di altri attori del settore.

La decisione di Geely non è solo una mossa tattica, ma riflette una più ampia tendenza verso l'ottimizzazione delle risorse e una gestione più oculata del Total Cost of Ownership (TCO). In un mercato globale sempre più competitivo e saturo, la capacità di massimizzare l'efficienza degli asset esistenti e di ridurre i costi operativi diventa un fattore critico di successo. Questo approccio, sebbene applicato all'industria automobilistica, offre spunti rilevanti anche per altri settori ad alta intensità di capitale, come quello dell'infrastruttura per l'intelligenza artificiale e i Large Language Models (LLM).

Ottimizzazione delle risorse e TCO nell'era degli LLM

La strategia di Geely di "prendere in prestito" capacità produttiva altrui trova un parallelo concettuale nelle sfide che le aziende affrontano nel deployment di LLM on-premise. Per CTO, DevOps lead e architetti di infrastruttura, la decisione di costruire o meno una nuova infrastruttura hardware dedicata è complessa. Spesso, l'obiettivo è massimizzare l'utilizzo delle GPU esistenti, ottimizzare la VRAM disponibile e garantire un throughput elevato con la minima latenza possibile, il tutto mantenendo sotto controllo il TCO.

L'approccio di Geely evidenzia come l'investimento in nuovi asset (CapEx) possa essere evitato o ridotto, privilegiando l'utilizzo di risorse già disponibili sul mercato (OpEx o accordi di partnership). Nel contesto degli LLM, questo si traduce nella valutazione tra l'acquisto di nuove GPU di fascia alta, come le A100 o H100, per un deployment self-hosted, e l'esplorazione di soluzioni che permettano di sfruttare capacità di calcolo esistenti, magari attraverso accordi con data center o fornitori di servizi specializzati. La scelta dipende da fattori come la sovranità dei dati, i requisiti di compliance per ambienti air-gapped e la necessità di un controllo granulare sull'intera pipeline di inference o fine-tuning.

Implicazioni strategiche e trade-off per l'infrastruttura AI

La svolta di Geely sottolinea un trade-off fondamentale: il controllo totale sull'asset a fronte di un investimento iniziale elevato, rispetto a una maggiore flessibilità e costi operativi potenzialmente inferiori, ma con una dipendenza da terzi. Per i deployment di LLM, questo si manifesta nella scelta tra un'infrastruttura bare metal completamente gestita internamente, che offre il massimo controllo su sicurezza, personalizzazione e ottimizzazione delle performance (es. batch size, quantization), e soluzioni ibride o basate su servizi esterni.

Le aziende che privilegiano la sovranità dei dati e la sicurezza, spesso optano per deployment on-premise o air-gapped, investendo in hardware specifico e stack locali. Tuttavia, anche in questi scenari, l'analisi del TCO è cruciale. Non si tratta solo del costo iniziale delle GPU e dei server, ma anche dei costi energetici, della manutenzione, del personale specializzato e dell'obsolescenza tecnicica. La strategia di Geely suggerisce che, in alcuni contesti, la condivisione o l'affitto di risorse può essere una via per mitigare questi oneri, spostando il focus dall'investimento puro alla gestione efficiente della capacità.

Una prospettiva di mercato matura

La decisione di Geely di abbandonare la costruzione di nuove fabbriche in favore dell'utilizzo di quelle esistenti di terzi è un segnale di maturità del mercato automobilistico, dove l'efficienza e l'ottimizzazione del TCO sono diventate priorità assolute. Questa mentalità di "asset-light" o di "capital-light" è sempre più rilevante anche nel panorama dell'intelligenza artificiale. Man mano che gli LLM diventano una componente centrale delle strategie aziendali, la capacità di deployare e gestire queste tecnicie in modo efficiente, sia on-premise che in ambienti ibridi, sarà un fattore distintivo.

Per chi valuta deployment on-premise, esistono framework analitici che AI-RADAR esplora su /llm-onpremise per valutare i trade-off tra controllo, costi, performance e scalabilità. L'esperienza di Geely, sebbene in un settore diverso, offre una lezione preziosa: la sostenibilità a lungo termine non risiede necessariamente nell'accumulo di asset, ma nella loro gestione intelligente e nell'ottimizzazione della capacità esistente, un principio che si applica con forza anche alla complessa infrastruttura richiesta dai Large Language Models.

Geely e la svolta nell'automotive: meno fabbriche, più efficienza e TCO