Un conto in rapida crescita e una visibilità quasi nulla. È il paradosso che Gartner mette nero su bianco: entro il 2028, le aziende potrebbero spendere per gli assistenti AI alla programmazione più di quanto pagano i programmatori stessi. Un numero che ridefinisce il ritorno sull’investimento di strumenti come GitHub Copilot, Codeium o Cursor, fin qui percepiti quasi come commodity a basso costo.

Il sommerso della spesa

Il nocciolo del problema non è solo il prezzo unitario delle licenze. La ricerca Gartner sottolinea che la maggior parte delle organizzazioni «non riesce nemmeno a vedere cosa sta spendendo». I modelli di pricing si sono frammentati: abbonamenti per utente, consumi a token, tier premium per funzionalità avanzate. Sommati a un’adozione diffusa e spesso non governata, questi costi sfuggono ai tradizionali centri di controllo IT.

Molte aziende si accorgono tardivamente di aver attivato servizi su larga scala senza una chiara attribuzione dei costi. L’AI coding diventa così un costo operativo che gonfia le bollette cloud mensili, con dinamiche simili a quelle già viste nel passaggio dai datacenter on-premise al pay-as-you-go.

Cosa cambia se si guarda all’on-premise

Per chi sta valutando stack locali per LLM, il rapporto cambia radicalmente. I costi di inference su hardware proprio (GPU con VRAM adeguata, server dedicati) non seguono logiche a consumo per token: il TCO si sposta sul CapEx iniziale e sull’energia, ma garantisce prevedibilità e controllo diretto sul dato. Il trade-off è noto: più investimento iniziale, meno sorprese a fine mese.

Non si tratta solo di bolletta. In contesti regolati o con dati sensibili, il self-hosting diventa una leva di sovranità difficile da ignorare. L’analisi dei costi, però, deve includere anche la manutenzione, gli aggiornamenti dei modelli e la necessità di competenze interne. AI-RADAR offre strumenti analitici su /llm-onpremise per chi vuole confrontare scenari di deployment senza fermarsi al prezzo della singola sottoscrizione.

Trasparenza prima di tutto

Il campanello d’allarme Gartner non riguarda solo i CFO. Riguarda i CTO e i team di engineering che spingono per l’adozione di AI generativa senza aver costruito una metrica di costo condivisa. La crescita senza governance rischia di erodere il vantaggio competitivo: se ogni suggerimento di codice ha un costo invisibile, la produttività misurata in linee di codice potrebbe essere un abbaglio.

Guardando al 2028, il messaggio è più ampio. L’AI coding è entrato nella fase di maturità dove il prezzo non è più un dettaglio. Per le aziende, diventa urgente tracciare la spesa, valutarne l’impatto reale e, dove ha senso, considerare architetture alternative che riportino il controllo sulle voci di costo. Senza questa igiene, il rischio è che la bolletta superi lo stipendio, e nessuno se ne sia accorto.