Tokenmaxxing: le startup spendono più in AI che in personale, ma a quale costo?

L'ascesa del "tokenmaxxing" nel panorama startup

Nel dinamico ecosistema delle startup, emerge una nuova metrica di vanità: il "tokenmaxxing". Questo termine descrive la pratica, sempre più diffusa tra i CEO, di vantarsi di destinare budget maggiori al compute per l'intelligenza artificiale rispetto ai costi per l'assunzione di personale umano. Quella che fino a poco tempo fa sarebbe stata considerata una spesa astronomica, è ora presentata in alcuni ambienti tech come un segno distintivo di crescita e successo.

Amos Bar-Joseph, CEO di Swan AI, una startup specializzata in agenti di codifica, ha recentemente condiviso un post virale su LinkedIn, rivelando una fattura di 113.000 dollari in un solo mese per l'utilizzo di Claude, un LLM di Anthropic. Il suo team, composto da sole quattro persone, mira a raggiungere 10 milioni di dollari di ricavi annuali ricorrenti (ARR) con un'organizzazione di meno di dieci individui, puntando a scalare attraverso l'intelligenza artificiale piuttosto che l'aumento del personale. Bar-Joseph ha sottolineato come questa spesa per i token copra funzioni tradizionalmente svolte da team di go-to-market, ingegneria, supporto e legale, evidenziando un cambiamento radicale nell'allocazione delle risorse.

L'AI come sostituto del capitale umano: una tendenza in crescita

Il concetto di "tokenmaxxing" non è limitato alle piccole startup. Anche giganti tecnicici come Meta hanno esplorato metriche simili, con un dashboard interno chiamato "Claudenomics" che tracciava l'utilizzo dei token AI da parte dei singoli dipendenti, interpretandolo come indicatore di produttività e innovazione. Tuttavia, questa tendenza ha generato un certo dibattito. Salesforce, ad esempio, ha introdotto una metrica alternativa, le "Agentic Work Units", per valutare se l'ingente spesa in token AI si traduca effettivamente in valore e lavoro concreto.

La motivazione sottostante a questa massiccia allocazione di fondi verso gli strumenti AI è chiara: la sostituzione del lavoro umano. Mentre le grandi aziende utilizzano l'AI per giustificare tagli al personale, le startup la impiegano per evitare del tutto nuove assunzioni. Chen Avnery, cofondatore di Fundable AI, ha commentato che la spesa in AI non è un costo, ma una riallocazione del budget per il personale, sostenendo che l'investimento in AI può generare un output dieci volte superiore rispetto al costo equivalente del lavoro umano, con una crescita lineare della spesa in token e una crescita esponenziale dell'output. Questo approccio alimenta la visione di "aziende da un miliardo di dollari con una sola persona", un ideale promosso da diverse startup AI e fondi di venture capital.

Implicazioni e interrogativi sulla sostenibilità

Nonostante l'entusiasmo, rimangono aperte questioni cruciali sulla sostenibilità e l'efficacia di questo modello. Gli imprenditori che praticano il "tokenmaxxing" spesso tralasciano di considerare se l'investimento in compute AI sia realmente vantaggioso, se il denaro non sarebbe meglio impiegato nell'assunzione di personale qualificato, quali disastri potrebbero verificarsi e se il tutto sia finanziariamente sostenibile a lungo termine. Aziende come OpenAI e Anthropic, pur essendo leader nel settore, stanno affrontando perdite significative, poiché il costo del compute per l'intelligenza artificiale, sebbene elevato, è spesso sottostimato rispetto al suo reale valore di mercato.

Per le aziende che valutano un deployment on-premise di LLM o soluzioni AI, l'analisi del Total Cost of Ownership (TCO) diventa fondamentale. La spesa per i token in cloud, come quella descritta, rappresenta un costo operativo (OpEx) che, sebbene flessibile, può rapidamente diventare insostenibile. Un'alternativa on-premise, pur richiedendo un investimento iniziale (CapEx) in hardware come GPU con elevata VRAM e infrastruttura dedicata, può offrire maggiore controllo sui costi a lungo termine, sovranità dei dati e prevedibilità delle spese, mitigando i rischi di "workslop" – ovvero la necessità di intervento umano per correggere errori generati dall'AI – e di cicli infiniti di consumo di token. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi trade-off, fornendo strumenti per decisioni informate.

La prospettiva futura: efficienza o illusione?

La narrazione dominante suggerisce che un maggiore utilizzo di token AI equivale a una maggiore produttività. Tuttavia, la realtà è più complessa. Esistono numerose testimonianze di "workslop" e della necessità di un significativo intervento umano per correggere codice, testi o prodotti generati dall'AI. Inoltre, non mancano storie di orrore in cui l'AI si blocca in loop, consumando migliaia di dollari in token per compiti inutili. Questi scenari mettono in discussione l'efficienza presunta e la sostenibilità finanziaria del "tokenmaxxing".

La spinta verso aziende "autonome" con pochi o nessun dipendente umani, guidata da agenti AI, rappresenta una visione ambiziosa. Tuttavia, il dibattito sulla reale efficacia e sul ritorno sull'investimento di queste strategie è appena iniziato. Mentre una nuova generazione di imprenditori sembra determinata ad "assumere" l'AI al posto degli esseri umani, il mercato e le metriche di valore reali dovranno dimostrare se questa tendenza sia un percorso sostenibile verso l'innovazione o una costosa illusione. La scelta tra un modello basato sul cloud con costi variabili e un'infrastruttura self-hosted con un TCO più prevedibile sarà cruciale per le decisioni strategiche future.