Baseten incassa 1,5 miliardi: l'infrastruttura AI cloud vola a 13 miliardi di valutazione

Con un round Serie F da 1,5 miliardi di dollari e una valutazione che può toccare i 13 miliardi, Baseten segna il più grande investimento singolo mai effettuato da una società australiana di venture capital. Blackbird VC ha messo sul piatto una cifra senza precedenti nel panorama australiano, puntando su una startup che in appena 18 mesi ha scalato le gerarchie dell’infrastruttura AI cloud.

La notizia arriva a conferma di un mercato in ebollizione: fornire gli strati software e hardware per far girare modelli di linguaggio su larga scala è diventato uno dei business più capitalizzati del momento. Baseten non produce GPU ma offre una piattaforma che semplifica il deployment e la scalabilità dei modelli, riducendo la complessità per i team di data science.

L’ascesa dell’infrastruttura as a service

Baseten si inserisce in una categoria di startup — insieme a nomi come Modal, Banana o Replicate — che hanno trasformato la fase di inference in un servizio gestito. Invece di acquistare hardware e configurare cluster, le aziende possono esporre modelli tramite API, pagando a consumo. Un modello di business agile, che attrae capitali perché scommette sull’esplosione della domanda di calcolo.

Tuttavia, la cifra record solleva una tensione che molti team IT conoscono bene. Da un lato, la promessa del cloud è ridurre i costi iniziali e delegare la gestione dell’infrastruttura. Dall’altro, per carichi di lavoro prevedibili e ad alta intensità di inference, il costo ricorrente (OpEx) può superare rapidamente l’investimento in hardware on-premise (CapEx). Inoltre, chi opera in settori regolamentati o con dati sensibili spesso non può permettersi di trasferire informazioni su cloud pubblici.

Il trade-off on-premise

Per chi valuta un deployment locale, la domanda non è solo “quanto spendo oggi”, ma “quanto controllo ho sui miei dati, sulla latenza e sui costi nel lungo periodo”. Baseten risolve un problema reale per startup e aziende che vogliono velocità, ma non affronta i vincoli di chi ha bisogno di air-gap, conformità GDPR stringente o volumi di traffico tali da rendere più economico possedere l’hardware.

AI-RADAR segue da vicino queste dinamiche: analizza framework e configurazioni per LLM on-premise, confrontando TCO, throughput e requisiti di VRAM. In un contesto in cui il round di Baseten mostra quanto capitale affluisca verso il cloud, è cruciale ricordare che la scelta tra cloud e on-premise non è ideologica, ma tecnica e finanziaria.

Cosa significa per il futuro

L’iniezione di 1,5 miliardi dollari permetterà a Baseten di espandere la propria infrastruttura, probabilmente stringendo accordi ancora più stretti con fornitori di GPU e data center. Più potenza cloud, più servizi gestiti, più astrazione. Per l’ecosistema on-premise, questo rappresenta uno stimolo a migliorare strumenti di orchestrazione e a rendere i deploy locali tanto semplici quanto quelli cloud.

La direzione è chiara: l’AI sta passando dalla fase sperimentale a quella industriale. E l’infrastruttura — distribuita, ibrida o interamente di proprietà — è il terreno su cui si giocherà la prossima partita.