Una cifra tra i 20 e i 25 milioni di dollari. A tanto ammonterebbe l’investimento che 360 One sta per finalizzare in Rocket, startup indiana attiva nell’intelligenza artificiale. La notizia, raccolta da fonti vicine all’operazione, aggiunge che altri investitori potrebbero partecipare al round, rafforzando un segnale già nitido: l’AI indiana attira capitali, e non solo per il software generico, ma per quell’infrastruttura che permette alle imprese di mantenere il controllo diretto sui propri modelli.

L’onda lunga degli investimenti in AI on-premise

Rocket non ha ancora reso pubblico il proprio prodotto, ma il contesto di mercato offre coordinate precise. La domanda di soluzioni per eseguire Large Language Models in ambienti self-hosted — server on-premise, nodi edge, data center privati — sta crescendo rapidamente. A spingere sono tre leve ormai classiche: la necessità di sovranità sui dati (soprattutto in settori regolamentati come finanza, sanità e pubblica amministrazione), la prevedibilità del Total Cost of Ownership rispetto ai costi variabili del cloud, e la possibilità di ottimizzare la latenza o personalizzare i modelli senza vincoli esterni.

In questo framework, un finanziamento di questa taglia non è un evento isolato. Startup che semplificano il fine-tuning on-premise, la quantization a basso impatto di VRAM o la gestione di pipeline di inference su hardware proprietario sono sempre più sotto i riflettori dei venture capital. Rocket potrebbe inserirsi in questo filone, ma anche se così non fosse, l’operazione di 360 One certifica l’appetito per realtà in grado di abilitare un’AI locale, lontana dai grandi iperscaler.

Perché l’on-premise non è più una nicchia

Fino a poco tempo fa, il deployment on-premise di LLM era considerato roba da early adopter o da organizzazioni con esigenze estreme di sicurezza. Oggi non più. Da un lato, la maturazione di framework come vLLM, Ollama e TensorRT-LLM ha abbassato la barriera tecnica. Dall’altro, la disponibilità di GPU con VRAM generosa (dagli 80 GB di una A100 alle soluzioni multi-GPU con NVLink) e le tecniche di quantization (INT8, FP16) permettono di far girare modelli da decine di miliardi di parametri in spazi fisici contenuti.

Per le aziende italiane ed europee, questo significa poter valutare seriamente un’infrastruttura AI self-hosted, allineata ai vincoli GDPR senza dover negoziare clausole contrattuali complesse con i cloud provider. Non è una questione di costo assoluto — l’on-premise richiede CapEx iniziale e competenze dedicate — ma di costo prevedibile nel tempo e di controllo sull’intera catena del dato. Chi inizia oggi con un investimento di poche decine di migliaia di euro può scalare con relativa semplicità, aggiungendo nodi o accelerando l’inference via software.

Il segnale per l’ecosistema

Rocket, qualunque sia la sua roadmap tecnicica, si inserisce in una traiettoria dove il capitale non cerca solo il prossimo ChatGPT, ma anche il prossimo tassello per rendere l’AI davvero operativa in azienda. L’India, con il suo serbatoio di talento e con mercati verticali ancora in digitalizzazione, rappresenta un banco di prova ideale. Se il round attirerà altri investitori, come suggeriscono le fonti, il messaggio per il settore sarà ancora più forte: il futuro dell’AI non è solo nei cloud, ma anche nei rack delle imprese che scelgono di portarselo in casa.

Per chi sta valutando questa strada, esistono trade-off da soppesare: la curva di apprendimento dei team interni, la manutenzione hardware, il bilanciamento tra CapEx e OpEx. AI-RADAR offre framework analitici approfonditi su /llm-onpremise proprio per orientarsi in questi passaggi, senza scorciatoie ma con dati concreti. La notizia di oggi, insomma, è insieme un punto di arrivo e un punto di partenza: gli investimenti seguono la domanda, e la domanda di AI locale è solo all’inizio.