Il boom dell’intelligenza artificiale ha un lato poco glamour: l’idraulica. Mentre i data center stipano sempre più GPU in ogni rack e le spingono a temperature più elevate, il liquido che impedisce ai chip di fondere ha cominciato, di tanto in tanto, a trasformarsi in una brodaglia biologica. Omen AI ha costruito una startup attorno a questo problema e ha appena raccolto 31 milioni di dollari per portare la sua soluzione fuori dai laboratori.

Il finanziamento, riportato da The Next Web, segnala che la manutenzione dei fluidi di raffreddamento non è più una nota a margine per i gestori di infrastrutture AI, ma una voce di spesa e un fattore di rischio che scala con la potenza installata. Le GPU di ultima generazione, come le NVIDIA H100 e le prossime B200, dissipano centinaia di watt in pochi centimetri quadrati: servono circuiti a liquido sempre più efficienti, ma proprio quell’ambiente caldo e umido è ideale per biofilm e colonie batteriche.

Cosa succede dentro i tubi

Il raffreddamento a liquido per l’AI non è una novità, ma l’aumento della densità — fino a 30-40 kW per rack — sta spingendo verso configurazioni a diretto contatto con i chip (direct-to-chip) o a immersione. In entrambi i casi, l’acqua demineralizzata o i fluidi dielettrici devono restare chimicamente stabili per evitare corrosione, incrostazioni e ostruzioni nei microcanali. Quando i batteri attecchiscono, formano uno strato vischioso che riduce lo scambio termico e può intasare pompe e scambiatori. I tecnici se ne accorgono solo quando le temperature delle GPU iniziano a salire, con conseguente throttling e rischio di degrado precoce dell’hardware.

Omen AI ha brevettato sensori e un sistema di monitoraggio continuo che analizza in tempo reale la carica microbica e la qualità chimica del fluido, inviando alert prima che si formino depositi critici. L’obiettivo è passare dalla manutenzione reattiva a quella predittiva, evitando fermi macchina e sostituzioni di interi lotti di liquido.

Perché la vicenda conta per chi fa inference on-premise

Le grandi nuvole pubbliche assorbono gran parte dell’attenzione, ma molte aziende — dalla sanità alla finanza — stanno portando i modelli dentro casa per questioni di sovranità dei dati, latenza e controllo dei costi. Quando si installano cluster di GPU in sede, la progettazione dell’impianto di raffreddamento diventa parte integrante del Total Cost of Ownership (TCO). Un conto è usare il cloud e delegare la gestione fisica, un altro è accorgersi che il proprio armadio raffreddato a liquido sviluppa colonie batteriche dopo sei mesi, causando downtime non previsto.

In quest’ottica, la tecnicia di Omen AI non è solo una curiosità da facility manager, ma un tassello dell’affidabilità operativa per qualsiasi deployment on-premise ad alta densità. AI-RADAR, che segue con attenzione l’evoluzione degli stack self-hosted, offre modelli analitici su /llm-onpremise per valutare questi trade-off: scegliere un sistema di raffreddamento significa anche capire quanto costerà mantenerlo sano nel tempo.

Oltre il rumore

Il round da 31 milioni suggerisce che il venture capital sta cominciando a guardare oltre i modelli e i chip, verso quella fitta rete di servizi ancillari che rende sostenibile l’infrastruttura dell’AI. Controllare la qualità dell’acqua di raffreddamento non è un’innovazione di rottura, ma diventa indispensabile quando ogni grado in più sulle GPU si traduce in un calcolo di millisecondi sulla latenza di inference o in un punto percentuale in meno di throughput.

Con l’arrivo di rack da oltre 100 kW previsti per le prossime generazioni, la gestione termica sarà tanto strategica quanto la scelta del modello o della pipeline di serving. E se il futuro dell’AI passa anche dai tubi, qualcuno dovrà pur sorvegliarli.