Rete di cryptomining con 320.000 GPU: 112 MW per calcoli "inutili" e costi GPU alle stelle

Una Rete di Cryptomining Sotto Accusa

Un recente studio ha puntato i riflettori su una presunta rete di cryptomining di dimensioni considerevoli, che opererebbe utilizzando un numero impressionante di unità di elaborazione grafica. Si parla di circa 320.000 GPU di classe NVIDIA RTX 3090, un hardware potente e ricercato per carichi di lavoro intensivi, inclusi quelli legati all'intelligenza artificiale. L'accusa principale mossa dallo studio è che questa infrastruttura, apparentemente legata all'entità "Pearl", stia consumando una quantità enorme di energia – stimata in 112 megawatt – per eseguire calcoli che vengono definiti "zero useful AI computation".

Questa situazione solleva questioni cruciali sull'allocazione delle risorse computazionali e sull'impatto energetico di attività che, pur sfruttando hardware ad alte prestazioni, non contribuiscono direttamente allo sviluppo o all'implementazione di soluzioni AI significative. La distinzione tra calcolo generico e "AI utile" è fondamentale, specialmente in un'epoca in cui la domanda di capacità computazionale per Large Language Models (LLM) e altri carichi di lavoro AI è in costante crescita.

Il Dettaglio Tecnico e il Consumo Energetico

Le GPU di classe RTX 3090 sono note per le loro capacità di calcolo e, in particolare, per i 24GB di VRAM, una specifica che le rende adatte per l'inference di LLM di medie dimensioni o per il fine-tuning di modelli più piccoli. Tuttavia, lo studio afferma che queste schede sarebbero impiegate in "random matrix math", ovvero calcoli matriciali casuali. Sebbene le operazioni matriciali siano il fondamento di quasi tutti i carichi di lavoro AI, l'aggettivo "random" suggerisce che questi calcoli non siano parte di un algoritmo strutturato per addestrare o eseguire inference su modelli di intelligenza artificiale con uno scopo specifico.

Il consumo di 112 megawatt per alimentare una tale flotta di GPU è un dato significativo. Per contestualizzare, si tratta di una quantità di energia paragonabile al fabbisogno di una città di medie dimensioni. Questo dispendio energetico per attività non direttamente produttive per l'AI utile evidenzia l'urgente necessità di ottimizzare l'uso delle risorse hardware e di valutare attentamente il Total Cost of Ownership (TCO) delle infrastrutture, dove il costo dell'energia rappresenta una componente sempre più rilevante.

Impatto sul Mercato e Considerazioni per il Deployment On-Premise

L'attività di questa rete di cryptomining non ha solo implicazioni energetiche, ma ha anche un impatto tangibile sul mercato dell'hardware. Lo studio sostiene che la domanda generata da questa flotta di GPU abbia contribuito a un aumento del 38% nei costi di noleggio delle GPU. Questo incremento dei prezzi è una notizia preoccupante per le aziende e i team che cercano di implementare soluzioni AI, in particolare per coloro che valutano un deployment on-premise o self-hosted.

Per CTO, DevOps lead e architetti di infrastrutture, la volatilità dei costi hardware è un fattore critico nella pianificazione. Un aumento così marcato nei prezzi di noleggio può alterare significativamente le proiezioni di TCO e rendere più complessa la decisione tra soluzioni cloud e on-premise. Le infrastrutture self-hosted offrono vantaggi in termini di sovranità dei dati, controllo e, potenzialmente, stabilità dei costi a lungo termine, ma sono anche più esposte alle fluttuazioni del mercato hardware al momento dell'acquisto o dell'espansione. AI-RADAR offre framework analitici su /llm-onpremise per valutare questi trade-off, fornendo strumenti per un'analisi approfondita dei vincoli e delle opportunità.

Prospettive e Trade-off nel Panorama AI

La vicenda di questa rete di cryptomining evidenzia una tensione crescente nel panorama tecnicico: la competizione per le risorse computazionali ad alte prestazioni. Mentre l'innovazione nell'AI richiede sempre più potenza di calcolo, l'uso di tale potenza per scopi meno produttivi o addirittura speculativi può distorcere il mercato e rallentare l'adozione di tecnicie AI utili.

Per le organizzazioni che mirano a costruire e gestire i propri stack locali per LLM, la disponibilità e il costo dell'hardware rimangono sfide primarie. La scelta tra l'investimento iniziale in un'infrastruttura bare metal o l'affitto di risorse cloud deve considerare non solo le specifiche tecniche e le performance attese, ma anche la resilienza ai cambiamenti del mercato e la capacità di garantire la sovranità dei dati. La chiave è una pianificazione strategica che bilanci le esigenze di performance, i vincoli di budget e la necessità di controllo sull'intera pipeline AI.