A sei anni dal lancio di AlphaGo, Google DeepMind torna a segnare il dibattito sull'evoluzione dell'intelligenza artificiale, questa volta pubblicando una mappatura di quattro percorsi che potrebbero condurre da quella che chiamiamo AGI — artificial general intelligence, in grado di eguagliare le capacità cognitive umane — fino a una ASI, artificial superintelligence, capace di superare sistematicamente l'uomo in ogni ambito. Il lavoro, rilanciato ieri con un solo riferimento all'AFP, non è ancora disponibile integralmente, ma basta il titolo per sollevare domande pesanti su come si attrezzeranno le organizzazioni che oggi investono su LLM e training on-premise.

Non è più fantascienza: perché la mappatura conta

Il passaggio da AGI a ASI viene spesso dipinto come un salto quantico difficilmente governabile. DeepMind, da sempre attenta agli aspetti di sicurezza e allineamento, prova invece a tracciare strade evolutive, probabilmente distinte per architettura modulare, capacità di auto-miglioramento, metodi di apprendimento e integrazione con dati esterni. Per chi lavora nel mondo enterprise, questo annuncio non è teoria pura: segnala che la corsa verso sistemi più potenti sarà scandita da scelte infrastrutturali non banali.

Per esempio, se una delle vie ipotizzate prevedesse un superamento rapido delle performance umane grazie a tecniche di reinforcement learning su scala massiccia, le aziende che oggi fanno fine-tuning di LLM in locale, su stack self-hosted alimentati da GPU ad alta VRAM, dovrebbero ripensare in fretta le proprie dotazioni. Non si tratterebbe più di servire modelli da centinaia di miliardi di parametri, ma di gestire carichi computazionali in cui il confine tra training e inference si assottiglia, con necessità di memoria e bandwidth che oggi appartengono solo a pochi data center.

Le implicazioni per chi sceglie il deployment on-premise

AI-RADAR segue da tempo la tensione tra cloud e on-premise per i carichi AI più impegnativi. La mappatura di DeepMind aggiunge un tassello strategico: se l'ASI è all'orizzonte dei roadmap di ricerca, le decisioni di oggi su hardware, raffreddamento e networking potrebbero diventare presto obsolete — o, al contrario, rivelarsi l'ancora per mantenere la sovranità sui dati e sui modelli.

Chi oggi valuta server con configurazioni multi-GPU (pensiamo ai sistemi a 512GB di VRAM complessiva, interconnessi con NVLink 4.0) sa già che il TCO è una variabile chiave. La prospettiva di dover supportare modelli ancora più grandi, con finestre di contesto estese e magari capacità di ragionamento ricorsivo, mette sotto pressione tre assi: CapEx per l'acquisto di ferro, OpEx per energia e manutenzione, e costi occulti legati alla sicurezza e alla compliance (GDPR e simili). Non è un caso che diverse banche e gruppi industriali stiano spostando carichi AI delicati su infrastrutture private, lontano da nubi pubbliche.

Cosa può insegnarci il framework di DeepMind

Anche senza conoscere i dettagli del paper, possiamo contestualizzare l'annuncio all'interno di un percorso già noto: la crescita delle prestazioni dei modelli sta costringendo gli sviluppatori a ripensare pipeline e framework di serving. Se oggi strumenti come vLLM o Ollama permettono di ottimizzare la fase di inference su hardware consumer o prosumer, domani, con sistemi orientati alla superintelligenza, serviranno architetture pensate per il training continuo e la quantization spinta a livelli ancora non standardizzati.

Il dibattito aperto da DeepMind, insomma, ci ricorda che il vero collo di bottiglia non sarà soltanto algoritmico. La capacità di gestire localmente un'ASI — ammesso che arrivi — dipenderà da scelte fatte adesso in termini di orchestrazione, storage e isolamento dei dati. Per questo, chi segue le evoluzioni di LLM on-premise farebbe bene a considerare la roadmap verso l'ASI non come un esercizio speculativo, ma come una bussola per investimenti che richiedono anni per essere implementati.