Digest Settimanale Questa settimana

📖 AI-Radar · 2026-W27

29 June – 05 July 2026 · 11 articoli pubblicati

📁 Altro 7

Modello 800M trasforma immagini in personaggi giocabili, tutto in esecuzione locale

Un ricercatore ha rilasciato la versione da 800 milioni di parametri del suo modello di diffusione causale per la generazione di personaggi controllabili. L'esecuzione avviene interamente in locale su GPU consumer, con la variante da 500M che supera i 60 fps su RTX 5090. Il contesto è stato ampliato a 12 frame latenti, migliorando stabilità, ma la coerenza resta un punto critico. L'architettura sfrutta una KV cache con finestra scorrevole per gestire la memoria.

29 Jun #Hardware #LLM On-Premise #DevOps

Johor, rete elettrica sotto stress: cosa significa per i data center on-premise

L'espansione della pipeline di data center a Johor mette in luce la pressione sulle infrastrutture energetiche locali. Per le aziende che valutano deployment on-premise, diventa urgente pesare TCO, sostenibilità e sovranità dei dati.

29 Jun #Hardware #LLM On-Premise #DevOps

Potens entra nel raffreddamento IA: il TCO on-premise passa dal calore

Potens si espande nei mercati del raffreddamento e dell'alimentazione per server AI, con una quota del fatturato server che raggiunge la doppia cifra. Per chi gestisce deployment on-premise di LLM, la gestione termica non è più un optional: condiziona densità, longevità hardware e costo totale di possesso.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

AI fisica: la Corea del Sud passa alla pratica, l'Europa cerca fornitori non cinesi

Mentre Seul trasforma la strategia sull’intelligenza artificiale per la robotica e il manifatturiero in progetti concreti, Bruxelles accelera la ricerca di catene di approvvigionamento hardware che evitino la dipendenza da Pechino. Due mosse destinate a incidere sulle scelte di deployment on-premise, sulla sovranità dei dati e sul calcolo del TCO per le aziende.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

Mageia 10 debutta: l’eredità Mandrake e il valore della sovranità Linux per gli stack on-prem

La distribuzione comunitaria Mageia 10, discendente di Mandrake e Mandriva, offre una base stabile per infrastrutture self-hosted. Per chi costruisce pipeline LLM on-premise, la scelta di un sistema indipendente richiama i principi di controllo, trasparenza e TCO, senza sorprese da roadmap corporate.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

LG spinge sul raffreddamento a liquido per i data center AI, nel mirino i server partner taiwanesi

Il colosso coreano accelera sugli impianti di raffreddamento a liquido per data center, puntando a collaborazioni con i produttori taiwanesi di server. Una mossa che ridefinisce la geografia dell'infrastruttura AI on-premise, tra efficienza termica e sovranità dei carichi di lavoro.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

Crescita a doppia cifra per AIC: l'infrastruttura AI si sposta sui sistemi a livello rack

AIC registra una crescita a doppia cifra mentre l'infrastruttura per l'intelligenza artificiale si evolve verso architetture rack-level. Cosa significa per il deployment on-premise e la sovranità dei dati.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

📁 Hardware 3

La memoria diventa strategica nell’AI: Winbond punta su DRAM e Flash per il prossimo salto

Per l’AI on-premise la memoria non è più una commodity: è la risorsa che decide cosa puoi eseguire. Il presidente di Winbond, James Chen, indica DRAM e Flash come direttrici di sviluppo. Cosa significa per chi costruisce infrastrutture locali per LLM.

29 Jun #Hardware #LLM On-Premise #DevOps

L’export AI spinge l’elettronica taiwanese: che segnale è per chi sceglie il self-hosted

La domanda di AI alimenta l’ottimismo del comparto elettronico di Taiwan, con export in crescita. AI-RADAR legge il fenomeno guardando alla disponibilità futura di hardware per inference on-premise, ai possibili effetti sulla catena di fornitura globale e ai riflessi in termini di TCO e sovranità dei dati per chi oggi valuta stack locali.

29 Jun #Hardware #LLM On-Premise #DevOps

Goertek, wafer AR da 12 pollici: più guide d’onda, meno costi per occhiali AI

La nuova linea di produzione del gigante cinese promette di raddoppiare la resa di guide d’onda ottiche, componente cruciale per gli occhiali a realtà aumentata. Sfruttando wafer da 12 pollici, Goertek mira ad abbattere i costi unitari e ad accelerare l’adozione di dispositivi indossabili con AI integrata, rimescolando le carte dell’intero settore.

29 Jun #Hardware #LLM On-Premise #DevOps

📁 Market 1

HP Inc. lancia la partnership Frontier con OpenAI: IA enterprise e implicazioni on-premise

HP Inc. estende la partnership strategica Frontier per portare l'AI nelle esperienze cliente, nello sviluppo software e nelle operazioni aziendali. Per i team che valutano l'adozione su larga scala, il nodo cruciale resta il deployment: cloud o on-premise? L'analisi di AI-RADAR esplora i trade-off tra controllo dei dati, hardware necessario e costi.

29 Jun #Hardware #LLM On-Premise #Fine-Tuning

← 2026-W26 Tutte le notizie