Altro – Notizie e Articoli AI

📁 Altro AI generated

Core42 di G42: un ex ufficio di Minneapolis diventa data center AI da 20 MW

Core42, sussidiaria di G42, ha trasformato un ex edificio per uffici a Minneapolis in un data center AI da 20 megawatt. Questa mossa strategica, lontana dai tradizionali hyperscaler della Silicon Valley, evidenzia l'impegno verso infrastrutture dedicate per carichi di lavoro AI intensivi. La conversione sottolinea la crescente domanda di spazi fisici attrezzati e la ricerca di maggiore controllo e sovranità dei dati per il Deployment di Large Language Models.

2026-05-06 Fonte

📁 Altro AI generated

L'AI nella Ricerca di Google: Implicazioni per i Deployment Enterprise On-Premise

Google ha integrato funzionalità di intelligenza artificiale, come 'AI Mode' e 'Search Live', nella sua piattaforma di ricerca per offrire assistenza pratica agli utenti. Questo sviluppo evidenzia la crescente adozione dell'AI in applicazioni quotidiane, spingendo le aziende a valutare le strategie di deployment per carichi di lavoro simili, in particolare le opzioni self-hosted per garantire sovranità dei dati e controllo sui costi.

2026-05-06 Fonte

📁 Altro AI generated

Qwen 3.6 27B: inference 2.5x più rapida con MTP per deployment locali

Un recente aggiornamento a `llama.cpp` introduce il supporto per la Multi-Token Prediction (MTP) nel modello Qwen 3.6 27B, accelerando l'inference fino a 2.5 volte. Questa innovazione, combinata con la compressione della KV cache a 4-bit e un'ampia finestra di contesto di 262K token, rende il modello una soluzione più efficiente per carichi di lavoro LLM self-hosted su hardware come Apple Silicio e GPU NVIDIA, con requisiti di memoria specifici.

2026-05-06 Fonte

📁 Altro AI generated

Contenuti AI di bassa qualità: un problema che affligge anche i forum cybercriminali

Anche le comunità underground di cybercriminali lamentano un'invasione di contenuti generati da intelligenza artificiale di scarsa qualità. Questo fenomeno, che affligge diverse piattaforme online, solleva interrogativi sulla gestione dei Large Language Models e sull'importanza della qualità dei dati e del fine-tuning, aspetti cruciali per chi valuta deployment on-premise e la sovranità dei dati.

2026-05-06 Fonte

📁 Altro AI generated

Opposizione crescente ai data center AI: quasi la metà degli americani contraria

Un recente sondaggio rivela che il 47% degli americani si oppone alla costruzione di nuovi data center dedicati all'intelligenza artificiale nelle proprie vicinanze. Questa resistenza si manifesta anche attraverso eventi pubblici, come un raduno a St. Paul, Minnesota, evidenziando una crescente preoccupazione per l'impatto di queste infrastrutture sul territorio e sulle comunità locali, un fattore cruciale per le strategie di deployment on-premise.

2026-05-06 Fonte

📁 Altro AI generated

Genesis AI svela GENE-26.5 e un approccio "full-stack" alla robotica

La startup Genesis AI, sostenuta da un finanziamento seed di 105 milioni di dollari, ha presentato il suo primo modello di intelligenza artificiale, GENE-26.5, specificamente progettato per la robotica. L'annuncio è accompagnato da una dimostrazione che illustra mani robotiche eseguire compiti complessi, evidenziando un'integrazione profonda tra AI e hardware.

2026-05-06 Fonte

📁 Altro AI generated

Gemma 4 di Google: Multi-Token Prediction Accelera l'Inference Locale fino a 3x

Google ha introdotto Multi-Token Prediction (MTP) per i suoi LLM Gemma 4, ottimizzati per l'esecuzione locale. Questa nuova funzionalità sperimentale, basata su speculative decoding, promette di velocizzare la generazione di token fino a tre volte, affrontando le limitazioni hardware dei deployment on-premise. Con la licenza Apache 2.0, Gemma 4 rafforza il controllo sui dati e l'accessibilità per gli sviluppatori e le aziende che cercano soluzioni AI self-hosted.

2026-05-06 Fonte

📁 Altro AI generated

Qwen3.6 27B su RTX 5090: 200k token di contesto con vLLM in locale

Un recente test ha dimostrato la capacità di eseguire il modello Qwen3.6 27B, quantizzato in NVFP4, su una singola GPU NVIDIA RTX 5090 con 32GB di VRAM. Utilizzando il framework vLLM, il setup ha gestito una finestra di contesto di 200.000 token, raggiungendo una velocità di generazione media di circa 73.6 token al secondo. Questi risultati evidenziano il potenziale delle soluzioni on-premise per carichi di lavoro LLM ad alto contesto su hardware consumer.

2026-05-06 Fonte

📁 Altro AI generated

Dell e Lenovo rafforzano il supporto a LVFS per il firmware su Linux

Dell e Lenovo sono diventati sponsor di primo livello del Linux Vendor Firmware Service (LVFS). Questa iniziativa sottolinea l'importanza della gestione del firmware in ambienti Linux, un aspetto cruciale per le infrastrutture on-premise. LVFS, supportato dal client Fwupd, garantisce aggiornamenti fluidi per il firmware di sistema e dei componenti, migliorando la stabilità e la sicurezza delle piattaforme enterprise.

2026-05-06 Fonte

📁 Altro AI generated

Gemma 4 26B: Un Nuovo Approccio per LLM Locali con Attenzione Decoupled

Una nuova tecnica promette di superare i limiti di scalabilità dei Large Language Models (LLM) su hardware locale. L'approccio prevede il decoupling del meccanismo di attenzione, che richiede pochi gigabyte di memoria, dai pesi del modello, che possono essere gestiti su una macchina separata, potenzialmente meno potente come un sistema basato su CPU Xeon. Questo apre nuove possibilità per deployment on-premise, riducendo i requisiti hardware complessivi e migliorando l'accessibilità.

2026-05-06 Fonte

📁 Altro AI generated

OpenAI presenta MRC: un nuovo protocollo di rete per l'AI su larga scala

OpenAI ha introdotto MRC (Multipath Reliable Connection), un nuovo protocollo di rete per supercomputer. Rilasciato tramite OCP, mira a migliorare la resilienza e le prestazioni nei cluster di training AI su larga scala, offrendo soluzioni cruciali per le infrastrutture on-premise e per chi cerca maggiore controllo e affidabilità.

2026-05-06 Fonte

📁 Altro AI generated

NVIDIA Spectrum-X MRC: Il Protocollo RDMA per l'AI su Larga Scala

NVIDIA ha introdotto Spectrum-X MRC, un protocollo di trasporto RDMA personalizzato progettato per alimentare i deployment di intelligenza artificiale su scala gigascale. Questa tecnicia sottolinea l'importanza di soluzioni di rete ad alte prestazioni per le infrastrutture AI moderne, offrendo vantaggi cruciali per le organizzazioni che mirano a costruire ambienti self-hosted o ibridi con elevato throughput e bassa latenza, mantenendo controllo e sovranità dei dati.

2026-05-06 Fonte

📁 Altro AI generated

La Thailandia si afferma come hub AI regionale con investimenti da 29 miliardi di dollari

Il Consiglio per gli Investimenti della Thailandia ha approvato sei importanti progetti per un valore complessivo di 29 miliardi di dollari, tre dei quali sono data center. L'espansione del data center di TikTok, da sola, ammonta a 25 miliardi di dollari, segnalando un'accelerazione del Paese verso il posizionamento come snodo chiave per l'infrastruttura AI nella regione. Questa mossa evidenzia l'importanza crescente delle capacità di calcolo locali per i carichi di lavoro di intelligenza artificiale.

2026-05-06 Fonte

📁 Altro AI generated

6G: I dieci abilitatori tecnicici che plasmeranno il futuro delle reti wireless

Il 6G si preannuncia come una rivoluzione nelle comunicazioni wireless, integrando tecnicie avanzate per superare i limiti attuali. Questo articolo esplora i dieci pilastri tecnicici che definiranno le reti di sesta generazione, dalle nuove bande di frequenza all'intelligenza artificiale, dalle superfici intelligenti riconfigurabili alle architetture di rete innovative. Un'analisi essenziale per comprendere le fondamenta delle future infrastrutture digitali e le loro implicazioni per i deployment on-premise.

2026-05-06 Fonte

📁 Altro AI generated

Il dibattito sull'IA: tra percezioni pubbliche e complessità di deployment

Mentre il dibattito pubblico sull'impatto dell'intelligenza artificiale si intensifica, con voci che ne criticano gli effetti sulla società, i decision-maker IT affrontano sfide concrete legate al deployment di Large Language Models. L'analisi si sposta sulla necessità di valutare attentamente i trade-off tra soluzioni cloud e on-premise, considerando aspetti come la sovranità dei dati, il TCO e le specifiche hardware.

2026-05-06 Fonte

📁 Altro AI generated

Danimarca in pausa: la rete elettrica frena i nuovi data center per l'AI

La Danimarca ha bloccato temporaneamente le nuove connessioni alla rete elettrica per i data center, a fronte di richieste che hanno raggiunto i 60 GW. La nazione nordica si unisce così ad altri paesi che stanno rallentando lo sviluppo di infrastrutture dedicate all'intelligenza artificiale, evidenziando le crescenti sfide legate alla capacità energetica e alla stabilità della rete. La decisione solleva interrogativi sulle implicazioni per i deployment su larga scala.

2026-05-06 Fonte

📁 Altro AI generated

Chrome e il modello AI da 4GB: dubbi su privacy e consumo energetico

Un rapporto recente evidenzia come Google Chrome abbia scaricato un modello AI da 4GB sui dispositivi degli utenti senza autorizzazione. La pratica solleva interrogativi sulla violazione delle leggi europee sulla privacy, come il GDPR, e sull'impatto in termini di consumo energetico, stimato in migliaia di kilowatt. La vicenda mette in luce le sfide legate al deployment di LLM su dispositivi edge e la necessità di trasparenza e controllo.

2026-05-06 Fonte

📁 Altro AI generated

Il 'Paradosso della Trasformazione' frena l'adozione dell'AI in azienda, secondo Microsoft

Uno studio sull'adozione dell'AI in ambito lavorativo, condotto da Microsoft, evidenzia un "Paradosso della Trasformazione". Il 45% degli intervistati preferisce concentrarsi sugli obiettivi attuali piuttosto che sull'innovazione legata all'intelligenza artificiale. Questa cautela rallenta l'integrazione delle nuove tecnicie, suggerendo una resistenza al cambiamento nonostante i potenziali benefici a lungo termine. Il fenomeno solleva interrogativi sulle strategie di deployment e sull'importanza di una chiara visione per l'integrazione dell'AI.

2026-05-06 Fonte

📁 Altro AI generated

L'impennata del networking AI spinge Lumentum a una crescita record

Lumentum registra una crescita eccezionale, trainata dalla crescente domanda di infrastrutture di rete per l'intelligenza artificiale. Questo trend evidenzia l'importanza critica del networking ad alte prestazioni per i carichi di lavoro LLM, specialmente in contesti di deployment on-premise, dove la gestione della larghezza di banda e della latenza è fondamentale per la scalabilità e il TCO.

2026-05-06 Fonte

📁 Altro AI generated

Google avverte l'UE: schema di anonimizzazione dati violabile in due ore

Sergei Vassilvitskii, scienziato di spicco di Google, ha avvertito la Commissione Europea che il suo schema proposto per l'anonimizzazione dei dati di ricerca, finalizzato alla condivisione forzata, può essere compromesso in soli 120 minuti. La dimostrazione, condotta dal suo "red team", solleva serie preoccupazioni sulla sicurezza e la sovranità dei dati, in vista della scadenza decisionale del 27 luglio.

2026-05-06 Fonte