Archivio Notizie – Cronologia Completa Segnali AI

May 09 2026

Altro

Anthropic Mythos: Migliaia di Zero-Day Rilevate, Allarme per la Sicurezza Globale

Anthropic ha sviluppato Mythos, un modello AI che ha identificato migliaia di vulnerabilità zero-day in sistemi operativi e browser. La scoperta ha innescato un allarme ai massimi livelli, con i vertici della Federal Reserve e del Tesoro che hanno contattato i CEO delle banche. L'azienda stima una finestra di 6-12 mesi per correggere le falle prima che attori malevoli possano sfruttarle.

→

May 09 2026

Altro

Ubuntu Touch 24.04-1.3: Miglioramenti per le applicazioni desktop su dispositivi mobili

La nuova release di manutenzione di Ubuntu Touch, la 24.04-1.3, introduce ottimizzazioni significative nella gestione delle applicazioni desktop. Questa distribuzione Linux, pensata per tablet e smartphone, rafforza la sua proposta di valore per scenari che richiedono controllo e flessibilità su dispositivi mobili e edge, con implicazioni per la sovranità dei dati e il TCO.

→

May 09 2026

Market

Indagine su spedizioni illecite di GPU Nvidia H100 ad Alibaba tramite entità thailandesi

Un'indagine rivela che dirigenti legati a Supermicro avrebbero utilizzato un'entità governativa thailandese per spedire GPU Nvidia AI, inclusi modelli Hopper H100, in Cina. Il rapporto suggerisce che il gigante tecnicico cinese Alibaba avrebbe ricevuto server soggetti a restrizioni all'esportazione, sollevando interrogativi sulla compliance e sulla catena di approvvigionamento globale per l'hardware AI ad alte prestazioni.

→

May 09 2026

Hardware

NVIDIA-VAAPI-Driver 0.0.17: Supporto Esteso per i Sistemi GB10

Il progetto open source NVIDIA-VAAPI-Driver ha rilasciato la versione 0.0.17, introducendo un supporto migliorato per i sistemi basati su architettura GB10. Questo driver, sviluppato dalla community, abilita la decodifica video accelerata tramite VA-API su GPU NVIDIA, essenziale per applicazioni come Mozilla Firefox e altri software che operano con i driver Linux proprietari di NVIDIA, contribuendo all'efficienza delle infrastrutture on-premise.

→

May 09 2026

Hardware

TSMC e Sony: una Joint Venture strategica per i sensori AI di nuova generazione

La collaborazione tra TSMC e Sony per lo sviluppo di sensori con capacità AI integrate segna un passo significativo verso l'intelligenza distribuita. Questa joint venture mira a potenziare le applicazioni edge, offrendo soluzioni che bilanciano performance, efficienza energetica e sovranità dei dati, aspetti cruciali per i deployment on-premise.

→

May 09 2026

Altro

Qwen e i costi nascosti del deployment LLM on-premise

Anche i Large Language Models (LLM) apparentemente "gratuiti" o open-weight come Qwen comportano costi significativi per il deployment on-premise. L'analisi del Total Cost of Ownership (TCO) rivela che l'investimento in hardware, l'energia, il raffreddamento e la gestione operativa sono fattori cruciali per le aziende che valutano soluzioni self-hosted, bilanciando controllo e sovranità dei dati con le spese reali.

→

May 09 2026

LLM

Quando la poesia anticipa l'AI: Shel Silverstein e le 'allucinazioni' degli LLM

Un utente di Reddit ha riscoperto una poesia di Shel Silverstein del 1981, trovandovi un'inaspettata premonizione sui Large Language Models (LLM) e il loro noto fenomeno delle "allucinazioni". L'osservazione, seppur umoristica, solleva interrogativi sulla natura dell'intelligenza artificiale e le sfide che le aziende affrontano nel garantire l'affidabilità dei sistemi AI in ambienti critici.

→

May 09 2026

LLM

Qwen3.6-35B-A3B: un LLM 'uncensored' per deployment on-premise e sovranità dei dati

È stato rilasciato Qwen3.6-35B-A3B, un Large Language Model da 35 miliardi di parametri caratterizzato da una configurazione "uncensored" e dalla piena preservazione dei suoi 19 MTP. Disponibile in formati ottimizzati come Safetensors, GGUF, NVFP4 e GPTQ-Int4, questo LLM si propone come una soluzione interessante per le aziende che cercano controllo, sovranità dei dati e flessibilità nei deployment on-premise, riducendo la dipendenza da infrastrutture cloud esterne.

→

May 09 2026

Market

Wistron: profitti triplicati grazie alla robusta domanda di server e AI

Wistron ha registrato un aumento significativo dei profitti, triplicando i risultati precedenti, spinto da una forte crescita nella domanda di server. Questo incremento riflette la robustezza del mercato dell'intelligenza artificiale, che continua a richiedere infrastrutture dedicate e performanti. Il fenomeno evidenzia le sfide e le opportunità per le aziende che valutano deployment on-premise di LLM, tra esigenze di sovranità dei dati e ottimizzazione del TCO.

→

May 09 2026

Market

La crescente carenza di chip di potenza minaccia l'espansione dei server AI

La domanda di server per l'intelligenza artificiale sta esacerbando la carenza di chip di potenza, un componente critico per l'infrastruttura di calcolo. Questa situazione, aggravata dalla competizione nello sviluppo di tecnicie come il nitruro di gallio (GaN), impone nuove sfide e considerazioni strategiche per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando TCO e disponibilità hardware.

→

May 09 2026

Altro

Le nuove regole cyber UE: un cambio di paradigma per la sicurezza AI e la difesa umana

Le recenti normative europee sulla sicurezza informatica stanno ridefinendo l'approccio alla protezione dei sistemi basati sull'intelligenza artificiale. L'attenzione si sposta dall'entusiasmo per l'AI a una difesa più robusta, guidata dall'intervento umano. Questo implica nuove sfide per le aziende che implementano LLM, con un'enfasi crescente sulla sovranità dei dati e sulla compliance, influenzando le decisioni di deployment on-premise.

→

May 09 2026

Altro

Aprile 2026: Una Svolta per i Large Language Models Locali

Il mese di aprile 2026 ha segnato un punto di svolta significativo per i Large Language Models (LLM) destinati a deployment locali. Questa evoluzione apre nuove opportunità per le aziende che cercano maggiore controllo sui dati, sovranità e ottimizzazione del Total Cost of Ownership (TCO), spostando l'attenzione dalle soluzioni cloud-centriche verso architetture self-hosted e air-gapped, cruciali per la gestione di carichi di lavoro AI sensibili.

→

May 09 2026

Market

Semiconduttori e AI: la domanda spinge le supply chain al limite

Il mercato globale dei semiconduttori sta affrontando carenze significative, spinte dalla crescente domanda di intelligenza artificiale. Questa situazione mette sotto forte stress le catene di approvvigionamento, con implicazioni dirette per le aziende che pianificano deployment di Large Language Models (LLM), sia on-premise che in cloud. La disponibilità di hardware specializzato, come le GPU, diventa un fattore critico per la scalabilità e i costi operativi, influenzando il Total Cost of Ownership (TCO) e le strategie di deployment.

→

May 08 2026

Market

Oracle e i licenziamenti: la classificazione dei lavoratori remoti impatta le tutele

Alcuni dipendenti Oracle licenziati hanno tentato di negoziare condizioni di uscita migliori, ma l'azienda ha rifiutato. La classificazione come lavoratori remoti ha impedito ad alcuni di accedere alle tutele previste dal WARN Act, come il preavviso di due mesi, sollevando interrogativi sulle implicazioni delle politiche aziendali per la forza lavoro distribuita.

→

May 08 2026

Altro

Qwen3.6-27B su RTX 4090: 80 t/s con MTP e TurboQuant a 262K di contesto

Un recente esperimento ha dimostrato la capacità di eseguire il Large Language Model Qwen3.6-27B su una singola GPU NVIDIA RTX 4090, raggiungendo performance di 80-87 token al secondo con una finestra di contesto di ben 262K token. L'ottimizzazione è stata possibile grazie all'implementazione congiunta di MTP (Multi-Token Prediction) e TurboQuant, evidenziando il potenziale per deployment on-premise efficienti di LLM di grandi dimensioni su hardware consumer. Questo risultato apre nuove prospettive per le aziende che cercano soluzioni locali per la sovranità dei dati e il controllo dei costi.

→

May 08 2026

Hardware

Qwen 35B-A3B su 12GB VRAM: prestazioni solide per LLM on-premise

Un'analisi tecnica rivela che 12GB di VRAM, come quelli offerti da una RTX 3060, rappresentano un punto di equilibrio ideale per l'esecuzione locale del modello LLM Qwen 35B-A3B. Questa configurazione permette di mantenere un numero sufficiente di blocchi MoE sulla GPU, garantendo buone prestazioni di decoding e supportando contesti ampi fino a 32k token, un aspetto cruciale per i deployment on-premise che cercano efficienza e controllo.

→

May 08 2026

LLM

AI2 presenta EMO: un nuovo LLM MoE con routing documentale avanzato

AI2 ha rilasciato EMO, un nuovo Large Language Model basato su architettura Mixture of Experts. Addestrato su un trilione di token, EMO presenta 1 miliardo di parametri attivi su un totale di 14 miliardi. La sua innovazione risiede nel routing a livello di documento, che consente agli esperti di specializzarsi in domini specifici come salute o notizie, ottimizzando l'elaborazione delle informazioni.

→

May 08 2026

Market

Rocket Lab: Ricavi in Forte Crescita e Backlog Record, in Attesa del Lancio Neutron

Rocket Lab ha registrato una crescita dei ricavi del 64% e un backlog di 2,2 miliardi di dollari, con il titolo azionario a livelli record. L'azienda ha venduto più lanci nel primo trimestre del 2026 che nell'intero anno precedente, ma l'atteso razzo Neutron deve ancora effettuare il suo volo inaugurale, un fattore già prezzato dal mercato.

→

May 08 2026

Altro

Tesla Model Y: test di sicurezza superati, ma indagini in corso su 3,2 milioni di veicoli

L'NHTSA ha annunciato che la Tesla Model Y è il primo veicolo a superare i nuovi test di sicurezza per sistemi avanzati di assistenza alla guida. Contemporaneamente, l'agenzia sta indagando su 3,2 milioni di veicoli Tesla per incidenti avvenuti durante l'uso del sistema di guida autonoma avanzato dell'azienda. La notizia evidenzia la complessità della valutazione delle tecnicie AI in ambito automotive, tra certificazioni e sfide sul campo.

→

May 08 2026

Market

Google integra più link ai siti web negli AI Overviews

Google sta modificando i suoi AI Overviews per includere un maggior numero di link diretti a siti web, una mossa che segue le preoccupazioni dei publisher riguardo al calo di traffico. Le nuove sezioni "Further Exploration" e "Expert Advice" mirano a fornire agli utenti risorse aggiuntive, bilanciando le risposte generate dall'intelligenza artificiale con l'accesso ai contenuti originali del web.

→

May 08 2026

Altro

OpenAI e la sicurezza di Codex: un modello per gli agenti di codice

OpenAI ha delineato le strategie adottate per garantire la sicurezza del suo modello Codex, un agente di codice basato su Large Language Models. L'approccio si fonda su sandboxing, processi di approvazione rigorosi, politiche di rete mirate e telemetria nativa dell'agente. Queste misure sono cruciali per supportare un'adozione sicura e conforme degli agenti di programmazione, affrontando le sfide intrinseche legate all'esecuzione di codice generato dall'IA in ambienti produttivi.

→

May 08 2026

Altro

Violate cinque centrali idriche polacche: la minaccia delle password deboli

Nel 2025, hacker hanno compromesso cinque impianti di trattamento delle acque in Polonia, accedendo ai sistemi di controllo industriale. Il vettore d'attacco si è rivelato essere l'uso di password deboli o predefinite, una vulnerabilità che affligge anche il 70% delle utility idriche americane. L'incidente evidenzia i rischi per le infrastrutture critiche e l'importanza di robuste pratiche di sicurezza per i deployment on-premise.

→

May 08 2026

Altro

Il Pentagono pubblica 162 dossier UFO: trasparenza o segreti?

Il Dipartimento della Guerra statunitense ha lanciato un portale dedicato ai Fenomeni Aerei Non Identificati (UAP), comunemente noti come UFO. Il sito war.gov/ufo ospita 162 documenti, tra cui immagini della missione Apollo 17 e video militari, ma due terzi del materiale risulta parzialmente censurato. L'iniziativa, presentata come un gesto di trasparenza, solleva interrogativi sulla completezza delle informazioni divulgate al pubblico.

→

May 08 2026

Market

Indagine NHTSA su Avride: 16 incidenti in quattro mesi per i robotaxi di Uber

La National Highway Traffic Safety Administration (NHTSA) ha avviato un'indagine su Avride, partner di Uber per i veicoli autonomi, dopo aver registrato 16 incidenti e un infortunio minore in soli quattro mesi a Dallas. L'agenzia ha criticato i robotaxi per la loro "eccessiva assertività e insufficiente capacità", sollevando interrogativi sulla maturità delle tecnicie di guida autonoma e le loro implicazioni per il deployment di sistemi AI in contesti critici.

→

May 08 2026

Frameworks

Lemonade integra vLLM con supporto ROCm: un nuovo backend sperimentale per LLM on-premise

Lemonade, una piattaforma per l'esecuzione locale di Large Language Models, ha annunciato l'integrazione sperimentale di vLLM con supporto ROCm. Questa novità permette di eseguire LLM in formato `.safetensors` direttamente su hardware AMD, offrendo agli sviluppatori e alle aziende un'alternativa per i deployment on-premise. Il team cerca feedback dalla community per guidare lo sviluppo futuro di questa integrazione, mirando a un ecosistema AI più diversificato e flessibile.

→

May 08 2026

Market

Cloudflare: l'AI rende obsoleti 1.100 ruoli, ricavi record

Cloudflare ha annunciato il suo primo licenziamento su larga scala, che ha interessato circa 1.100 posizioni. Secondo il CEO Matthew Prince, l'efficienza operativa ottenuta grazie all'intelligenza artificiale ha ridotto la necessità di ruoli di supporto. Questo avviene in un contesto di crescita, con l'azienda che ha registrato ricavi record. La notizia solleva interrogativi sull'impatto dell'AI sulla forza lavoro aziendale.

→

May 08 2026

General

Il Dilemma di VS Code

Do you abandon your carefully curated Visual Studio Code environment for a sleek, AI-native fork like Windsurf or Cursor? Or do you fortify your existing VS Code setup with powerful, "bring-your-own-key" (BYOK) extensions like Cline, Roo Code, and Continue?

→

May 08 2026

Market

DeepSeek punta a un finanziamento record da 7,35 miliardi di dollari e accelera lo sviluppo LLM

DeepSeek, l'azienda cinese di intelligenza artificiale, starebbe cercando di raccogliere 7,35 miliardi di dollari in un round di finanziamento che potrebbe essere il più grande nella storia del settore AI cinese. L'operazione mira ad accelerare la strategia di commercializzazione e monetizzazione, con l'azienda che prevede di intensificare il rilascio dei suoi Large Language Models. Tra le novità attese, il lancio della versione V4.1 del suo modello è previsto per giugno.

→

May 08 2026

Hardware

La community DGX Spark: ingegno e ottimizzazione oltre i limiti hardware

Nonostante le iniziali critiche sulle specifiche hardware del DGX Spark, in particolare riguardo alla larghezza di banda della memoria e al chip SM-121, la sua community di sviluppatori sta dimostrando un'eccezionale tenacia. Attraverso un forum dedicato, i membri collaborano attivamente per ottimizzare ogni aspetto della piattaforma, migliorando le performance di inference e lo stack software. Questo sforzo collettivo mira a superare i limiti percepiti, trasformando le sfide tecniche in opportunità di innovazione e sviluppo di progetti specifici, sfruttando la coerenza dell'hardware e del sistema operativo.

→

May 08 2026

Altro

Violazione Canvas: il rischio della centralizzazione dei dati studenteschi nel cloud

Un attacco ransomware al sistema Canvas ha esposto i dati di oltre 275 milioni di studenti e miliardi di messaggi. L'incidente, definito "il più grande disastro di privacy dei dati studenteschi della storia", evidenzia i pericoli della centralizzazione delle informazioni sensibili in servizi cloud, in contrasto con le soluzioni self-hosted che offrono maggiore controllo e sovranità sui dati.

→

May 08 2026

Market

L'AI per l'impresa: alleanze strategiche e acquisizioni miliardarie infiammano il mercato

Il mercato dell'AI per l'impresa è in piena ebollizione, con un'intensa attività che spazia da nuove joint venture a significative acquisizioni. Aziende come Anthropic e OpenAI stanno stringendo alleanze per il deployment di soluzioni AI, mentre giganti come SAP investono massicciamente, come dimostra l'acquisizione da un miliardo di dollari della startup tedesca Prior Labs. Questo scenario suggerisce che le startup focalizzate su strumenti AI per le aziende sono ora obiettivi primari per acquisizioni strategiche.

→

May 08 2026

Frameworks

z-lab rilascia DFlash per Gemma 4 26B: un nuovo approccio all'inference LLM on-premise

z-lab ha introdotto DFlash, una nuova tecnicia per l'inference di Large Language Models come Gemma 4 26B. Promettendo miglioramenti significativi nella gestione del contesto e nella velocità rispetto ad alternative come MTP, DFlash si propone come soluzione per ottimizzare i deployment on-premise, sebbene sia attualmente limitato a vLLM. La sua efficienza è cruciale per chi cerca controllo e costi contenuti.

→

May 08 2026

Frameworks

Gemma 4 26B: Oltre 570 token/s su una singola RTX 5090 con DFlash

Un recente benchmark ha dimostrato come la decodifica speculativa DFlash in vLLM possa accelerare significativamente l'inference di Large Language Models. Testando Gemma 4 26B su una RTX 5090 con 32GB VRAM, si è raggiunto un throughput di quasi 580 token al secondo, con una riduzione della latenza di oltre il 60%. Questi risultati evidenziano il potenziale di ottimizzazione per i deployment on-premise.

→

May 08 2026

Altro

ICE valuta occhiali smart per potenziare il riconoscimento facciale

L'agenzia statunitense Immigration and Customs Enforcement (ICE) sta esplorando lo sviluppo di occhiali smart per integrare la sua applicazione di riconoscimento facciale, Mobile Fortify. Questo sistema permette agli ufficiali di identificare persone e interrogare database governativi per verificarne la cittadinanza e prendere decisioni di detenzione. La mossa rappresenta un'ulteriore escalation tecnicica nell'ambito delle operazioni di controllo migratorio, sollevando questioni cruciali su sovranità dei dati e deployment all'edge.

→

May 08 2026

Market

RingCentral potenzia AI Receptionist con integrazioni Shopify, Calendly e WhatsApp

RingCentral ha ampliato le funzionalità del suo prodotto AI Receptionist (AIR), integrando Shopify, Calendly e WhatsApp. Questa espansione mira a estendere le capacità di AIR oltre la gestione base delle chiamate, includendo la gestione degli ordini, la pianificazione degli appuntamenti e la risposta ai messaggi WhatsApp. L'obiettivo è supportare le organizzazioni di piccole e medie dimensioni nella gestione delle richieste dei clienti, migliorando l'efficienza operativa e riducendo i tempi di attesa.

→

May 08 2026

LLM

Quando l'AI Incontra la Creatività: Nuove Prospettive per la Pubblicità Locale

L'iniziativa "The Small Brief" vede quattro icone del settore pubblicitario collaborare per supportare le piccole imprese locali. Utilizzando l'intelligenza artificiale per creare campagne, il progetto esplora il potenziale dell'AI nel generare contenuti pubblicitari innovativi, evidenziando al contempo le sfide e le opportunità legate al deployment di tali tecnicie, dalla sovranità dei dati ai costi infrastrutturali e alla necessità di un'attenta valutazione del TCO per le soluzioni self-hosted.

→

May 08 2026

Market

California: proposta per tutelare i lavoratori dall'impatto dell'AI

Un candidato governatore della California ha avanzato una proposta per garantire nuovi posti di lavoro ai dipendenti che potrebbero essere sostituiti dall'intelligenza artificiale. L'iniziativa evidenzia il crescente dibattito sull'impatto sociale ed economico dell'AI, un tema rilevante per le aziende che valutano strategie di deployment on-premise o cloud e le relative implicazioni sulla forza lavoro e sul TCO.

→

May 08 2026

LLM

La visione di Nick Bostrom: l'IA avanzata per un "mondo risolto"

Il filosofo Nick Bostrom propone una visione audace per il futuro dell'umanità, immaginando un "grande ritiro" reso possibile da un'intelligenza artificiale altamente avanzata. Questa prospettiva suggerisce che l'IA potrebbe condurre a un "mondo risolto", dove le sfide fondamentali dell'esistenza umana sono superate, sollevando interrogativi sulle implicazioni tecniciche e infrastrutturali di sistemi così potenti.

→

May 08 2026

Market

Intel: la crescita del titolo e le sfide strategiche della leadership

Il valore azionario di Intel è triplicato in dodici mesi sotto la guida del CEO Lip-Bu Tan, in carica da marzo 2025. Nonostante il successo finanziario, il piano strategico aziendale non è ancora stato comunicato alla maggior parte dei dipendenti. La sua gestione si è concentrata sulle relazioni esterne, sollevando interrogativi sulle implicazioni per lo sviluppo interno e le future offerte hardware per il settore AI.

→

May 08 2026

Market

Proposta H-1B: Aumenti salariali significativi per ingegneri tech negli USA

Una proposta dell'amministrazione Trump, pubblicata a marzo, mira a innalzare le soglie salariali minime per i visti H-1B, con impatti notevoli sui costi del personale tech negli Stati Uniti. Per un ingegnere software entry-level a San Francisco, il salario minimo richiesto salirebbe a 162.000 dollari annui, mentre a Dallas e New York si registrerebbero aumenti simili, superando del 30% gli attuali requisiti.

→

May 08 2026

Altro

Transformer Lab: fine-tuning di LLM TTS su hardware locale

Transformer Lab, una piattaforma open source per la ricerca in machine learning, ha presentato una demo che illustra il processo di fine-tuning del modello Orpheus 3B per applicazioni text-to-speech. La soluzione permette agli utenti di eseguire l'addestramento direttamente sul proprio hardware, enfatizzando i benefici del deployment on-premise per la sovranità dei dati e il controllo sull'infrastruttura, offrendo sia un'interfaccia grafica che una CLI.

→

May 08 2026

Altro

Qwen3.6-27B su llama.cpp MTP: le sfide del contesto esteso on-premise

Un'analisi approfondita dell'implementazione di Qwen3.6-27B con llama.cpp MTP rivela sfide significative nella gestione di contesti estesi per i Large Language Models self-hosted. I dati mostrano un calo delle prestazioni di generazione oltre gli 85.000 token, evidenziando l'importanza dell'ottimizzazione della cache KV per i deployment on-premise. Le osservazioni sottolineano i trade-off tra la profondità del contesto e la velocità di Inference in ambienti locali.

→

May 08 2026

LLM

NVIDIA Personaplex e il Tool Calling: capacità e implicazioni per i LLM

NVIDIA Personaplex, un modello vocale in tempo reale, solleva interrogativi sul supporto al Tool Calling. Questa capacità, cruciale per l'interazione dei Large Language Models con sistemi esterni, è fondamentale per estendere le loro funzionalità. L'articolo esplora le implicazioni di tale integrazione, specialmente nei deployment on-premise, dove sovranità dei dati e controllo della pipeline sono prioritari.

→

May 08 2026

Altro

Consumi di memoria crescenti in llama.cpp: un'analisi on-premise

Un utente ha segnalato un consumo di memoria progressivamente crescente durante l'esecuzione di un LLM da 105GB con un contesto di 150K token su un sistema locale da 128GB, utilizzando `llama.cpp` e LM Studio. Nonostante i tentativi di liberare la memoria, il consumo è salito a 120GB, suggerendo una potenziale perdita di memoria. Questo solleva interrogativi sulla stabilità e l'efficienza dei deployment on-premise di LLM di grandi dimensioni.

→

May 08 2026

Hardware

HP Z6 G5 A: La workstation si aggiorna per l'AI on-premise con Threadripper PRO 9000 e Blackwell

HP ha aggiornato la sua workstation Z6 G5 A, ora equipaggiata con i processori AMD Ryzen Threadripper PRO 9000 e le GPU NVIDIA RTX PRO Blackwell. Questo sistema, già noto per la sua compatibilità con Linux, offre prestazioni elevate per carichi di lavoro AI e LLM, posizionandosi come una soluzione robusta per deployment on-premise che richiedono controllo e sovranità dei dati.

→

May 08 2026

Frameworks

NVIDIA lancia CUDA-Oxide 0.1: Rust incontra CUDA per le GPU

NVIDIA Labs ha rilasciato CUDA-Oxide 0.1, un compilatore sperimentale che permette di sviluppare kernel CUDA per le GPU NVIDIA utilizzando il linguaggio di programmazione Rust. Questo progetto mira a migliorare le capacità di programmazione ad alte prestazioni, offrendo i vantaggi di sicurezza e controllo di Rust. L'iniziativa è particolarmente rilevante per le organizzazioni che cercano di ottimizzare i carichi di lavoro AI e LLM in ambienti self-hosted, dove il controllo granulare sull'hardware e sul software è cruciale per il TCO e la sovranità dei dati.

→

May 08 2026

Market

Front Ventures: 5 milioni di euro per la tecnicia di difesa in Ucraina e Svezia

Front Ventures, società di investimento con sede a Stoccolma, ha raccolto 5 milioni di euro attraverso un'emissione di azioni sottoscritta al 278%. Il capitale sarà destinato a sostenere aziende di tecnicia di difesa in fase iniziale, con un focus su Ucraina e Svezia. L'obiettivo è accelerare la scalabilità di soluzioni innovative già testate sul campo, in settori come droni, comunicazioni e software, facilitando partnership industriali europee e NATO.

→

May 08 2026

Market

Mercato Tech Europeo: ElevenLabs raccoglie oltre 550 milioni, DeepL taglia 250 posti e le tendenze di aprile

Il panorama tecnicico europeo ha registrato un aprile dinamico, con oltre 65 accordi di finanziamento per un valore superiore a 1,4 miliardi di euro. Tra le notizie di spicco, ElevenLabs ha ampliato il suo Series D a oltre 550 milioni di dollari, coinvolgendo investitori come BlackRock e Nvidia. Parallelamente, DeepL, startup tedesca di traduzione AI, ha annunciato il taglio di 250 posti di lavoro, segnalando un periodo di consolidamento nel settore. Il mese ha visto anche importanti acquisizioni e un crescente focus sulla sovranità della difesa con il nuovo hub per droni.

→

May 08 2026

Altro

Coinbase: licenziamenti, perdite e un blackout di sette ore per un data center surriscaldato

Coinbase ha affrontato una settimana difficile, caratterizzata da un taglio di 700 posti di lavoro e una perdita trimestrale di 394 milioni di dollari. La situazione è culminata in un blackout di sette ore, causato dal surriscaldamento di un data center in Virginia. L'incidente evidenzia le sfide infrastrutturali che possono colpire anche aziende che puntano sull'efficienza dell'intelligenza artificiale per le proprie operazioni.

→

May 08 2026

Altro

Malware nei repository AI: Hugging Face sotto attacco, rischio per la supply chain

I principali repository di modelli e agenti AI sono stati sistematicamente compromessi da malware. Hugging Face, una piattaforma cruciale che ospita oltre un milione di modelli di machine learning, è stata trovata contenere centinaia di modelli malevoli. Questi modelli sono in grado di eseguire codice arbitrario sulle macchine degli utenti, trasformando l'infrastruttura di sviluppo AI in un vettore di attacco e sollevando gravi preoccupazioni per la sicurezza della supply chain software.

→

May 08 2026

Altro

DS4: un motore di inference ottimizzato per DeepSeek 4 su MacBook da 128GB

Il progetto DS4 introduce un motore di inference specifico per il modello DeepSeek 4, progettato per operare in modo efficiente sui MacBook dotati di 128GB di RAM. Questa iniziativa, guidata da antirez, si concentra sull'ottimizzazione per la memoria flash, evidenziando il crescente interesse verso l'esecuzione di Large Language Models direttamente su dispositivi client. Rappresenta un passo significativo per chi cerca soluzioni di AI on-device, garantendo controllo e sovranità dei dati.

→

May 08 2026

Altro

Linux 7.2 introduce dm-inlinecrypt per la crittografia on-premise dei dati

Il prossimo kernel Linux 7.2 integrerà `dm-inlinecrypt`, una nuova funzionalità del DeviceMapper che abilita la crittografia inline dei dispositivi a blocchi. Questa innovazione è cruciale per le aziende che gestiscono carichi di lavoro sensibili, inclusi gli LLM, in ambienti self-hosted, migliorando la sicurezza dei dati e l'efficienza operativa. La crittografia inline offre vantaggi in termini di performance e compliance, aspetti fondamentali per la sovranità dei dati.

→

May 08 2026

Altro

Strategie di comunicazione tech: spunti dal Summit EU-Startups 2026

Il Summit EU-Startups 2026 a Valletta ha ospitato un panel dedicato alle strategie di PR per le startup. La discussione ha offerto spunti pratici su come ottenere copertura mediatica, dalla verifica interna delle notizie alla scelta di un'agenzia. Questi principi sono cruciali anche per le aziende tech che sviluppano soluzioni complesse, come i deployment on-premise di LLM, dove la chiarezza comunicativa è fondamentale per CTO e decision-makers che valutano TCO e sovranità dei dati.

→

May 08 2026

Altro

USA: 69 giurisdizioni bloccano nuovi data center AI, 4 divieti permanenti

Negli Stati Uniti, un numero crescente di giurisdizioni sta imponendo moratorie o divieti permanenti sulla costruzione di nuovi data center dedicati all'intelligenza artificiale. Attualmente, 69 località hanno bloccato nuove edificazioni, con quattro di questi provvedimenti che sono stati resi definitivi. Questa tendenza evidenzia le crescenti preoccupazioni legate all'impatto ambientale e infrastrutturale delle strutture AI ad alta densità.

→

May 08 2026

LLM

Spotify espande il suo AI DJ: nuove lingue per l'Europa e il Brasile

Spotify ha annunciato l'espansione della sua funzionalità premium AI DJ, introducendo il supporto per quattro nuove lingue: francese, tedesco, italiano e portoghese brasiliano. Questa mossa mira a migliorare l'esperienza utente in Europa e Brasile, rendendo il DJ virtuale interattivo accessibile a un pubblico più ampio. La tecnicia sottostante implica l'uso di Large Language Models per la generazione vocale e la selezione musicale personalizzata.

→

May 08 2026

Altro

Il 'Tiny Lab' per LLM: un approccio self-hosted alla sperimentazione AI

L'idea di un 'tiny lab' personale per Large Language Models evidenzia la crescente tendenza verso deployment self-hosted. Questa scelta offre controllo sui dati e costi operativi prevedibili, contrapponendosi alle soluzioni cloud e ponendo l'accento sull'hardware locale e la sovranità dei dati.

→

May 08 2026

Altro

L'Evoluzione del Software Enterprise: Dalla Compliance all'Framework Operativa Globale

Il software HR globale sta trascendendo il ruolo di mero strumento di compliance, trasformandosi in uno strato infrastrutturale operativo essenziale per le aziende distribuite. Questa evoluzione porta con sé nuove sfide nella gestione di team globali, evidenziando la crescente complessità e la necessità di decisioni strategiche sull'infrastruttura e la sovranità dei dati.

→

May 08 2026

Market

Lime punta al Nasdaq: la micromobilità alla prova del mercato

Lime, operatore di scooter e e-bike supportato da Uber, ha presentato la richiesta per una IPO al Nasdaq con il ticker LIME. Con 686 milioni di dollari di ricavi nel 2024 e due anni consecutivi di free cash flow, l'azienda si distingue nel settore della micromobilità, rappresentando il primo test significativo sul mercato pubblico in otto anni per la categoria.

→

May 08 2026

Market

G2A nomina Krzysztof Krawczyk alla guida del consiglio consultivo dopo l'ingresso di CVC

G2A, il marketplace digitale di origini polacche che ha raggiunto quasi 400 milioni di dollari di GMV annuo senza finanziamenti esterni, ha nominato Krzysztof Krawczyk, veterano di CVC, presidente del suo consiglio consultivo. L'ingresso di CVC con una quota di minoranza segna una nuova fase per G2A, che punta a espansione globale e M&A, affidandosi all'esperienza di Krawczyk nel private equity per guidare la crescita futura dopo 16 anni di sviluppo organico.

→

May 08 2026

Altro

Il data center AI Stargate in Texas e l'infrastruttura energetica on-site

Il data center AI Stargate ad Abilene, Texas, sta sviluppando un'infrastruttura energetica on-site. Durante un tour per la stampa, sono state mostrate le turbine a gas di GE Vernova, parte di un impianto a gas naturale in costruzione. Questa scelta evidenzia l'importanza della generazione di energia localizzata per i grandi carichi di lavoro AI, un fattore chiave per il TCO e la resilienza dei deployment on-premise.

→

May 08 2026

Frameworks

OpenZL 0.2 di Meta: l'evoluzione della compressione consapevole dei formati

Meta ha rilasciato OpenZL 0.2, la nuova versione del suo framework di compressione dati consapevole dei formati. Annunciato lo scorso ottobre, OpenZL punta a offrire velocità elevate e rapporti di compressione superiori, rappresentando il successore di Zstandard (Zstd). Questa tecnicia è cruciale per ottimizzare lo storage e il trasferimento di grandi volumi di dati, con implicazioni dirette per le infrastrutture on-premise.

→

May 08 2026

LLM

DeepMind addestra l'AI su Eve Online: Google investe in Fenris Creations

Google DeepMind avvia un progetto per addestrare l'intelligenza artificiale sulle complesse interazioni dei giocatori nel MMORPG Eve Online. L'iniziativa è supportata da un investimento di Google in Fenris Creations, la società dietro il gioco. L'obiettivo è sfruttare la vasta mole di dati generati da centinaia di migliaia di giocatori per sviluppare modelli AI più sofisticati, con implicazioni che vanno oltre il gaming e toccano le sfide infrastrutturali per il training di modelli su larga scala.

→

May 08 2026

Market

CarCollect ottiene finanziamenti per espandere il remarketing automobilistico B2B

La piattaforma olandese CarCollect, specializzata nel software B2B per il remarketing automobilistico, ha ricevuto un finanziamento da Main Capital Partners. La soluzione SaaS, basata su un'architettura cloud-native, digitalizza l'intero flusso di lavoro per i veicoli usati e mira a rafforzare la sua posizione nel mercato europeo, accelerare l'espansione internazionale e lanciare nuove funzionalità, inclusa la gestione dello stock.

→

May 08 2026

LLM

OpenAI introduce GPT-Realtime-2 e nuovi modelli vocali per API

OpenAI ha ampliato la sua offerta di modelli vocali tramite API, introducendo GPT-Realtime-2 con capacità di ragionamento di classe GPT-5 per l'audio in tempo reale. L'azienda ha inoltre rilasciato un modello di traduzione che supporta oltre 70 lingue e una variante di Whisper per la trascrizione in streaming. La strategia di prezzo aggressiva mira a rendere queste soluzioni competitive per gli sviluppatori.

→

May 08 2026

Market

SoftBank riduce il target del prestito garantito da azioni OpenAI a 6 miliardi di dollari

SoftBank Group ha tagliato del 40% l'obiettivo per un prestito garantito da azioni OpenAI, portandolo a 6 miliardi di dollari. La decisione, maturata a due settimane dalla richiesta iniziale di 10 miliardi, riflette la riluttanza dei creditori a valutare le azioni OpenAI come garanzia. Questo evidenzia una discrepanza tra la valutazione percepita di OpenAI e la disponibilità delle banche a concedere finanziamenti, un segnale per il mercato dell'AI.

→

May 08 2026

Frameworks

AMD spinge l'AI locale open source: integrazione con Gmail per GAIA

AMD continua a rafforzare il suo impegno nell'intelligenza artificiale locale e open source, focalizzandosi sull'hardware consumer Radeon e Ryzen. La recente versione 0.17.6 del software AMD GAIA introduce miglioramenti significativi per l'elaborazione AI su Windows, Linux e macOS, aggiungendo una nuova funzionalità che permette l'interazione con gli account Gmail, sottolineando la crescente fiducia nelle pipeline LLM eseguite in locale.

→

May 08 2026

Market

Il finanziamento tech europeo rallenta ad aprile: investitori più selettivi

Ad aprile 2026, le startup europee hanno raccolto 5,1 miliardi di euro attraverso 290 accordi, segnando un rallentamento nei finanziamenti. Il settore cleantech ha guidato gli investimenti, mentre il Regno Unito è rimasto il principale beneficiario, nonostante una diminuzione complessiva del capitale. Gli investitori mostrano una crescente selettività.

→

May 08 2026

Altro

I giocattoli AI per bambini: tra innovazione, privacy e sfide normative

I nuovi giocattoli connessi basati sull'intelligenza artificiale stanno ridefinendo il gioco e le interazioni quotidiane dei bambini. Tuttavia, la loro capacità di elaborare e interagire con i dati solleva significative preoccupazioni in termini di privacy e sicurezza, spingendo alcuni legislatori a considerare misure restrittive. Questo scenario evidenzia la crescente necessità di bilanciare l'innovazione tecnicica con la protezione dei dati sensibili, specialmente in contesti vulnerabili.

→

May 08 2026

Altro

Nvidia e Corning: un'alleanza strategica per l'infrastruttura AI negli USA

Nvidia e Corning hanno siglato una partnership per potenziare l'infrastruttura e le catene di approvvigionamento dell'intelligenza artificiale negli Stati Uniti. L'iniziativa prevede l'espansione della produzione di fibra ottica, elemento cruciale per la connettività ad alta velocità richiesta dai carichi di lavoro AI. L'annuncio, fatto dal CEO di Nvidia Jensen Huang, sottolinea l'importanza di rafforzare le capacità tecniciche nazionali.

→

May 08 2026

Market

TSMC e la filiera dei chip AI: l'influenza asiatica sui deployment on-premise

L'aumento dei ricavi di TSMC sottolinea il ruolo cruciale dell'Asia nella fornitura di chip per l'intelligenza artificiale. Questo scenario ha implicazioni significative per le aziende che pianificano deployment di Large Language Models (LLM) on-premise, influenzando la disponibilità e i costi dell'hardware essenziale.

→

May 08 2026

Market

Colloqui USA-Cina: Nvidia e i CEO tech al centro delle discussioni commerciali

Il presidente degli Stati Uniti sta valutando di invitare i vertici di aziende tecniciche chiave, inclusa Nvidia, a prossimi colloqui commerciali con la Cina. Questa mossa sottolinea la crescente importanza strategica del settore tecnicico, in particolare del silicio e delle GPU, nel contesto delle relazioni internazionali e delle catene di approvvigionamento globali, con potenziali ripercussioni significative per i deployment di Large Language Models.

→

May 08 2026

Market

Contrabbando di chip Nvidia: OBON Corp. al centro di un'indagine USA

I procuratori statunitensi stanno indagando su OBON Corp., un'azienda thailandese di infrastrutture AI, accusata di aver facilitato il contrabbando di server Supermicro equipaggiati con GPU Nvidia verso la Cina. La società, partner della strategia nazionale AI della Thailandia, avrebbe movimentato miliardi di dollari in hardware, con Alibaba tra i destinatari finali. La vicenda solleva interrogativi sulla catena di approvvigionamento globale per l'AI e la sovranità dei dati.

→

May 08 2026

Hardware

La scommessa di Nvidia sul raffreddamento di nuova generazione per l'AI

Nvidia sta investendo in soluzioni di raffreddamento avanzate per l'intelligenza artificiale, un passo cruciale per gestire il calore generato dai potenti acceleratori GPU. Questa strategia è fondamentale per sostenere le crescenti esigenze di calcolo degli LLM e dei carichi di lavoro AI, influenzando direttamente la progettazione dei data center e il TCO per i deployment on-premise.

→

May 08 2026

Market

Novatek: prospettive di margine in crescita per mix prodotti e consegne accelerate

Novatek ha annunciato un miglioramento delle proprie prospettive di margine, attribuendolo a un mix di prodotti più solido e a consegne anticipate. Questa notizia, sebbene focalizzata su un singolo fornitore di semiconduttori, evidenzia l'importanza della stabilità della supply chain per le aziende che pianificano deployment di Large Language Models (LLM) on-premise. La disponibilità e i tempi di consegna dell'hardware sono fattori critici per il TCO e la fattibilità dei progetti AI self-hosted.

→

May 08 2026

LLM

Ottimizzazione e costi: la sfida dell'addestramento per LLM di piccole dimensioni

Un'iniziativa accademica evidenzia le sfide e i costi associati all'addestramento di Large Language Models (LLM) di dimensioni contenute, con l'obiettivo di migliorarne la coerenza e ridurre le allucinazioni. L'impegno, finanziato da una docente universitaria, sottolinea l'importanza di investire in cicli di training mirati per modelli che vanno da 1.5 a 35 miliardi di parametri, anche con tecniche di Quantization come Q8_0, per renderli più affidabili in contesti applicativi critici.

→

May 08 2026

Market

La domanda di AI mette sotto pressione la catena di fornitura dei materiali PCB

L'esplosione della domanda di intelligenza artificiale sta generando una crescente tensione nella catena di fornitura di materiali chiave per i circuiti stampati (PCB). Questo fenomeno, alimentato dalla necessità di hardware sempre più potente per l'Inference e il training di LLM, ha implicazioni dirette sui costi e i tempi di consegna per le aziende che pianificano deployment AI, in particolare in ambienti self-hosted.

→

May 08 2026

Hardware

Coherent: ordini per ottiche 1.6T e semiconduttori fino al 2030

Coherent Corp. ha annunciato che il suo portafoglio ordini si estende fino al 2030, con una forte domanda per ottiche 1.6T e capacità produttiva di semiconduttori InP da 6 pollici. Questo indica una crescita sostenuta nelle infrastrutture di rete e di calcolo, cruciali per i carichi di lavoro AI e LLM, e suggerisce tempi di consegna prolungati per componenti chiave.

→

May 08 2026

Market

Big Tech finanzia SK Hynix: la corsa alla memoria AI si intensifica

Le maggiori aziende tecniciche starebbero offrendo finanziamenti a SK Hynix per la costruzione di nuove fabbriche e l'acquisto di strumenti EUV. Questa mossa evidenzia l'intensificarsi della competizione nel settore delle memorie dedicate all'intelligenza artificiale, cruciali per lo sviluppo e il deployment di Large Language Models e altre applicazioni AI. L'investimento mira a garantire la fornitura di componenti essenziali in un mercato in rapida crescita.

→

May 08 2026

Market

TSMC: ricavi in crescita del 30% nei primi quattro mesi del 2026 grazie al boom dell'AI

TSMC, leader nella produzione di semiconduttori, ha registrato un aumento del 30% nei ricavi nei primi quattro mesi del 2026. Questo incremento è attribuito al crescente "boom dell'AI", che sta alimentando una domanda senza precedenti di silicio avanzato. L'andamento evidenzia la centralità dei produttori di chip nell'ecosistema dell'intelligenza artificiale e le implicazioni per le strategie di deployment on-premise.

→

May 08 2026

Market

Investimenti taiwanesi negli USA: 50 miliardi per l'ecosistema tech

Gli investimenti delle aziende taiwanesi negli Stati Uniti hanno superato le previsioni, con il governo di Taipei che ha stanziato un finanziamento di 50 miliardi di dollari. Questa mossa strategica rafforza l'interdipendenza tecnicica tra le due nazioni, con implicazioni significative per settori chiave come i semiconduttori e l'intelligenza artificiale, influenzando la disponibilità e il costo dell'hardware essenziale per i deployment di LLM.

→

May 08 2026

Altro

Compal e Verda: server GPU a liquido per la sovranità dei dati nell'AI

Compal e Verda hanno stretto una partnership strategica per fornire server GPU con raffreddamento a liquido. Questa collaborazione mira a supportare i deployment di intelligenza artificiale che richiedono sovranità dei dati e controllo infrastrutturale. L'adozione di soluzioni a liquido per i server GPU è cruciale per gestire l'elevato calore generato dai carichi di lavoro AI più intensivi, garantendo efficienza e prestazioni ottimali in ambienti on-premise.

→

May 08 2026

Altro

Automazione AI nel back office: tra aumento di produttività e sovraccarico

Basata, un'azienda di intelligenza artificiale, si confronta con il dilemma dell'automazione nel back office. Mentre il settore discute l'impatto degli LLM sulla forza lavoro, il personale amministrativo di Basata è più preoccupato dal sovraccarico di lavoro che dalla sostituzione, evidenziando le sfide operative immediate dell'integrazione AI.

→

May 08 2026

LLM

L'IA Generativa Valuta il Pensiero Critico: Uno Studio sui Contro-Argomenti

Uno studio esplora l'uso di LLM per valutare il pensiero critico negli studenti, in particolare la capacità di formulare contro-argomenti. La ricerca ha coinvolto 36 studenti e ha confrontato le valutazioni umane con quelle di sei LLM di frontiera, usando rubriche standardizzate. I risultati indicano che gli studenti mantengono capacità logiche anche con l'IA generativa, e che gli LLM possono valutare efficacemente i lavori scritti su larga scala, con un allineamento generale alle valutazioni umane. Questo apre a nuove prospettive per l'adozione dell'IA nell'istruzione, pur riconoscendo i rischi di abuso.

→

May 08 2026

LLM

AdaGATE: RAG multi-hop più robusta con selezione di evidenze token-efficiente

AdaGATE è un nuovo controller per la Retrieval-Augmented Generation (RAG) multi-hop, progettato per affrontare la fragilità dei sistemi attuali con evidenze rumorose o ridondanti e contesti limitati. Senza richiedere training, AdaGATE ottimizza la selezione delle evidenze risolvendo un problema di "riparazione" vincolato dai token. Il sistema bilancia copertura delle lacune, corroborazione, novità e rilevanza. I test su HotpotQA mostrano un miglioramento dell'F1 e un'efficienza 2.6 volte superiore nell'uso dei token rispetto ad approcci esistenti, rendendo la RAG più robusta.

→

May 08 2026

Frameworks

Previsione della rinosinusite cronica con dati EHR nazionali e modelli stratificati

Un nuovo studio sfrutta i dati longitudinali delle cartelle cliniche elettroniche (EHR) del programma *All of Us* per prevedere la rinosinusite cronica (CRS). Il team ha sviluppato una pipeline ibrida per selezionare 100 caratteristiche da oltre 110.000 codici e ha addestrato modelli stratificati per sesso ed età. Il framework ha raggiunto un'AUC di 0.8461, migliorando la discriminazione e supportando una stratificazione del rischio più efficace nella cura primaria.

→

May 08 2026

LLM

Minimi piatti: un'illusione nella generalizzazione dei modelli AI?

Una nuova ricerca mette in discussione il ruolo dei "minimi piatti" nella generalizzazione delle reti neurali. Lo studio suggerisce che la "debolezza" (weakness), definita dal comportamento del modello, sia un predittore più robusto e invariante rispetto alla riparametrizzazione. Le implicazioni sono significative per la comprensione e l'ottimizzazione dell'addestramento dei Large Language Models, spostando il focus dalla geometria dello spazio dei pesi alle capacità funzionali del modello, con potenziali benefici per il TCO e l'affidabilità nei deployment on-premise.

→

May 08 2026

LLM

ZAYA1-8B: L'LLM MoE di Zyphra Affina il Ragionamento su Piattaforma AMD

Zyphra ha presentato ZAYA1-8B, un Large Language Model (LLM) Mixture-of-Experts (MoE) focalizzato sul ragionamento, con 700 milioni di parametri attivi e 8 miliardi totali. Addestrato su una piattaforma AMD completa, il modello dimostra performance competitive in matematica e coding, eguagliando o superando modelli più grandi. L'introduzione di Markovian RSA, un metodo di calcolo innovativo per l'inference, ne potenzia ulteriormente le capacità, riducendo il divario con LLM di dimensioni superiori e offrendo nuove prospettive per i deployment on-premise.

→

May 08 2026

LLM

APM: Decifrare le Politiche di Sicurezza degli LLM per Deployment Più Trasparenti

Un nuovo approccio, gli Annotator Policy Models (APM), promette di migliorare la comprensione delle politiche di sicurezza degli LLM. Analizzando il comportamento degli annotatori, sia umani che basati su LLM, gli APM identificano ambiguità e differenze di prospettiva, senza richiedere sforzi aggiuntivi. Questo supporta la creazione di sistemi AI più robusti e allineati con le aspettative di sicurezza, cruciale per le aziende che implementano soluzioni AI.

→

May 08 2026

Market

Shenmao e il boom dell'infrastruttura AI: crescita record dei ricavi

Shenmao registra una crescita record dei ricavi, spinta dalla crescente domanda di infrastrutture per l'intelligenza artificiale. Questo trend riflette l'espansione del mercato, dove le aziende cercano soluzioni robuste per il deployment di LLM, bilanciando controllo, sovranità dei dati e TCO, in particolare per carichi di lavoro on-premise e ibridi.

→

May 08 2026

Altro

Accton e gli investimenti AI: il segnale degli hyperscaler sull'infrastruttura

Il recente trimestre record di Accton indica che i grandi fornitori di servizi cloud, gli hyperscaler, stanno mantenendo un elevato livello di investimenti nelle infrastrutture dedicate all'intelligenza artificiale. Questo trend sottolinea la crescente domanda di capacità di calcolo e storage per i carichi di lavoro AI, influenzando le strategie di deployment sia cloud che on-premise e la valutazione del TCO per le aziende.

→

May 08 2026

Market

La geopolitica dei chip: Taiwan al centro delle strategie AI on-premise

Il ruolo cruciale dell'industria taiwanese dei semiconduttori emerge come fattore chiave nelle dinamiche geopolitiche globali, con implicazioni dirette per le strategie di deployment di Large Language Models (LLM). Le tensioni internazionali evidenziano i rischi della catena di approvvigionamento, influenzando la disponibilità di hardware essenziale per infrastrutture AI self-hosted e la sovranità dei dati.

→

May 08 2026

Market

Profitti AI: i lavoratori Samsung chiedono una quota maggiore, sciopero in vista

I dipendenti di Samsung Electronics stanno chiedendo una maggiore partecipazione ai profitti generati dall'intelligenza artificiale, con la minaccia di uno sciopero che si profila all'orizzonte. Questa situazione evidenzia le crescenti tensioni sulla distribuzione del valore nell'era dell'AI, con potenziali ripercussioni sull'intera filiera tecnicica, inclusa la fornitura di componenti cruciali per i deployment on-premise.

→

May 08 2026

Market

L'infrastruttura AI spinge i ricavi dei distributori di componenti: un anno di crescita record

Un recente report evidenzia come la spesa per l'infrastruttura dedicata all'intelligenza artificiale abbia raddoppiato i ricavi di un distributore di circuiti integrati in un solo anno. Questo dato sottolinea la crescente domanda di hardware specializzato per supportare carichi di lavoro AI, in particolare per i Large Language Models (LLM). La tendenza riflette l'accelerazione degli investimenti in soluzioni on-premise e ibride, dove il controllo sui dati e l'ottimizzazione del TCO diventano prioritari per le aziende.

→

May 08 2026

LLM

Decifrare il Pensiero degli LLM: Anthropic Rilascia i Pesi NLA per Gemma 3

Anthropic ha svelato una nuova ricerca che permette di comprendere i processi interni degli LLM durante la generazione di testo. Utilizzando i Natural Language Autoencoders (NLA), è ora possibile visualizzare i "pensieri" di un modello come Gemma 3 27b instruct. Questa innovazione, con i pesi NLA resi pubblici, offre strumenti preziosi per la trasparenza, il debugging e il controllo dei modelli, aspetti cruciali per i deployment on-premise.

→

May 08 2026

Hardware

Skymizer lancia la HTX301: una scheda PCIe da 384GB per l'inference AI on-prem

La taiwanese Skymizer ha annunciato la HTX301, una scheda PCIe progettata per l'inference AI on-premise. Il dispositivo si distingue per i suoi 384GB di memoria e un consumo energetico di circa 240 Watt, posizionandosi come una soluzione mirata a soddisfare le esigenze di sovranità dei dati e controllo infrastrutturale per i carichi di lavoro LLM.

→

May 08 2026

Altro

LLMSearchIndex: Ricerca Web Locale Open Source con oltre 200 milioni di pagine per RAG

LLMSearchIndex è una nuova libreria Python open source che offre una soluzione di ricerca web completamente locale, progettata per i sistemi RAG basati su LLM. Con un indice altamente compresso di circa 2 GB, che include oltre 200 milioni di pagine web da FineWeb e Wikipedia, il progetto mira a superare la dipendenza da API a pagamento o scraper, consentendo retrieval rapidi su hardware comune e rafforzando la sovranità dei dati nei deployment on-premise.

→

May 08 2026

LLM

Horus: L'LLM Open Source Egiziano che Punta a Ridefinire il Panorama AI Regionale

Il progetto Horus, sviluppato da Assem Sabry e TokenAI, segna un traguardo significativo come il primo Large Language Model (LLM) interamente creato da zero in Egitto. Open source e disponibile su piattaforme come Hugging Face e GitHub, Horus si prepara al rilascio della versione 1.5 Instruct, che promette un aumento di 5 volte nelle prestazioni e una lunghezza del contesto di 64K token. L'iniziativa sottolinea l'emergere di capacità AI locali e la spinta verso la sovranità dei dati nella regione.

→

May 08 2026

Market

Retroscena Microsoft-OpenAI: I dubbi del 2018 e la strategia anti-Amazon

Documenti interni di Microsoft risalenti al 2018 rivelano lo scetticismo dei dirigenti verso OpenAI. Allo stesso tempo, emerge una chiara preoccupazione strategica: evitare che la nascente entità finisse per allearsi con Amazon, un rivale chiave nel settore cloud e AI. Queste rivelazioni offrono uno sguardo sulle dinamiche competitive che hanno plasmato il panorama dell'intelligenza artificiale.

→

May 08 2026

Frameworks

Ottimizzazione LLaMA.cpp: Multi-Token Prediction accelera Gemma 4 su hardware locale

Un'implementazione di Multi-Token Prediction (MTP) per LLaMA.cpp ha dimostrato un aumento del 40% nella velocità di generazione di token per il modello Gemma 26B, quantizzato in formato GGUF. I test, condotti su un MacBook Pro M5Max, evidenziano il potenziale per migliorare l'efficienza dell'inference LLM su hardware self-hosted, un aspetto cruciale per i deployment on-premise.

→

May 08 2026

Hardware

M3 da 512GB introvabile: sfide per gli LLM on-premise e l'inference locale

La scarsità di hardware con elevata memoria unificata, come i chip M3 di Apple da 512GB o 256GB, sta creando difficoltà per chi intende eseguire Large Language Models (LLM) in locale. Questa situazione spinge sviluppatori e aziende a riconsiderare le strategie di deployment on-premise, valutando alternative come l'inference su CPU e i relativi compromessi in termini di performance e latenza. La dipendenza da specifici componenti hardware evidenzia l'importanza di una pianificazione resiliente per la sovranità dei dati e il TCO.

→

🗄️ Archivio Notizie