Archivio Notizie – Cronologia Completa Segnali AI

May 24 2026

Altro

Manovre Satellitari Russe: Implicazioni per la Sicurezza dei Dati Spaziali

Funzionari statunitensi segnalano movimenti di quattro satelliti russi, e di un quinto, in prossimità di un satellite radar commerciale che fornisce intelligence all'Ucraina. L'episodio solleva interrogativi sulla sicurezza delle infrastrutture spaziali e sulle implicazioni per la sovranità dei dati raccolti, evidenziando l'importanza di strategie di deployment robuste per l'analisi di informazioni sensibili.

→

May 24 2026

Altro

Ottimizzare i Tempi di Avvio di Linux Embedded: Il Ruolo di Boot-Time Wizard

Mentre per i sistemi desktop e laptop i tempi di avvio di Linux non rappresentano più una criticità, nel mondo dell'embedded la rapidità di startup rimane un fattore cruciale. Il progetto Boot-Time Wizard emerge come una nuova iniziativa volta a supportare i produttori di dispositivi embedded Linux nel ridurre significativamente questi tempi, rispondendo a esigenze specifiche di reattività e affidabilità.

→

May 24 2026

Market

Moment raccoglie 78 milioni per l'infrastruttura AI nel wealth management

Moment, una fintech fondata da ex trader quantitativi di Citadel Securities, ha chiuso un round di finanziamento da 78 milioni di dollari. L'azienda sviluppa infrastrutture per il deployment di soluzioni AI nel settore del wealth management, mirando a soddisfare le esigenze di controllo e sovranità dei dati tipiche del settore finanziario.

→

May 24 2026

Market

Stellantis valuta la produzione di EV cinesi in Canada e Messico, escludendo gli Stati Uniti

Il CEO di Stellantis, Antonio Filosa, ha annunciato l'intenzione di produrre e commercializzare veicoli elettrici di marchi cinesi in Messico e potenzialmente in Canada. L'azienda ha escluso gli Stati Uniti da questi piani, citando la mancanza di opportunità attuali. La dichiarazione è stata rilasciata durante una conferenza stampa successiva all'investor day del gruppo.

→

May 24 2026

LLM

Qwen 3.6-35B Uncensored: un LLM robusto per deployment on-premise

Una variante del modello Qwen 3.6-35B di Alibaba Cloud, denominata Uncensored-Genesis-APEX-MTP, dimostra notevoli capacità di gestione del contesto e stabilità su hardware locale. Ottimizzata con tecniche di Quantization APEX e MTP, questa versione è pensata per ambienti self-hosted, offrendo controllo e sovranità dei dati, aspetti cruciali per le aziende che valutano soluzioni AI on-premise.

→

May 24 2026

Altro

Un Nuovo Benchmark Open Source per Sistemi Text-to-Speech Locali

Un utente ha sviluppato un benchmark per sistemi Text-to-Speech (TTS) pensato per progetti personali e deployment locali. Il progetto, disponibile su GitHub, offre risultati per Windows e macOS, con test su Linux in arrivo, e mira a supportare chi cerca soluzioni self-hosted con hardware specifico come la NVIDIA RTX 3090 e l'AMD Ryzen 9 5900XT.

→

May 24 2026

LLM

LLM con capacità visive vs. OCR: un benchmark sui documenti complessi

Un recente benchmark ha confrontato le prestazioni degli LLM con capacità visive native (per l'analisi diretta di PDF) con quelle di pipeline basate su OCR per l'estrazione di informazioni da documenti lunghi e ricchi di immagini. I risultati indicano che gli approcci basati su OCR, in particolare quelli premium con estrazione del layout, hanno superato gli LLM visivi sia in termini di accuratezza che di affidabilità, specialmente con grafici e tabelle. L'approccio nativo ha mostrato anche un tasso di fallimento intrinseco e costi più elevati.

→

May 24 2026

Altro

llampart 1.0.0: la nuova UI web locale per LLM on-premise e sovranità dei dati

È stata rilasciata la versione 1.0.0 di llampart, un'interfaccia web locale e standalone progettata per interagire con `llama-server` e i Large Language Models (LLM) eseguiti on-premise. llampart si distingue per l'attenzione all'esperienza utente in ambienti locali, offrendo un'interfaccia multilingue, ampie opzioni di personalizzazione e funzionalità avanzate per la gestione delle conversazioni. L'obiettivo è fornire una soluzione robusta e confortevole per chi cerca controllo e sovranità sui propri carichi di lavoro AI, evitando servizi chat ospitati su cloud.

→

May 24 2026

Frameworks

Wild Linker 0.9: La Velocità di Rust Incontra Nuove Piattaforme e API per Linux

È stato rilasciato Wild Linker 0.9, la nuova versione del linker ad alte prestazioni scritto in Rust per sistemi Linux. Questo aggiornamento introduce una maggiore copertura di piattaforma e una Linker Plugin API, promettendo di ottimizzare ulteriormente i tempi di compilazione e le pipeline di sviluppo. L'efficienza di strumenti come Wild Linker è cruciale per i team che gestiscono infrastrutture complesse, con impatti diretti sul TCO e sulla gestione delle risorse in ambienti on-premise.

→

May 23 2026

Frameworks

llama.cpp accelera: NVFP4 e Tensor Parallelism multi-GPU per LLM on-premise

Il framework open source llama.cpp introduce il supporto simultaneo per la Quantization NVFP4 e il Multi-GPU Tensor Parallelism (MTP). Questo aggiornamento migliora significativamente l'efficienza e le capacità di scalabilità per l'Inference di Large Language Models su hardware locale. La novità offre a CTO e architetti infrastrutturali nuove opportunità per Deploy LLM più grandi e complessi in ambienti self-hosted, ottimizzando l'utilizzo della VRAM e riducendo il TCO.

→

May 23 2026

Frameworks

llama.cpp: Strumenti Nativi Integrati Trasformano il Server in un Mini-Agente AI

Il server `llama.cpp` introduce strumenti nativi sperimentali come `exec_shell_command` e `edit_file`, consentendo funzionalità da mini-agente AI direttamente dal binario. Questa integrazione semplifica lo sviluppo di applicazioni locali basate su LLM, eliminando la necessità di wrapper esterni. Tuttavia, l'assenza di sandboxing richiede cautela nell'utilizzo, evidenziando l'importanza della sicurezza nei deployment on-premise.

→

May 23 2026

Frameworks

I repository AI in rapida crescita: il focus su soluzioni locali e agenti intelligenti

Una recente analisi ha rivelato i repository AI in più rapida crescita, evidenziando una chiara tendenza verso soluzioni local-first, intelligenze artificiali personali e agenti di codice. Questi progetti, che spaziano dalla gestione della conoscenza del codice su dispositivo alla sintesi vocale multilingue e ai framework per LLM in produzione, riflettono l'esigenza di maggiore controllo, sovranità dei dati e deployment on-premise, temi centrali per CTO e architetti infrastrutturali.

→

May 23 2026

LLM

Embeddings per le Personas Nemotron di NVIDIA: un approccio leggero alla ricerca semantica

Un progetto recente ha generato vettori di Embeddings per il vasto dataset NVIDIA Nemotron-Personas, composto da milioni di profili sintetici dettagliati. Utilizzando l'LLM leggero Qwen 0.6B, è ora possibile effettuare ricerche semantiche e raggruppare le personas in modo efficiente. Questa soluzione, ideale per progetti di agenti locali, evidenzia i vantaggi dei modelli compatti per i deployment on-premise, garantendo controllo e ottimizzazione delle risorse.

→

May 23 2026

Altro

L'efficienza dell'Inference LLM: il ruolo cruciale del Cache-Hit Rate

L'ottimizzazione dell'inference per i Large Language Models è fondamentale per contenere i costi e migliorare le performance. Un'analisi basata sui dati di OpenRouter evidenzia come i tassi di cache-hit siano un indicatore chiave dell'efficienza dei provider. Questo parametro è cruciale per le aziende che valutano deployment on-premise, influenzando direttamente il Total Cost of Ownership e la scalabilità delle infrastrutture AI.

→

May 23 2026

LLM

GPT-5.5 e la "Modalità Uomo delle Caverne": Speculazioni sull'Efficienza dei LLM

Un utente ha condiviso osservazioni su un presunto "trace" di GPT-5.5, suggerendo l'uso di una "modalità uomo delle caverne" per ottimizzare il processo di pensiero. La speculazione ruota attorno all'idea di migliorare l'efficienza dei Token tramite la semplificazione di tracce di ragionamento di alta qualità da modelli Open Source, seguita da Fine-tuning. Questa discussione evidenzia la costante ricerca di strategie per rendere i Large Language Models più performanti e meno esosi in termini di risorse.

→

May 23 2026

Altro

LLM su CPU: valutare Small Language Models per deployment senza GPU

L'interesse per gli Small Language Models (SLM) eseguibili su CPU è in crescita, spinto dalla necessità di contenere i costi e garantire la sovranità dei dati. Questo articolo esplora i fattori chiave – accuratezza, velocità e stack di deployment – che le aziende devono considerare per implementare efficacemente gli SLM in ambienti on-premise privi di accelerazione GPU, analizzando i compromessi tecnici e infrastrutturali.

→

May 23 2026

Altro

Ferrari e IBM: l'intelligenza artificiale ridefinisce l'esperienza dei fan in F1

La collaborazione tra Scuderia Ferrari HP e IBM mira a trasformare l'esperienza dei tifosi di Formula 1. Attraverso l'impiego dell'intelligenza artificiale di IBM, le due aziende puntano a creare un coinvolgimento più profondo e personalizzato per gli appassionati, esplorando nuove frontiere nell'interazione digitale con il mondo delle corse.

→

May 23 2026

Altro

Anthropic: Claude Mythos scopre oltre 10.000 vulnerabilità critiche in un mese

Anthropic ha rivelato che la sua iniziativa di cybersecurity, Project Glasswing, supportata da Claude Mythos, ha identificato più di 10.000 potenziali vulnerabilità ad alta o critica gravità in software cruciali in appena un mese. Di queste, oltre mille sono state confermate come critiche, evidenziando la sfida costante nella gestione della sicurezza e la rapidità con cui gli LLM possono analizzare codice.

→

May 23 2026

LLM

Ottimizzazione VRAM: rimuovere la componente vision dagli LLM per il deployment on-premise

Un utente ha esplorato la rimozione del file `mmproj` da un LLM multimodale (Qwen 3.6 35b a3b) per liberare VRAM, sollevando un quesito cruciale: questa modifica influisce sulle capacità di generazione testuale del modello? La questione è particolarmente rilevante per chi gestisce deployment on-premise, dove l'ottimizzazione delle risorse hardware è fondamentale per l'efficienza e il TCO.

→

May 23 2026

Market

Samsung: malcontento interno blocca la produzione e i progetti AI

Un'ondata di malcontento sta scuotendo Samsung Electronics dopo che i lavoratori del settore memorie hanno ricevuto un bonus di 400.000 dollari, a fronte dei soli 4.000 dollari destinati ad altre divisioni. Questa disparità ha innescato rallentamenti intenzionali nella produzione, interruzioni nelle operazioni di packaging e, in particolare, ha fermato le decisioni cruciali relative ai progetti di chip per l'intelligenza artificiale.

→

May 23 2026

Altro

L'AI entra in casa e in ufficio: Jensen Huang e l'adozione degli LLM

L'aneddoto di Jensen Huang, CEO di NVIDIA, che utilizza Claude per lavoro e vede il figlio impiegare agenti AI per la gestione domestica, evidenzia la crescente pervasività dell'intelligenza artificiale. Questo scenario solleva interrogativi cruciali per le aziende riguardo le strategie di deployment degli LLM, bilanciando controllo, sovranità dei dati e Total Cost of Ownership (TCO) tra soluzioni cloud e on-premise.

→

May 23 2026

Market

Peec AI raddoppia il fatturato: 10 milioni di ARR in sei mesi grazie a ChatGPT

La startup berlinese Peec AI ha superato i 10 milioni di dollari di fatturato annuo ricorrente (ARR) in soli sei mesi. L'azienda offre soluzioni per migliorare la visibilità dei brand nei risultati di ricerca generati dall'intelligenza artificiale, inclusi quelli di piattaforme come ChatGPT, capitalizzando sulla crescente integrazione dell'AI nel panorama della ricerca online.

→

May 23 2026

Altro

Tokens per joule: la metrica silenziosa per l'efficienza degli LLM on-premise

Mentre il settore dell'intelligenza artificiale è spesso dominato da metriche di pura potenza di calcolo, emerge una misura più sottile ma cruciale: i 'tokens per joule'. Questa metrica, considerata da attori come Microsoft, valuta l'efficienza energetica dei Large Language Models. È fondamentale per chi gestisce deployment on-premise, dove il TCO e la sostenibilità operativa sono prioritari, aiutando a distinguere la vera efficienza dall'iperbole del settore.

→

May 23 2026

Hardware

Jensen Huang in Taiwan: "Vera Rubin, il più grande lancio di prodotto nella storia dell'informatica"

Il CEO di NVIDIA, Jensen Huang, ha visitato Taiwan e ha definito "Vera Rubin" il più significativo lancio di prodotto nella storia dell'informatica. Questa dichiarazione sottolinea l'importanza strategica delle nuove architetture hardware per l'avanzamento dell'intelligenza artificiale e le implicazioni per i deployment on-premise, dove le capacità di calcolo e la gestione dei dati sono cruciali.

→

May 23 2026

Altro

Il Disgelo Artico Minaccia le Sepolture Storiche di "Corpse Point"

Il permafrost dell'Artico si sta sciogliendo a un ritmo allarmante, rivelando e degradando le sepolture secolari di balenieri a Likneset, noto come "Corpse Point" nell'arcipelago delle Svalbard. Un nuovo studio evidenzia come il cambiamento climatico stia accelerando la perdita del patrimonio culturale, mettendo a rischio reperti che raccontano le dure condizioni di vita dei marinai del XVII e XVIII secolo e sollevando interrogativi sulla conservazione in situ.

→

May 23 2026

Altro

La svolta energetica di xAI e SpaceX: dal solare ai data center orbitali

Le recenti strategie di xAI, orientate al gas naturale, e l'interesse di SpaceX per i data center in orbita, segnano un potenziale allontanamento dalla visione di un'economia solare-elettrica promessa da Elon Musk. Questo cambio di rotta solleva interrogativi sulle future infrastrutture per l'AI, le loro implicazioni ambientali e le sfide di deployment per carichi di lavoro intensivi.

→

May 23 2026

Hardware

Micron avvia la produzione di DRAM avanzata in Virginia: impatti su supply chain e settori strategici

Micron ha iniziato la produzione di memoria DRAM avanzata nel suo stabilimento in Virginia. L'espansione della fabbrica quadruplicherà la produzione, contribuendo a mitigare la carenza di DDR4, in particolare per i settori automobilistico e della difesa. Questa mossa rafforza la capacità produttiva interna negli Stati Uniti, con implicazioni significative per la supply chain globale di componenti critici e la sovranità tecnicica.

→

May 23 2026

Market

Corea del Sud: il vice premier avverte sui benefici pubblici dell'AI, citando Samsung

Il vice primo ministro sudcoreano Bae Kyung-hoon ha sottolineato la necessità che la ricchezza generata dall'intelligenza artificiale sia distribuita equamente. Ha citato le recenti tensioni lavorative in Samsung Electronics come un'anticipazione delle sfide sociali che l'era dell'AI potrebbe portare, evidenziando l'importanza di un approccio strategico e responsabile all'adozione delle nuove tecnicie.

→

May 23 2026

Altro

Il ciclo dell'hype per gli LLM locali: siamo oltre il picco delle aspettative?

Un'osservazione dalla community di LocalLLaMA e i trend di ricerca suggeriscono un possibile calo dell'interesse per i Large Language Models self-hosted. Questo solleva interrogativi sulla maturità del settore e sulle sfide reali che le aziende affrontano nel Deploy di soluzioni AI on-premise, tra requisiti hardware e complessità infrastrutturali.

→

May 23 2026

Altro

LLM da 1T di parametri su singola GPU: Optane e Kimi K2.5 per il deployment locale

Un recente esperimento ha dimostrato la possibilità di eseguire un LLM da un trilione di parametri su un sistema con una singola GPU, sfruttando 768GB di memoria Intel Optane DIMM. L'installazione locale di Kimi K2.5 ha raggiunto una velocità di circa 4 token al secondo, evidenziando un approccio innovativo per il deployment on-premise di modelli di grandi dimensioni, bilanciando costi e requisiti di memoria.

→

May 23 2026

Hardware

Hacknect: il cavo USB Wi-Fi che cela un microcontroller per attacchi mirati

Il cavo Hacknect di Little Gadgets è un dispositivo USB apparentemente innocuo che integra un microcontroller e uno storage microSD, controllabile via Wi-Fi. Progettato per l'esecuzione remota di payload e l'iniezione di sequenze di tasti, si presenta come uno strumento versatile. Sebbene le sue capacità lo rendano un potenziale strumento di hacking, è destinato a maker, sviluppatori e studenti di cybersecurity, offrendo un'opportunità per esplorare la sicurezza informatica e le vulnerabilità dei sistemi.

→

May 23 2026

Market

La visibilità dei brand nell'era degli LLM: una sfida per il monitoraggio SEO

L'emergere di Large Language Models come ChatGPT e Gemini sta creando un divario significativo nella capacità delle aziende di monitorare la propria visibilità online. Mentre i motori di ricerca tradizionali offrono metriche chiare sul posizionamento, le raccomandazioni generate dagli LLM rimangono un "punto cieco" per i team SEO, rendendo obsoleti molti strumenti di tracking attuali.

→

May 23 2026

Altro

SpaceX Starship V3: Un Volo di Test Tra Successi Parziali e Sfide Tecniche

SpaceX ha condotto il dodicesimo volo di test del suo razzo Starship, segnando il debutto della versione 3 aggiornata. Il lancio da Starbase, Texas, ha visto il successo nel rilascio di venti satelliti Starlink fittizi e la trasmissione di video in diretta. Tuttavia, il booster Super Heavy è stato distrutto dopo la separazione, non riuscendo a completare una discesa controllata. L'evento si è verificato a poche settimane dall'IPO di SpaceX, evidenziando le complessità dell'ingegneria spaziale e le implicazioni per la gestione di infrastrutture su larga scala.

→

May 23 2026

Market

Tesla lancia FSD in Cina: una mossa tardiva nel mercato EV più grande al mondo

Tesla ha ufficialmente reso disponibile il suo sistema Full Self-Driving (Supervised) in Cina, aggiungendo il paese ai 10 mercati globali in cui la tecnicia è accessibile. L'annuncio, privo di dettagli specifici, segna la prima conferma di Tesla per la disponibilità di FSD nel più grande mercato di veicoli elettrici, dove i concorrenti offrono soluzioni di guida autonoma da anni.

→

May 23 2026

Market

Corsair adotta DRAM cinese per i moduli DDR5: possibili impatti sui prezzi

Corsair, noto produttore di componenti PC, ha iniziato a integrare moduli DRAM di ChangXin Memory Technologies (CXMT), il maggiore produttore cinese di chip di memoria, nei suoi kit DDR5. L'identificazione, avvenuta tramite software diagnostici su un modulo Corsair Vengeance DDR5-6000, suggerisce un potenziale cambiamento nelle dinamiche del mercato delle memorie. Questa mossa potrebbe influenzare l'offerta e, di conseguenza, i prezzi della memoria, con ripercussioni sul Total Cost of Ownership per i deployment on-premise.

→

May 23 2026

Market

Waymo sospende i robotaxi in cinque città: il patch software non ha funzionato

Waymo ha interrotto il servizio di robotaxi in cinque città statunitensi il 21 maggio. La decisione segue il fallimento di un aggiornamento software, distribuito all'intera flotta di 3.791 veicoli meno di due settimane prima, che non è riuscito a impedire ai mezzi autonomi di finire in strade allagate. Un veicolo senza passeggeri si è bloccato a Midtown Atlanta, evidenziando le sfide nella gestione di condizioni ambientali complesse per i sistemi autonomi.

→

May 23 2026

Market

Xiaomi e la sfida dei prezzi: un nuovo SUV per competere nel mercato EV

Lei Jun, CEO di Xiaomi, ha ammesso pubblicamente che un precedente SUV dell'azienda non era competitivo sul prezzo rispetto a Tesla. In risposta, Xiaomi ha presentato il nuovo modello YU7 True Standard durante l'evento "Human x Car x Home" del 21 maggio, mirando a ridefinire la propria posizione nel segmento dei veicoli elettrici con un'offerta più aggressiva.

→

May 23 2026

LLM

Gemma4 26B A4B: La Quantization APEX Ottimizza l'Inference su GPU Locali

Un recente test su hardware consumer ha evidenziato le potenzialità della quantization APEX per il modello Gemma4 26B A4B. Utilizzando una GPU AMD RX 9060 XT da 16GB di VRAM e `llama.cpp` con Vulkan, è stato possibile raggiungere 38 token al secondo con una finestra di contesto di 90.000 token, mantenendo la qualità del modello. Questo risultato suggerisce un significativo passo avanti nell'efficienza per i deployment LLM self-hosted.

→

May 23 2026

LLM

Un template Jinja sperimentale migliora la stabilità di Gemma4 31B in llama.cpp

Un nuovo template Jinja, denominato "Preserve Thinking", è stato sviluppato per il modello Gemma4 31B, mirato a migliorare la stabilità delle interazioni multi-turn in ambienti `llama.cpp`. Questa soluzione sperimentale affronta problemi comuni legati alla gestione dei "thinking tags" durante le chiamate a tool, offrendo un'esperienza più robusta per chi implementa LLM on-premise. Google non ne raccomanda l'uso ufficiale.

→

May 23 2026

Frameworks

LongCat-Video-Avatar 1.5: un Framework Open Source per la Sintesi Video di Avatar Umani

Meituan-LongCat ha rilasciato LongCat-Video-Avatar 1.5, un framework open source potenziato per la generazione di video di avatar umani basati su audio. La versione 1.5 si concentra sull'ottimizzazione empirica e sulla prontezza per la produzione, offrendo stabilità elevata e sincronizzazione labiale accurata. Include un encoder audio Whisper-Large e un'inference efficiente a 8 passaggi, bilanciando costi e fedeltà visiva. Il modello supporta diverse applicazioni, dalla trasmissione di notizie alla promozione commerciale, con licenza MIT.

→

May 23 2026

LLM

LLM da 397B su 256 GB di VRAM: la sfida del deployment locale

La community tech si interroga sulla fattibilità di eseguire LLM di grandi dimensioni, nell'ordine dei 397 miliardi di parametri, su infrastrutture locali con un limite di 256 GB di VRAM. La discussione evidenzia le complessità e i compromessi legati al deployment on-premise di modelli avanzati, in particolare riguardo alla gestione delle risorse hardware e alle tecniche di ottimizzazione necessarie per bilanciare prestazioni e requisiti di memoria.

→

May 23 2026

Market

CXMT e la spinta cinese nel DRAM: implicazioni per l'AI on-premise

L'IPO di CXMT segnala la crescente ambizione della Cina nel rafforzare la propria filiera DRAM, con profonde implicazioni per la disponibilità hardware globale. Questo sviluppo è cruciale per le aziende che valutano deployment di Large Language Models (LLM) on-premise, influenzando la pianificazione del Total Cost of Ownership (TCO) e la sovranità dei dati. La diversificazione della filiera diventa un fattore chiave per la resilienza infrastrutturale.

→

May 23 2026

Altro

Ottimizzazione della Produzione e Logistica con LLM: Il Contesto On-Premise

Mentre Hotai si prepara a espandere la produzione automobilistica a Taiwan, emerge la discussione sull'applicazione di Large Language Models (LLM) per ottimizzare processi complessi come la supply chain e la gestione della produzione. L'articolo esplora le sfide e le opportunità del deployment on-premise di queste tecnicie, evidenziando l'importanza della sovranità dei dati e del controllo infrastrutturale per le aziende manifatturiere.

→

May 23 2026

Altro

L'automotive cinese punta su robotaxi e AI: le implicazioni per l'infrastruttura

L'industria automobilistica cinese sta accelerando l'adozione di robotaxi e soluzioni di intelligenza artificiale, come evidenziato al Salone dell'Auto di Pechino. Questa transizione pone nuove sfide significative per l'infrastruttura IT, in particolare per quanto riguarda il deployment di modelli AI complessi e la gestione dei dati, spingendo verso valutazioni approfondite tra soluzioni cloud e self-hosted.

→

May 23 2026

Hardware

Panjit punta su AI e robotica per la prossima fase di crescita

Il produttore taiwanese di chip di potenza Panjit International ha annunciato una strategia focalizzata sull'intelligenza artificiale e la robotica per alimentare la sua prossima fase di espansione. La mossa, guidata dal CEO Fang Ming-tsung, dal presidente Fang Ming-ching e dal COO Edgar Chen, sottolinea l'importanza crescente dei componenti di potenza efficienti per sostenere le esigenze energetiche delle infrastrutture AI e robotiche, con implicazioni dirette per i deployment on-premise e la gestione del TCO.

→

May 23 2026

Altro

Deployment On-Premise per LLM: Sfide, Opportunità e Sovranità dei Dati

L'adozione di Large Language Models (LLM) in ambienti aziendali solleva interrogativi cruciali riguardo al deployment. La scelta tra soluzioni cloud e on-premise dipende da fattori come il Total Cost of Ownership (TCO), la sovranità dei dati e le specifiche hardware. Questo articolo esplora le considerazioni chiave per le organizzazioni che valutano un'infrastruttura locale per i loro carichi di lavoro AI, evidenziando i trade-off e le implicazioni strategiche.

→

May 23 2026

LLM

G4-MeroMero-26B-A4B-it-uncensored-heretic: un LLM ottimizzato per l'on-premise

È stato rilasciato il G4-MeroMero-26B-A4B-it-uncensored-heretic, un LLM da 26 miliardi di parametri sottoposto a fine-tuning dal gemma-4-26B-A4B-it. Questo modello si distingue per le sue caratteristiche “uncensored”, con un KLD di 0.0152 e solo 12 rifiuti su 100 richieste, offrendo maggiore flessibilità. Disponibile nei formati Safetensors e GGUF, è progettato per requisiti inferiori di VRAM/RAM, rendendolo ideale per deployment on-premise e scenari con risorse hardware limitate.

→

May 23 2026

Altro

FreeBSD 15.1-RC1: L'AI accelera la scoperta di vulnerabilità di sicurezza

La prima Release Candidate di FreeBSD 15.1 è disponibile, anticipando il rilascio ufficiale previsto per giugno. Questa versione introduce importanti correzioni di sicurezza, molte delle quali derivano da vulnerabilità identificate tramite strumenti di scoperta basati su intelligenza artificiale e Large Language Models (LLM). Il fenomeno, già osservato in Linux, evidenzia una nuova frontiera nella ricerca di vulnerabilità, con implicazioni significative per la sicurezza dei sistemi operativi.

→

May 23 2026

Altro

Qwen3.6 27B su 16 GB VRAM: la Quantization 'Pure' abilita l'Inference Locale

Un recente esperimento ha dimostrato la possibilità di eseguire il Large Language Model Qwen3.6 27B su hardware con soli 16 GB di VRAM, raggiungendo una velocità di generazione di 40 token al secondo. Questo risultato, ottenuto tramite una specifica tecnica di Quantization 'pure' e il framework llama.cpp, apre nuove prospettive per il deployment on-premise di LLM di grandi dimensioni, affrontando le sfide legate alla sovranità dei dati e al TCO.

→

May 22 2026

Altro

IA e ricostruzione vocale: il caso dei piloti defunti e il blocco NTSB

L'intelligenza artificiale è stata impiegata per ricostruire le voci di piloti defunti partendo da immagini spettrogrammatiche di registrazioni di cabina. Questo utilizzo ha portato il National Transportation Safety Board (NTSB) a bloccare temporaneamente l'accesso al suo sistema di archiviazione dati. L'episodio solleva questioni importanti sull'etica, la gestione dei dati sensibili e le capacità emergenti degli algoritmi di sintesi vocale, con implicazioni per la sovranità dei dati e la sicurezza delle informazioni.

→

May 22 2026

Frameworks

Virgin Atlantic accelera lo sviluppo app e la qualità con Codex

Virgin Atlantic ha sfruttato la soluzione Codex per rinnovare la sua app mobile, rispettando una scadenza critica legata ai viaggi festivi. L'adozione di Codex ha permesso di raggiungere una copertura quasi totale dei test unitari e di eliminare i difetti di priorità P1, dimostrando come strumenti avanzati possano migliorare significativamente i processi di sviluppo software in contesti aziendali stringenti.

→

May 22 2026

LLM

Cohere Transcribe: Diarizzazione e Timestamp Arrivano con un Fine-tuning Open Source

Un recente fine-tuning del modello open source Cohere Transcribe introduce il supporto per la diarizzazione e i timestamp, colmando una lacuna significativa. Questa integrazione permette un'identificazione accurata degli speaker e una temporizzazione precisa, rendendo il modello particolarmente utile per applicazioni aziendali che richiedono trascrizioni dettagliate e sensibili. La soluzione è disponibile gratuitamente, offrendo nuove opportunità per i deployment self-hosted.

→

May 22 2026

Market

Incidente in Texas: Cybertruck finisce in un lago durante un test della "modalità guado"

Un uomo in Texas ha guidato il suo Tesla Cybertruck in un lago per testare la "modalità guado" del veicolo, finendo per essere arrestato. L'incidente, il terzo del genere per il proprietario, ha coinvolto anche turisti tedeschi e ha richiesto l'intervento delle forze dell'ordine per il recupero. Tesla avverte che i danni da acqua non sono coperti dalla garanzia, evidenziando le limitazioni di tale funzionalità.

→

May 22 2026

Market

Startup AI: l'uso di metriche di ricavo gonfiate e la consapevolezza degli investitori

Nel dinamico settore delle startup AI, emerge una pratica controversa: alcune aziende presentano pubblicamente metriche di ricavo, come l'ARR, in modo esagerato. Questa tendenza, volta a evidenziare progressi e attrarre investimenti, è ben nota agli stessi investitori. L'analisi di queste dinamiche è cruciale per comprendere le reali valutazioni e le strategie di mercato nel panorama dell'intelligenza artificiale.

→

May 22 2026

Frameworks

Il Programma Ambassador di PyTorch Foundation: Costruire una Comunità Globale

La PyTorch Foundation rilancia il suo Programma Ambassador, un'iniziativa volta a riconoscere e supportare le voci indipendenti che promuovono l'adozione e lo sviluppo di PyTorch. Il programma cerca entusiasti in diverse regioni globali per organizzare eventi, creare contenuti tecnici e fare da mentori, offrendo visibilità, accesso esclusivo e opportunità di sviluppo professionale per un impegno biennale.

→

May 22 2026

Altro

L'NTSB sospende l'accesso ai dati: voci di piloti ricreate con l'AI

L'agenzia statunitense NTSB ha sospeso l'accesso pubblico al suo database di incidenti aerei. La decisione arriva dopo che utenti online hanno ricreato le voci dei piloti da registrazioni di volo, utilizzando software e strumenti di intelligenza artificiale. Questa pratica viola le leggi federali che vietano la diffusione pubblica di audio dai registratori di cabina, sollevando questioni sulla gestione dei dati sensibili e le capacità degli strumenti AI.

→

May 22 2026

Market

SpaceX: il dossier S-1 rivela ambizioni da 28 trilioni e la rotta per Marte

Il deposito del modulo S-1 di SpaceX offre uno sguardo approfondito alle ambizioni dell'azienda, ben oltre il settore aerospaziale. Il documento, con 36 pagine dedicate ai fattori di rischio, delinea un mercato potenziale di 28 trilioni di dollari e un piano di compensi esecutivi legato alla colonizzazione di Marte, puntando a un'IPO storica.

→

May 22 2026

Altro

Google I/O 2026: I Dialogues esplorano il futuro di AI, Quantum e Robotica

Al Google I/O 2026, la sessione "Dialogues" ha riunito esperti per discutere le frontiere dell'intelligenza artificiale, del quantum computing, della robotica e della creatività. Un'analisi approfondita di queste tematiche è cruciale per i decision-maker che valutano strategie di deployment on-premise, sovranità dei dati e ottimizzazione del TCO in scenari tecnicici in rapida evoluzione.

→

May 22 2026

Market

L'ascesa degli LLM: un cambiamento strutturale nel panorama digitale

Gli LLM stanno ridefinendo il comportamento utente e le strategie aziendali, segnando un'evoluzione profonda che va oltre i precedenti cambiamenti tecnicici. Questa trasformazione impone alle aziende di riconsiderare le proprie infrastrutture e le decisioni di deployment, con un'attenzione crescente alla sovranità dei dati e al controllo dei costi.

→

May 22 2026

Altro

Ordine esecutivo sull'AI di Trump annullato: i CEO tech si defilano

Il Presidente Trump ha annullato un evento per la firma di un ordine esecutivo che avrebbe concesso al governo il potere di testare modelli AI avanzati prima del rilascio pubblico. La decisione è arrivata dopo che diversi CEO di importanti aziende AI hanno rifiutato di partecipare con breve preavviso. Elon Musk e Mark Zuckerberg avrebbero contribuito a far deragliare l'iniziativa, mentre OpenAI la sosteneva, evidenziando le tensioni sulla governance dell'AI.

→

May 22 2026

LLM

Qwen-27B ottimizzato per GPU NVIDIA da 16GB: nuove quantizzazioni per LLM on-premise

Una nuova quantization del modello Qwen-27B, denominata IQ4_KS, è stata rilasciata per ottimizzare l'esecuzione su GPU NVIDIA con 16GB di VRAM. Sviluppata con le quantizzazioni KS e KSS di ikawrakow, questa versione da 14.1GB offre prestazioni superiori e una finestra di contesto di 105k token, rendendola ideale per deployment on-premise che richiedono efficienza e controllo sui dati. La soluzione è attualmente compatibile solo con architetture NVIDIA CUDA e CPU.

→

May 22 2026

Frameworks

OpenCL 3.1.1: Un Aggiornamento Cruciale per Performance AI e HPC

Khronos Group ha rilasciato OpenCL 3.1.1, un aggiornamento mirato a risolvere una potenziale regressione di performance identificata nella precedente versione 3.1. Questa specifica, fondamentale per i carichi di lavoro di intelligenza artificiale e High-Performance Computing, sottolinea l'importanza della stabilità e dell'ottimizzazione per i deployment on-premise, dove la prevedibilità delle performance è cruciale per il TCO e la sovranità dei dati.

→

May 22 2026

LLM

Google Search: un aggiornamento AI blocca la ricerca per 'disregard'

Un recente aggiornamento basato sull'intelligenza artificiale per Google Search ha causato un'anomalia: la ricerca della parola "disregard" rende inutilizzabile l'interfaccia. L'incidente solleva interrogativi sulla complessità dei Large Language Models (LLM) e sulle sfide legate al loro deployment e alla loro integrazione in prodotti su larga scala, evidenziando l'importanza di test rigorosi e del controllo sui sistemi AI.

→

May 22 2026

Market

Wingtech cita in giudizio Nexperia in Cina dopo il sequestro olandese di semiconduttori

Wingtech Technology ha avviato una causa legale contro la sua sussidiaria Nexperia presso un tribunale cinese, chiedendo un risarcimento di almeno 8 miliardi di yuan (circa 1,1 miliardi di dollari). La disputa nasce dal sequestro forzato di un produttore di chip di proprietà cinese da parte del governo olandese, segnando la prima sfida legale significativa contro tale azione in Europa. Questo evento sottolinea le crescenti tensioni geopolitiche nel settore dei semiconduttori.

→

May 22 2026

LLM

Meta introduce Forum: una nuova app per i Gruppi Facebook con funzionalità AI

Meta ha rilasciato Forum, una nuova applicazione standalone che si basa sui Gruppi Facebook. L'app integra una sezione "Ask" basata su intelligenza artificiale e un assistente per gli amministratori. Il lancio, avvenuto senza un evento dedicato, si inserisce nel contesto delle discussioni interne a Meta sull'espansione del proprio portfolio di applicazioni, con l'obiettivo di svilupparne fino a cinquanta.

→

May 22 2026

Market

Salesforce e la promessa dell'AI: tra marketing ambizioso e realtà di deployment

Salesforce ha costruito la sua strategia sull'AI con Agentforce, una piattaforma di agenti intelligenti che vanta 29.000 accordi e 800 milioni di dollari di ricavi annuali. Tuttavia, il mercato e gli analisti osservano una potenziale discrepanza tra le ambiziose promesse di sostituire intere categorie di lavoro umano e la concreta capacità di delivery, sollevando interrogativi sulla maturità delle soluzioni AI nel contesto enterprise.

→

May 22 2026

Altro

Le Guerre dell'Attenzione nell'AI: Gestire le Risorse On-Premise

L'articolo esplora come il concetto di 'guerre dell'attenzione', pur derivando da un contesto non tecnicico, si traduca nella gestione critica delle risorse hardware e software per i deployment di Large Language Models (LLM) on-premise. Vengono analizzati i trade-off tra performance, TCO e sovranità dei dati, evidenziando l'importanza di strategie di ottimizzazione per infrastrutture AI locali.

→

May 22 2026

Market

CXMT e Corsair: la DRAM cinese si affaccia al mercato consumer, un'alternativa per la supply chain

Il produttore cinese di memorie CXMT ha fatto il suo ingresso nel segmento mainstream della memoria consumer, collaborando con Corsair per un kit DDR5 Vengeance. Questa mossa segna l'emergere della DRAM di produzione cinese come potenziale soluzione alle carenze di fornitura, introducendo un nuovo attore in un mercato cruciale per l'infrastruttura tecnicica globale, inclusi i deployment AI on-premise.

→

May 22 2026

Hardware

Google presenta occhiali XR prototipali con integrazione Gemini

Google ha mostrato un prototipo di occhiali Android XR capaci di sovrapporre informazioni in tempo reale nel campo visivo dell'utente. Alimentati da Gemini, questi dispositivi offrono funzionalità come traduzione e navigazione, esplorando nuove interfacce per l'interazione con l'intelligenza artificiale.

→

May 22 2026

Market

OpenAI leader nel Magic Quadrant Gartner 2026 per agenti di coding AI enterprise

OpenAI è stata riconosciuta come leader nel Magic Quadrant 2026 di Gartner per gli agenti di coding AI enterprise. Il report evidenzia in particolare Codex, elogiato per la sua innovazione e la capacità di deployment su scala aziendale. Questo posizionamento sottolinea l'importanza crescente degli strumenti AI per lo sviluppo software in contesti professionali.

→

May 22 2026

Altro

Starbucks ritira lo strumento AI per l'inventario: i problemi con i latticini

Starbucks ha ritirato il suo strumento di inventario basato sull'intelligenza artificiale dopo soli nove mesi di utilizzo in Nord America. Il sistema, che rientrava tra le iniziative tecniciche di rilievo del CEO Brian Niccol, ha mostrato difficoltà nel distinguere correttamente i diversi tipi di latte, portando l'azienda a tornare ai conteggi manuali. Questo episodio evidenzia le sfide che i progetti di AI aziendale possono incontrare nell'applicazione pratica in ambienti reali.

→

May 22 2026

Market

Il fondo sovrano norvegese contesta la rielezione di Elkann nel board di Meta

Il Government Pension Fund Global norvegese, il più grande fondo sovrano al mondo con 2.3 trilioni di dollari, ha espresso dissenso sulla rielezione di John Elkann nel consiglio di amministrazione di Meta. La decisione è motivata dalla convinzione che il presidente di Stellantis e CEO di Exor non disponga di tempo sufficiente per dedicarsi adeguatamente all'incarico, sollevando questioni sulla governance e l'impegno dei consiglieri in aziende tecniciche di primo piano.

→

May 22 2026

Market

La ricerca AI di Google: convenienza immediata, costi a lungo termine per il web

Google sta integrando risposte generate dall'intelligenza artificiale nella sua ricerca, offrendo una convenienza senza precedenti. Questa evoluzione, sebbene attrattiva per gli utenti, solleva interrogativi significativi sul futuro del web, sulla sostenibilità dei creatori di contenuti e sulla provenienza delle informazioni, spingendo le aziende a considerare alternative self-hosted per la gestione dei propri dati e la sovranità delle informazioni.

→

May 22 2026

LLM

OpenBMB e BitCPM-CANN 1.58 bit: l'efficienza LLM su Huawei Ascend

OpenBMB ha presentato BitCPM-CANN, un LLM caratterizzato da una quantization a 1.58 bit. Questo approccio mira a ottimizzare l'efficienza dell'inference, riducendo l'impronta di memoria e i requisiti computazionali. Il modello è attualmente in fase di test sul processore Huawei Ascend 910B, evidenziando l'interesse per soluzioni hardware alternative e deployment on-premise che privilegiano il controllo e l'ottimizzazione delle risorse.

→

May 22 2026

Altro

systemd 261-rc1: Un Installer OS, IMDS e storagectl per il Gestore di Servizi Linux

È disponibile la prima release candidate di systemd 261, che introduce significative novità per il gestore di sistema e servizi Linux. Tra le aggiunte spiccano un installer per il sistema operativo, un nuovo sottosistema IMDS e l'utility storagectl. Questi aggiornamenti consolidano il ruolo di systemd come componente infrastrutturale chiave, offrendo strumenti avanzati per la gestione e il deployment di ambienti server, con implicazioni dirette per le architetture on-premise e la sovranità dei dati.

→

May 22 2026

Market

Nvidia punta a due terzi del mercato CPU x86: 20 miliardi e 4 milioni di Vera entro il 2027

Nvidia si prepara a conquistare una quota significativa del mercato delle CPU server x86, tradizionalmente dominato da Intel e AMD. Le previsioni indicano che l'azienda potrebbe raggiungere i due terzi di questo segmento, generando ricavi per 20 miliardi di dollari. Entro l'anno fiscale 2027, Nvidia prevede di consegnare 4 milioni di processori Vera, segnando un'espansione strategica nel settore dei processori centrali per data center.

→

May 22 2026

Market

Mistral AI acquisisce Emmi AI, Bliq.ai ottiene via libera per guida autonoma in Estonia: il panorama tech europeo si evolve

La settimana nel panorama tecnicico europeo è stata ricca di movimenti strategici. Tra le notizie di spicco, Mistral AI ha acquisito Emmi AI, consolidando la sua posizione nel settore degli LLM. In Estonia, Bliq.ai ha ottenuto l'approvazione per operazioni stradali completamente autonome, segnando un passo avanti per l'AI su strada. Dunia Innovations ha inoltre presentato un GigaLab da 280 milioni di euro per la scoperta di materiali basata sull'AI, evidenziando investimenti significativi in infrastrutture e ricerca.

→

May 22 2026

LLM

Casi di 'citazioni sintetiche' in un libro sollevano interrogativi sull'affidabilità dell'AI

Il giornalista Steven Rosenbaum ha utilizzato strumenti di intelligenza artificiale per la ricerca del suo libro "The Future of Truth". Un'indagine del New York Times ha rivelato la presenza di "citazioni sintetiche" o attribuite erroneamente. Nonostante l'autore stia lavorando a una revisione, intende continuare a impiegare l'AI, sollevando questioni cruciali sull'affidabilità e la verifica dei contenuti generati da Large Language Models in contesti professionali.

→

May 22 2026

LLM

LLM e progettazione di chip: l'AI affianca l'ingegnere, la guida umana è chiave

Gli LLM stanno iniziando a superare gli ingegneri nella progettazione di chip in ambiti specifici, accelerando lo sviluppo di strumenti software. Nonostante i progressi, un ricercatore di Berkeley sottolinea l'importanza della guida umana nel processo. Questo scenario evidenzia l'evoluzione degli strumenti di design e le implicazioni per l'infrastruttura on-premise necessaria a supportare tali carichi di lavoro complessi.

→

May 22 2026

LLM

SupraLabs presenta Supra-50M: un LLM compatto con performance sorprendenti

SupraLabs ha rilasciato Supra-50M, un LLM causale da 50 milioni di parametri con architettura Llama-style. Addestrato su 20 miliardi di token, il modello dimostra risultati competitivi su diversi benchmark, superando in alcuni casi modelli di dimensioni maggiori. Questa release segna il primo passo del piano di scaling di SupraLabs, suggerendo un approccio all'efficienza e alla performance per deployment con risorse limitate.

→

May 22 2026

Altro

Password rubate: il rischio persistente per la sovranità dei dati nei deployment AI

Le password rubate rappresentano la causa principale di molte violazioni di dati, un rischio amplificato nei contesti di deployment AI on-premise. Pratiche come il riutilizzo di credenziali, la loro condivisione informale o la memorizzazione non sicura nei browser minacciano direttamente la sovranità dei dati e la compliance. Proteggere l'accesso è fondamentale per salvaguardare gli asset critici e l'integrità dei carichi di lavoro LLM.

→

May 22 2026

Market

Lucis ottiene 20 milioni di dollari per potenziare la prevenzione sanitaria basata su AI

Lucis, la piattaforma di salute preventiva basata su AI, ha annunciato un finanziamento di Serie A da 20 milioni di dollari, portando il capitale totale raccolto a 28 milioni. Il round, guidato da Singular, mira a espandere la sua offerta che analizza oltre 110 biomarcatori ematici per fornire indicazioni personalizzate e monitorate da medici, con l'obiettivo di rendere la prevenzione una pratica standard in Europa.

→

May 22 2026

LLM

DeepSeek avanza con un round da 10,29 miliardi, puntando sull'Open Source

DeepSeek sta finalizzando un round di finanziamento da 10,29 miliardi di dollari. Il fondatore Liang Wenfeng ha ribadito l'impegno a sviluppare modelli AI Open Source, privilegiando la visione a lungo termine rispetto a obiettivi di commercializzazione immediata. Questa strategia si allinea con le esigenze di controllo, sovranità dei dati e ottimizzazione del TCO per le aziende che valutano deployment on-premise di Large Language Models.

→

May 22 2026

Market

I marchi EV cinesi superano il 15% del mercato europeo: un segnale di cambiamento strategico

I marchi cinesi di veicoli elettrici, guidati da BYD e Chery, hanno raggiunto una quota di mercato superiore al 15% in Europa ad aprile, segnando un raddoppio delle consegne e superando una soglia importante per la prima volta. Questo scenario si sviluppa mentre Bruxelles mantiene le barriere tariffarie e i produttori europei come Stellantis riorganizzano le proprie capacità produttive, evidenziando dinamiche competitive intense nel settore.

→

May 22 2026

Altro

REPS raccoglie 23,6 milioni di dollari per generare elettricità dal traffico stradale

La startup austriaca REPS ha ottenuto un finanziamento di 23,6 milioni di dollari per sviluppare la sua tecnicia innovativa. L'azienda mira a convertire l'energia cinetica generata dal traffico stradale, in particolare dai mezzi pesanti, in elettricità. Il primo "impianto stradale" è stato installato nel Porto di Amburgo, con l'obiettivo di testare la sostenibilità economica della soluzione su larga scala.

→

May 22 2026

Market

La Guardia di Finanza smantella una vasta rete di pirateria audiovisiva in Europa

Un'operazione congiunta, denominata "Tutto Chiaro", ha portato allo smantellamento di una complessa rete di pirateria audiovisiva che trasmetteva illegalmente contenuti a pagamento da piattaforme come Sky, DAZN, Netflix, Disney+ e Spotify. L'indagine, condotta dalla Guardia di Finanza italiana, ha colpito oltre cento siti in Italia, Francia e Germania, interrompendo un sistema che riutilizzava codici di abbonamento legittimi per migliaia di utenti.

→

May 22 2026

Market

Critterz: il film AI bloccato a Cannes per l'indisponibilità del modello generativo

Il progetto di animazione "Critterz", sostenuto da OpenAI e presentato come il primo film commerciale realizzato con una pipeline di IA generativa, ha mancato la sua finestra al festival di Cannes. Il motivo principale è l'indisponibilità del modello video su cui era basato, evidenziando le sfide e i rischi legati alla dipendenza da infrastrutture e modelli di IA esterni per produzioni complesse e mission-critical.

→

May 22 2026

Altro

La Cina mappa la sua rete energetica rinnovabile con l'AI: un modello per il mondo?

La Cina ha realizzato un inventario nazionale ad alta risoluzione della sua infrastruttura eolica e solare, utilizzando un modello di deep learning su immagini satellitari. Questo permette una coordinazione energetica su scala nazionale, affrontando le inefficienze attuali e la crescente domanda di elettricità dovuta all'AI, offrendo un potenziale modello per altre economie.

→

May 22 2026

Altro

OpenAI inaugura un laboratorio a Singapore e l'IMDA aggiorna il framework per l'AI agentica

OpenAI ha aperto il suo primo laboratorio di AI applicata fuori dagli Stati Uniti a Singapore, con un investimento di oltre 300 milioni di dollari di Singapore. L'iniziativa mira a creare ruoli tecnici e a supportare l'ecosistema locale. Contemporaneamente, l'IMDA di Singapore ha aggiornato il suo framework di governance per l'AI agentica, fornendo nuove linee guida e casi di studio per il deployment responsabile di questi sistemi, con un focus sulla mitigazione dei rischi e la responsabilità umana.

→

May 22 2026

Hardware

AMD potenzia il recupero dei carichi di lavoro GPU: driver aggiornati per maggiore stabilità

AMD ha rilasciato una serie di 42 patch per i driver kernel AMDGPU e AMDKFD, mirando a migliorare la capacità di recupero delle GPU da blocchi nei carichi di lavoro di calcolo. Questo aggiornamento introduce funzionalità di reset della pipeline, cruciali per garantire maggiore stabilità e continuità operativa, un aspetto fondamentale per i deployment on-premise di LLM e altre applicazioni AI.

→

May 22 2026

Altro

LLM e AI: l'onda di innovazione che ridefinisce i sottosistemi Linux

L'influenza degli LLM e dell'intelligenza artificiale si estende sempre più in profondità nei sistemi operativi. Dopo aver stimolato numerosi aggiornamenti nel sottosistema di rete di Linux, inclusi importanti patch di sicurezza per vulnerabilità di escalation dei privilegi, ora l'AI sta guidando un'intensa attività anche nel sottosistema audio. Molte delle recenti modifiche e patch sono state sviluppate o assistite da strumenti di intelligenza artificiale, evidenziando un nuovo paradigma nello sviluppo del kernel.

→

May 22 2026

Altro

L'espansione dell'AI nel Golfo: la sfida dei cavi sottomarini

Il rapido sviluppo dell'intelligenza artificiale nella regione del Golfo sta mettendo sotto pressione le infrastrutture internet esistenti. Con l'aumento della posta in gioco per i carichi di lavoro AI, gli hyperscaler spingono per una revisione delle reti sottomarine, evidenziando la crescente dipendenza da una connettività robusta e resiliente per sostenere l'innovazione e il deployment di Large Language Models.

→

May 22 2026

Market

CPE broadband a Taiwan: l'onda del 10G tra volumi in crescita e pressioni sui prezzi

Il mercato taiwanese dei Customer Premises Equipment (CPE) si prepara a un'espansione significativa nel primo trimestre del 2026, trainato dagli aggiornamenti alla tecnicia 10 Gigabit (10G). Nonostante l'aumento dei volumi, il settore dovrà affrontare continue pressioni sui prezzi. Questa dinamica evidenzia la crescente domanda di infrastrutture di rete ad alta velocità, cruciali per i carichi di lavoro AI, ma anche la sfida di bilanciare innovazione e sostenibilità economica per i decision-maker tecnici.

→

May 22 2026

Hardware

NVentures di NVIDIA investe in Alice & Bob, rafforzando il legame con CUDA-Q

NVentures, il braccio di venture capital di NVIDIA, ha investito in Alice & Bob, un'azienda di hardware quantistico con sede a Parigi e Boston. L'investimento rafforza la collaborazione esistente, in particolare il legame con il Framework CUDA-Q di NVIDIA. Alice & Bob è nota per la sua architettura proprietaria "cat-qubit", progettata per costruire macchine quantistiche tolleranti agli errori, un passo cruciale per la scalabilità e l'affidabilità del quantum computing.

→

May 22 2026

Frameworks

lemon-mlx-engine: ROCm 7.13 per LLM on-premise e correzioni per Qwen

Il progetto lemon-mlx-engine ha rilasciato un aggiornamento significativo, integrando la versione 7.13 di ROCm, la piattaforma open source di AMD per il calcolo su GPU. Questa novità permette agli utenti di sfruttare la potenza di ROCm su hardware locale con il motore MLX per i Large Language Models. La release include anche importanti correzioni di bug e kernel, specificamente mirate ai modelli Qwen3, 3.5 e 3.6, sia in configurazione MoE che dense, migliorando stabilità e performance nei deployment self-hosted.

→

May 22 2026

LLM

DeepSeek punta all'AGI con un round di finanziamento da 10 miliardi di dollari

DeepSeek, guidata dal fondatore Liang Wenfeng, ha annunciato l'obiettivo di perseguire l'Intelligenza Artificiale Generale (AGI) come priorità principale. L'azienda, con sede a Hangzhou, sta conducendo il suo primo round di finanziamento esterno, puntando a raccogliere 10 miliardi di dollari. La strategia prevede di privilegiare la ricerca di frontiera rispetto ai ricavi immediati e di continuare a rilasciare modelli open source.

→

May 22 2026

Market

Lenovo: ricavi record nel Q4, spinta dall'AI e vendite PC oltre le attese

Lenovo ha registrato un quarto trimestre eccezionale, con ricavi che hanno raggiunto i 21,6 miliardi di dollari, superando le stime del mercato del 27% anno su anno. L'utile netto è balzato del 479% a 521 milioni di dollari, quasi il doppio delle previsioni. Un fattore chiave è stato il raddoppio dei ricavi legati all'AI, contribuendo a un anno fiscale record per l'azienda. Questo risultato sottolinea la crescente domanda di soluzioni tecniciche, inclusi i sistemi per l'intelligenza artificiale.

→

May 22 2026

Hardware

AMD: la memoria si afferma come fattore critico per i chip AI, secondo Lisa Su

Lisa Su, CEO di AMD, ha evidenziato come la memoria stia diventando un vincolo sempre più pressante per lo sviluppo e il deployment dei chip dedicati all'intelligenza artificiale. Questa osservazione sottolinea l'importanza della VRAM e della sua larghezza di banda per le performance degli LLM, specialmente in contesti on-premise dove l'ottimizzazione hardware è cruciale per il TCO e la sovranità dei dati. La gestione efficiente della memoria è fondamentale per carichi di lavoro AI complessi.

→

May 22 2026

Altro

Bliq.ai: Via libera in Estonia per i veicoli autonomi senza conducente

Bliq.ai ha ottenuto l'approvazione per operare veicoli completamente senza conducente sulle strade pubbliche in Estonia, segnando la prima autorizzazione di questo tipo in un paese dell'UE. L'azienda, che aggiorna veicoli esistenti con uno stack di sensori e computazione basato su AI, mira a estendere la mobilità autonoma a consumatori e aziende, enfatizzando un modello di retrofit e la supervisione remota. Questo sviluppo evidenzia l'importanza dell'AI all'edge e delle soluzioni di deployment locali nel settore della mobilità.

→

May 22 2026

Market

Meta chiude il primo caso pilota sulla salute mentale giovanile

Meta ha raggiunto un accordo extragiudiziale nel primo processo intentato da un distretto scolastico statunitense, quello della Contea di Breathitt in Kentucky. La causa mirava a rendere le aziende di social media responsabili dei costi legati alla crisi della salute mentale giovanile. Questo accordo chiude un caso pilota che precede circa 1.200 azioni legali simili, sollevando interrogativi sulle future strategie legali del settore.

→

🗄️ Archivio Notizie