AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes
🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.
👥 160+ membri · Iscriviti gratis →

⚡ In Tendenza

View All →

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

Google AI Overviews e l'impatto sui publisher: un calo del 58% nei click
📁 Market AI generated ℹ️ The Next Web

Google AI Overviews e l'impatto sui publisher: un calo del 58% nei click

Le "AI Overviews" di Google, riassunti generati dall'intelligenza artificiale che appaiono in cima ai risultati di ricerca, hanno causato una diminuzione del 58% nei click verso i siti web degli editori. Questi riassunti si basano sui contenuti degli stessi publisher, sollevando preoccupazioni e portando a un'azione legale antitrust da parte di Penske Media. Google sta introducendo una sezione "Further Exploration" per tentare di recuperare parte del traffico.

2026-05-06 📰 Fonte
Chatbot e Salute Mentale: L'Urgenza di Salvaguardie Contro Deliri e Dipendenze
📁 LLM AI generated 🏆 IEEE Spectrum

Chatbot e Salute Mentale: L'Urgenza di Salvaguardie Contro Deliri e Dipendenze

L'ampia diffusione dei chatbot per supporto emotivo e compagnia solleva preoccupazioni crescenti per la salute mentale. La ricerca evidenzia rischi di amplificazione di deliri e dipendenze, con casi tragici già documentati. Esperti e legislatori propongono salvaguardie tecniche e normative, come limiti conversazionali, audit indipendenti e sistemi di rilevamento del disagio, per mitigare i pericoli e garantire un uso etico e sicuro di queste tecnicie.

2026-05-06 📰 Fonte
Barry Diller e l'AGI: la fiducia è irrilevante di fronte a una forza imprevedibile
📁 Altro AI generated ✅ TechCrunch AI

Barry Diller e l'AGI: la fiducia è irrilevante di fronte a una forza imprevedibile

Barry Diller, figura di spicco nel panorama mediatico, ha difeso Sam Altman di OpenAI, ma ha anche lanciato un monito sull'Intelligenza Artificiale Generale (AGI). Secondo Diller, l'AGI rappresenta una forza imprevedibile che richiederà rigorosi meccanismi di controllo ("guardrails"), rendendo la fiducia personale un fattore secondario rispetto alla necessità di governare questa tecnicia emergente.

2026-05-06 📰 Fonte
L'Ucraina impiega robot per la prima volta in un'azione di guerra: l'azienda vale un miliardo
📁 Altro AI generated ℹ️ The Next Web

L'Ucraina impiega robot per la prima volta in un'azione di guerra: l'azienda vale un miliardo

Il Presidente ucraino Volodymyr Zelensky ha annunciato un evento storico: le forze armate hanno conquistato una posizione nemica impiegando esclusivamente sistemi senza equipaggio, senza il coinvolgimento diretto di fanteria. Droni e robot terrestri hanno identificato l'obiettivo, soppresso il fuoco difensivo e assicurato l'area. Questo segna un precedente nell'impiego di sistemi autonomi in contesti bellici. L'azienda sviluppatrice di questi robot ha raggiunto una valutazione di un miliardo di dollari, evidenziando il crescente valore strategico della robotica avanzata.

2026-05-06 📰 Fonte
Nyobolt: batterie ultrarapide per la robotica di magazzino, valutazione da un miliardo
📁 Hardware AI generated ℹ️ The Next Web

Nyobolt: batterie ultrarapide per la robotica di magazzino, valutazione da un miliardo

La startup Nyobolt, con sede a Cambridge, ha chiuso un round di finanziamento Series C da 60 milioni di dollari, raggiungendo una valutazione di un miliardo. Il successo è trainato dalle sue batterie ultrarapide, capaci di ricaricarsi in pochi secondi e durare 20.000 cicli. Contrariamente alle aspettative, queste batterie non alimentano veicoli, bensì i robot mobili autonomi SymBot di Symbotic, un'azienda di robotica AI quotata al Nasdaq, impiegati nella logistica di magazzino.

2026-05-06 📰 Fonte
Test di sicurezza AI: la Casa Bianca cambia rotta dopo il caso Mythos
📁 Altro AI generated ✅ Ars Technica AI

Test di sicurezza AI: la Casa Bianca cambia rotta dopo il caso Mythos

L'amministrazione Trump ha siglato accordi con Google DeepMind, Microsoft e xAI per test di sicurezza governativi sui loro LLM avanzati, prima e dopo il rilascio. Questo segna un'inversione di rotta rispetto alla precedente posizione che considerava tali controlli un'eccessiva regolamentazione. Il cambiamento è avvenuto dopo che Anthropic ha ritenuto il suo modello Claude Mythos troppo rischioso da rilasciare, temendo abusi delle sue capacità di cybersecurity.

2026-05-06 📰 Fonte
xAI tra modelli e infrastrutture: la strategia dei data center
📁 Altro AI generated ✅ TechCrunch AI

xAI tra modelli e infrastrutture: la strategia dei data center

Recenti speculazioni suggeriscono che il core business di xAI potrebbe evolvere, spostando l'attenzione dallo sviluppo di modelli di intelligenza artificiale alla costruzione di data center. Questa potenziale transizione evidenzia la crescente importanza strategica dell'infrastruttura fisica nel panorama dell'AI, influenzando le decisioni di deployment on-premise e i trade-off tra controllo, TCO e sovranità dei dati per le aziende che adottano Large Language Models.

2026-05-06 📰 Fonte
La Nuova Identità di Uber: Il Mercato Ridefinisce il Valore Oltre il Ride-Hailing
📁 Market AI generated ℹ️ The Next Web

La Nuova Identità di Uber: Il Mercato Ridefinisce il Valore Oltre il Ride-Hailing

Nonostante il mancato raggiungimento delle stime di fatturato, il titolo Uber ha registrato un balzo del 10%. Questa anomalia segnala un profondo cambiamento nella percezione di Wall Street, che ora valuta l'azienda ben oltre i suoi servizi tradizionali di ride-hailing e food delivery, anticipando un futuro modello di business differente e più promettente.

2026-05-06 📰 Fonte
Google e la strategia AI: licenze contro consulenza per il mercato enterprise
📁 Market AI generated ℹ️ The Next Web

Google e la strategia AI: licenze contro consulenza per il mercato enterprise

Google sta adottando un approccio distintivo nel mercato dell'intelligenza artificiale enterprise, concentrandosi su accordi di licenza per i suoi Large Language Models. Questa strategia si contrappone a quella di aziende come OpenAI e Anthropic, che hanno invece sviluppato modelli di business basati sulla consulenza. La scelta di Google potrebbe rivelarsi cruciale per dominare il nuovo canale di distribuzione aziendale emergente, in particolare tra le società in portafoglio dei maggiori fondi di private equity, un segmento di mercato paragonabile per importanza all'avvento del cloud computing.

2026-05-06 📰 Fonte
Core42 di G42: un ex ufficio di Minneapolis diventa data center AI da 20 MW
📁 Altro AI generated ℹ️ The Next Web

Core42 di G42: un ex ufficio di Minneapolis diventa data center AI da 20 MW

Core42, sussidiaria di G42, ha trasformato un ex edificio per uffici a Minneapolis in un data center AI da 20 megawatt. Questa mossa strategica, lontana dai tradizionali hyperscaler della Silicon Valley, evidenzia l'impegno verso infrastrutture dedicate per carichi di lavoro AI intensivi. La conversione sottolinea la crescente domanda di spazi fisici attrezzati e la ricerca di maggiore controllo e sovranità dei dati per il Deployment di Large Language Models.

2026-05-06 📰 Fonte
ZAYA1-8B: Un LLM da 8B parametri spinge i confini dell'efficienza su hardware AMD
📁 LLM AI generated ℹ️ LocalLLaMA

ZAYA1-8B: Un LLM da 8B parametri spinge i confini dell'efficienza su hardware AMD

Zyphra ha presentato ZAYA1-8B, un Large Language Model da 8 miliardi di parametri che promette un'elevata densità di intelligenza. La sua particolarità risiede nell'addestramento su architetture AMD, un dettaglio significativo per il panorama degli LLM. Questo sviluppo sottolinea l'importanza di ottimizzare i modelli per diverse piattaforme hardware, offrendo nuove opportunità per deployment on-premise e strategie di diversificazione dei fornitori, cruciali per la sovranità dei dati e il controllo del TCO.

2026-05-06 📰 Fonte
OpenAI: le trattative dietro l'uscita di Elon Musk, secondo Greg Brockman
📁 Market AI generated ✅ TechCrunch AI

OpenAI: le trattative dietro l'uscita di Elon Musk, secondo Greg Brockman

Greg Brockman ha rivelato dettagli inediti sulle "trattative spietate" che hanno preceduto l'addio di Elon Musk a OpenAI. Queste rare divulgazioni pubbliche offrono uno spaccato delle dinamiche interne che possono influenzare la direzione strategica di aziende leader nell'intelligenza artificiale, con ripercussioni sulle scelte di deployment e sulla sovranità dei dati per le imprese.

2026-05-06 📰 Fonte
Studio rivela: l'uso di assistenti AI può compromettere capacità cognitive
📁 LLM AI generated ✅ Wired AI

Studio rivela: l'uso di assistenti AI può compromettere capacità cognitive

Una nuova ricerca suggerisce che l'affidamento prolungato agli assistenti basati sull'intelligenza artificiale potrebbe avere un impatto negativo sulle capacità di pensiero critico e risoluzione dei problemi degli individui. Lo studio evidenzia come anche un uso limitato possa influenzare le funzioni cognitive, sollevando interrogativi sulle strategie di adozione e integrazione dell'AI in contesti professionali.

2026-05-06 📰 Fonte
Hugging Face: un'analisi sulle configurazioni hardware più diffuse per gli LLM
📁 Hardware AI generated ℹ️ LocalLLaMA

Hugging Face: un'analisi sulle configurazioni hardware più diffuse per gli LLM

Clément Delangue di Hugging Face ha condiviso un'analisi delle 100 configurazioni hardware più popolari utilizzate sulla piattaforma. Questo studio offre spunti cruciali per CTO e architetti infrastrutturali che valutano il deployment di Large Language Models, evidenziando l'importanza delle scelte hardware per performance, TCO e sovranità dei dati in contesti self-hosted e on-premise.

2026-05-06 📰 Fonte
DeepSeek: un LLM cinese sfida i giganti USA con costi e risorse ridotti
📁 Market AI generated ✅ TechCrunch AI

DeepSeek: un LLM cinese sfida i giganti USA con costi e risorse ridotti

DeepSeek, un laboratorio AI cinese, ha catturato l'attenzione del settore all'inizio del 2025 grazie al lancio di un Large Language Model. Questo modello si distingue per essere stato addestrato impiegando una frazione della potenza di calcolo e dei costi tipici dei principali LLM statunitensi, come quelli sviluppati da OpenAI e Anthropic. L'efficienza dimostrata potrebbe portare DeepSeek a una valutazione di 45 miliardi di dollari nel suo primo round di investimenti, evidenziando un approccio innovativo all'addestramento di modelli su larga scala.

2026-05-06 📰 Fonte
La Corte Suprema nega la sospensione ad Apple nel caso Epic
📁 Market AI generated ℹ️ The Next Web

La Corte Suprema nega la sospensione ad Apple nel caso Epic

La Corte Suprema degli Stati Uniti ha respinto la richiesta di sospensione d'emergenza presentata da Apple nel contenzioso con Epic Games. La decisione della Giustizia Elena Kagan implica che Apple dovrà ora tornare davanti al Giudice Yvonne Gonzalez Rogers per discutere le commissioni applicabili agli acquisti di app tramite link esterni, dopo essere stata ritenuta in oltraggio alla corte.

2026-05-06 📰 Fonte
Linux 7.2: il modulo AMDGPU DC ottimizza la gestione energetica Radeon
📁 Hardware AI generated ✅ Phoronix

Linux 7.2: il modulo AMDGPU DC ottimizza la gestione energetica Radeon

La prossima versione del kernel Linux, la 7.2, integrerà un nuovo modulo di gestione energetica per i driver grafici e di calcolo AMDGPU e AMDKFD. Questa novità, attesa per la finestra di merge di giugno, mira a migliorare l'allineamento del comportamento di gestione dell'energia delle GPU Radeon su Linux con quello già presente in Microsoft Windows, ottimizzando efficienza e prestazioni per i carichi di lavoro intensivi.

2026-05-06 📰 Fonte
SpaceX e xAI: un investimento miliardario per la produzione di chip in Texas
📁 Hardware AI generated ✅ TechCrunch AI

SpaceX e xAI: un investimento miliardario per la produzione di chip in Texas

SpaceX, la compagnia spaziale di Elon Musk che include anche la sua entità AI, xAI, sta valutando un investimento iniziale di 55 miliardi di dollari, con un potenziale di crescita fino a 119 miliardi, per costruire una fabbrica di semiconduttori in Texas. Questa mossa strategica, emersa da documenti depositati nella contea di Grimes, sottolinea l'ambizione di Musk di integrare verticalmente la produzione di hardware critico per le sue operazioni, inclusa l'intelligenza artificiale.

2026-05-06 📰 Fonte
La "ChatGPT Futures Class of 2026": l'impatto sull'AI aziendale
📁 LLM AI generated 🏆 OpenAI Blog

La "ChatGPT Futures Class of 2026": l'impatto sull'AI aziendale

OpenAI ha presentato la "ChatGPT Futures Class of 2026", un gruppo di 26 studenti innovatori che utilizzano l'AI per ricerca e sviluppo. Questa iniziativa evidenzia come la prossima generazione stia ridefinendo apprendimento e creatività con strumenti AI, ponendo nuove sfide e opportunità per le strategie di deployment e infrastruttura AI in ambito enterprise.

2026-05-06 📰 Fonte
Anthropic e il 'Dreaming' degli Agenti AI: il dibattito sui nomi antropomorfi
📁 LLM AI generated ✅ Wired AI

Anthropic e il 'Dreaming' degli Agenti AI: il dibattito sui nomi antropomorfi

Anthropic ha annunciato "dreaming", una funzionalità per i suoi agenti AI che permette di "ordinare le memorie". L'introduzione di termini antropomorfi solleva un dibattito sulla chiarezza e le aspettative nel settore dell'intelligenza artificiale, specialmente per le aziende che valutano deployment on-premise e la sovranità dei dati.

2026-05-06 📰 Fonte
Anthropic introduce la 'memoria a lungo termine' per i suoi LLM con la funzione 'dreaming'
📁 LLM AI generated ✅ Ars Technica AI

Anthropic introduce la 'memoria a lungo termine' per i suoi LLM con la funzione 'dreaming'

Anthropic ha presentato 'dreaming', una nuova capacità per i suoi Claude Managed Agents. Questa funzione permette agli agenti di rivedere eventi passati e archiviare informazioni cruciali in una 'memoria', superando i limiti delle context windows degli LLM. Attualmente in fase di ricerca, 'dreaming' mira a migliorare la gestione di compiti complessi e prolungati, garantendo che i dati rilevanti non vengano persi nel tempo.

2026-05-06 📰 Fonte
Driver Linux per Workstation: Nouveau Open Source contro NVIDIA R595
📁 Hardware AI generated ✅ Phoronix

Driver Linux per Workstation: Nouveau Open Source contro NVIDIA R595

Un'analisi comparativa sui driver Linux per workstation esamina le prestazioni del driver open source Nouveau rispetto alla soluzione proprietaria NVIDIA R595. Il test, condotto su una workstation HP Z6 G5 A, evidenzia il posizionamento dominante del driver ufficiale NVIDIA per l'hardware RTX (PRO), pur riconoscendo la continua evoluzione di Nouveau in attesa del driver kernel Nova. La scelta del driver è cruciale per chi gestisce deployment on-premise, influenzando controllo, performance e TCO.

2026-05-06 📰 Fonte
L'AI nella Ricerca di Google: Implicazioni per i Deployment Enterprise On-Premise
📁 Altro AI generated 🏆 Google AI Blog

L'AI nella Ricerca di Google: Implicazioni per i Deployment Enterprise On-Premise

Google ha integrato funzionalità di intelligenza artificiale, come 'AI Mode' e 'Search Live', nella sua piattaforma di ricerca per offrire assistenza pratica agli utenti. Questo sviluppo evidenzia la crescente adozione dell'AI in applicazioni quotidiane, spingendo le aziende a valutare le strategie di deployment per carichi di lavoro simili, in particolare le opzioni self-hosted per garantire sovranità dei dati e controllo sui costi.

2026-05-06 📰 Fonte
Qwen 3.6 27B: inference 2.5x più rapida con MTP per deployment locali
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen 3.6 27B: inference 2.5x più rapida con MTP per deployment locali

Un recente aggiornamento a `llama.cpp` introduce il supporto per la Multi-Token Prediction (MTP) nel modello Qwen 3.6 27B, accelerando l'inference fino a 2.5 volte. Questa innovazione, combinata con la compressione della KV cache a 4-bit e un'ampia finestra di contesto di 262K token, rende il modello una soluzione più efficiente per carichi di lavoro LLM self-hosted su hardware come Apple Silicio e GPU NVIDIA, con requisiti di memoria specifici.

2026-05-06 📰 Fonte
Contenuti AI di bassa qualità: un problema che affligge anche i forum cybercriminali
📁 Altro AI generated ✅ Wired AI

Contenuti AI di bassa qualità: un problema che affligge anche i forum cybercriminali

Anche le comunità underground di cybercriminali lamentano un'invasione di contenuti generati da intelligenza artificiale di scarsa qualità. Questo fenomeno, che affligge diverse piattaforme online, solleva interrogativi sulla gestione dei Large Language Models e sull'importanza della qualità dei dati e del fine-tuning, aspetti cruciali per chi valuta deployment on-premise e la sovranità dei dati.

2026-05-06 📰 Fonte
Opposizione crescente ai data center AI: quasi la metà degli americani contraria
📁 Altro AI generated ℹ️ Tom's Hardware

Opposizione crescente ai data center AI: quasi la metà degli americani contraria

Un recente sondaggio rivela che il 47% degli americani si oppone alla costruzione di nuovi data center dedicati all'intelligenza artificiale nelle proprie vicinanze. Questa resistenza si manifesta anche attraverso eventi pubblici, come un raduno a St. Paul, Minnesota, evidenziando una crescente preoccupazione per l'impatto di queste infrastrutture sul territorio e sulle comunità locali, un fattore cruciale per le strategie di deployment on-premise.

2026-05-06 📰 Fonte
Genesis AI svela GENE-26.5 e un approccio "full-stack" alla robotica
📁 Altro AI generated ✅ TechCrunch AI

Genesis AI svela GENE-26.5 e un approccio "full-stack" alla robotica

La startup Genesis AI, sostenuta da un finanziamento seed di 105 milioni di dollari, ha presentato il suo primo modello di intelligenza artificiale, GENE-26.5, specificamente progettato per la robotica. L'annuncio è accompagnato da una dimostrazione che illustra mani robotiche eseguire compiti complessi, evidenziando un'integrazione profonda tra AI e hardware.

2026-05-06 📰 Fonte
Google integra forum e Reddit nella ricerca AI: opportunità e rischi
📁 LLM AI generated ✅ TechCrunch AI

Google integra forum e Reddit nella ricerca AI: opportunità e rischi

Google sta aggiornando la sua ricerca basata su intelligenza artificiale per includere contenuti da forum web e piattaforme come Reddit. L'obiettivo è migliorare le risposte a query di nicchia, ma questa integrazione solleva interrogativi sulla potenziale gestione del caos informativo e sulla qualità delle fonti.

2026-05-06 📰 Fonte
Ethos raccoglie 22,75 milioni di dollari per risolvere le sfide dell'AI nel recruiting
📁 Market AI generated ℹ️ The Next Web

Ethos raccoglie 22,75 milioni di dollari per risolvere le sfide dell'AI nel recruiting

La piattaforma londinese Ethos ha chiuso un round di finanziamento Series A da 22,75 milioni di dollari, guidato da Andreessen Horowitz. Fondata da ex-DeepMind ed ex-McKinsey, Ethos mira a risolvere le problematiche introdotte dall'AI nel settore del recruiting, un ambito del mercato del lavoro che l'intelligenza artificiale generativa ha visibilmente alterato negli ultimi 30 mesi. General Catalyst, già investitore seed, ha partecipato nuovamente al round.

2026-05-06 📰 Fonte
Gemma 4 di Google: Multi-Token Prediction Accelera l'Inference Locale fino a 3x
📁 Altro AI generated ✅ Ars Technica AI

Gemma 4 di Google: Multi-Token Prediction Accelera l'Inference Locale fino a 3x

Google ha introdotto Multi-Token Prediction (MTP) per i suoi LLM Gemma 4, ottimizzati per l'esecuzione locale. Questa nuova funzionalità sperimentale, basata su speculative decoding, promette di velocizzare la generazione di token fino a tre volte, affrontando le limitazioni hardware dei deployment on-premise. Con la licenza Apache 2.0, Gemma 4 rafforza il controllo sui dati e l'accessibilità per gli sviluppatori e le aziende che cercano soluzioni AI self-hosted.

2026-05-06 📰 Fonte
Match Group rallenta le assunzioni: il costo degli strumenti AI incide sui bilanci
📁 Market AI generated ✅ TechCrunch AI

Match Group rallenta le assunzioni: il costo degli strumenti AI incide sui bilanci

Match Group, la società madre di popolari piattaforme di dating come Tinder, ha annunciato un rallentamento delle assunzioni per il resto dell'anno. La decisione è motivata dagli elevati costi associati all'adozione e all'utilizzo di strumenti di intelligenza artificiale. Questo evidenzia come l'investimento in AI stia diventando una voce di spesa significativa per le aziende tech.

2026-05-06 📰 Fonte
Ethos, la startup AI per il recruiting, raccoglie 22,75 milioni di dollari nel Series A
📁 Market AI generated ℹ️ Tech.eu

Ethos, la startup AI per il recruiting, raccoglie 22,75 milioni di dollari nel Series A

Ethos, la startup londinese co-fondata da un ex scienziato di Google DeepMind e un dirigente di SoftBank, ha chiuso un round di finanziamento Series A da 22,75 milioni di dollari, guidato da Andreessen Horowitz. L'azienda utilizza l'intelligenza artificiale per identificare e connettere esperti qualificati con laboratori AI, fondi di investimento e grandi aziende, superando i limiti dei CV tradizionali e rispondendo alla rapida evoluzione del mercato del lavoro guidata dall'IA.

2026-05-06 📰 Fonte
Apple, accordo da 250 milioni per le promesse AI di Siri non consegnate
📁 Market AI generated ✅ TechCrunch AI

Apple, accordo da 250 milioni per le promesse AI di Siri non consegnate

Apple ha accettato di versare 250 milioni di dollari per chiudere una class action. La causa era stata intentata per le promesse non mantenute relative all'introduzione di nuove funzionalità basate sull'intelligenza artificiale all'interno di Siri, l'assistente vocale dell'azienda.

2026-05-06 📰 Fonte
Adozione AI: come le aziende leader costruiscono il vantaggio competitivo
📁 Market AI generated 🏆 OpenAI Blog

Adozione AI: come le aziende leader costruiscono il vantaggio competitivo

Una ricerca di OpenAI, intitolata "B2B Signals", rivela come le aziende più innovative stiano accelerando l'adozione dell'intelligenza artificiale. Lo studio evidenzia l'implementazione di workflow basati su agenti, potenziati da tecnicie come Codex, per scalare le operazioni. Questo approccio strategico consente alle "frontier enterprises" di consolidare un vantaggio competitivo duraturo, ponendo l'AI al centro della loro strategia operativa e infrastrutturale.

2026-05-06 📰 Fonte
Ethos: 22,75 milioni di dollari da a16z per la rete di esperti con onboarding vocale
📁 Market AI generated ✅ TechCrunch AI

Ethos: 22,75 milioni di dollari da a16z per la rete di esperti con onboarding vocale

Ethos, una piattaforma specializzata nella creazione di reti di esperti, ha raccolto 22,75 milioni di dollari in finanziamenti guidati da a16z. L'azienda si distingue per il suo innovativo sistema di onboarding vocale e dichiara di integrare 35.000 nuovi esperti ogni settimana. Questo rapido sviluppo solleva interrogativi sulle infrastrutture di elaborazione dati e sulla sovranità delle informazioni, aspetti cruciali per le aziende che gestiscono volumi elevati di dati sensibili.

2026-05-06 📰 Fonte
Qwen3.6 27B su RTX 5090: 200k token di contesto con vLLM in locale
📁 Altro AI generated ℹ️ LocalLLaMA

Qwen3.6 27B su RTX 5090: 200k token di contesto con vLLM in locale

Un recente test ha dimostrato la capacità di eseguire il modello Qwen3.6 27B, quantizzato in NVFP4, su una singola GPU NVIDIA RTX 5090 con 32GB di VRAM. Utilizzando il framework vLLM, il setup ha gestito una finestra di contesto di 200.000 token, raggiungendo una velocità di generazione media di circa 73.6 token al secondo. Questi risultati evidenziano il potenziale delle soluzioni on-premise per carichi di lavoro LLM ad alto contesto su hardware consumer.

2026-05-06 📰 Fonte
Samsung supera il trilione di dollari: la spinta della domanda di chip AI
📁 Market AI generated ✅ TechCrunch AI

Samsung supera il trilione di dollari: la spinta della domanda di chip AI

Samsung ha raggiunto una valutazione di oltre mille miliardi di dollari, diventando la seconda azienda asiatica a tagliare questo traguardo dopo TSMC. La crescita è stata alimentata dall'impennata della domanda di chip per l'intelligenza artificiale, evidenziando il ruolo cruciale dell'hardware nel panorama tecnicico attuale.

2026-05-06 📰 Fonte
SpaceX punta al silicio: 55 miliardi per una fabbrica di chip in Texas, l'impegno totale supera i 100 miliardi
📁 Hardware AI generated ℹ️ The Next Web

SpaceX punta al silicio: 55 miliardi per una fabbrica di chip in Texas, l'impegno totale supera i 100 miliardi

SpaceX ha presentato la documentazione per la costruzione di una fabbrica di semiconduttori, denominata Terafab, nel Texas rurale. L'investimento previsto per questa nuova struttura ammonta a circa 55 miliardi di dollari. Insieme all'esistente impianto di packaging di Bastrop, l'impegno complessivo di SpaceX nel settore della produzione di chip in Texas potrebbe raggiungere i 119 miliardi di dollari, segnando un'espansione strategica nel controllo della catena di fornitura.

2026-05-06 📰 Fonte
Vulkan SC SDK: Un Nuovo Standard per Applicazioni Critiche
📁 Frameworks AI generated ✅ Phoronix

Vulkan SC SDK: Un Nuovo Standard per Applicazioni Critiche

Il Khronos Group ha annunciato il rilascio del Vulkan SC SDK, una suite di strumenti progettata per lo sviluppo di applicazioni grafiche e di calcolo in contesti di sicurezza critica. Questa evoluzione degli standard Vulkan mira a fornire maggiore controllo e prevedibilità, elementi fondamentali per settori come l'automotive, l'avionica e l'automazione industriale, dove l'affidabilità del software è prioritaria.

2026-05-06 📰 Fonte
Dell e Lenovo rafforzano il supporto a LVFS per il firmware su Linux
📁 Altro AI generated ✅ Phoronix

Dell e Lenovo rafforzano il supporto a LVFS per il firmware su Linux

Dell e Lenovo sono diventati sponsor di primo livello del Linux Vendor Firmware Service (LVFS). Questa iniziativa sottolinea l'importanza della gestione del firmware in ambienti Linux, un aspetto cruciale per le infrastrutture on-premise. LVFS, supportato dal client Fwupd, garantisce aggiornamenti fluidi per il firmware di sistema e dei componenti, migliorando la stabilità e la sicurezza delle piattaforme enterprise.

2026-05-06 📰 Fonte
AMD espande e specializza i processori EPYC: Zen 7 in sviluppo per AI e cloud
📁 Hardware AI generated ℹ️ Tom's Hardware

AMD espande e specializza i processori EPYC: Zen 7 in sviluppo per AI e cloud

AMD sta ampliando e specializzando la sua offerta di processori EPYC, con l'architettura Zen 7 già in fase di sviluppo. L'obiettivo è una maggiore personalizzazione per rispondere alle esigenze in evoluzione dei carichi di lavoro AI e hyperscale, sia in ambienti cloud che on-premise. Questa strategia mira a ottimizzare le performance e l'efficienza per un'ampia gamma di applicazioni.

2026-05-06 📰 Fonte
OpenTrade raccoglie 17 milioni di dollari per espandere l'infrastruttura di rendimento stablecoin
📁 Market AI generated ℹ️ Tech.eu

OpenTrade raccoglie 17 milioni di dollari per espandere l'infrastruttura di rendimento stablecoin

OpenTrade, piattaforma di infrastrutture per il rendimento delle stablecoin, ha ottenuto 17 milioni di dollari in un round di finanziamento strategico, portando il totale raccolto a oltre 30 milioni di dollari. L'azienda offre soluzioni 'plug-and-play' per prodotti di rendimento denominati in dollari ed euro, supportati da asset del mondo reale. Con il mercato delle stablecoin che supera i 300 miliardi di dollari, OpenTrade punta a scalare la sua offerta, inclusi un protocollo permissionless e servizi Curation+ per strategie istituzionali.

2026-05-06 📰 Fonte
Hut 8 sigla un accordo da 9,8 miliardi di dollari per il data center AI in Texas
📁 Market AI generated ℹ️ The Next Web

Hut 8 sigla un accordo da 9,8 miliardi di dollari per il data center AI in Texas

Hut 8, azienda precedentemente focalizzata sul mining di Bitcoin, ha firmato un contratto di locazione quindicennale da 9,8 miliardi di dollari per la prima fase del suo data center AI in Texas, denominato Beacon Point. L'accordo, con un inquilino di grado investimento non specificato, porta la capacità AI contrattualizzata di Hut 8 a 597 MW, con un valore complessivo di 16,8 miliardi di dollari. Questa mossa segna il completamento della sua trasformazione strategica in fornitore di infrastrutture AI.

2026-05-06 📰 Fonte
Gemma 4 26B: Un Nuovo Approccio per LLM Locali con Attenzione Decoupled
📁 Altro AI generated ℹ️ LocalLLaMA

Gemma 4 26B: Un Nuovo Approccio per LLM Locali con Attenzione Decoupled

Una nuova tecnica promette di superare i limiti di scalabilità dei Large Language Models (LLM) su hardware locale. L'approccio prevede il decoupling del meccanismo di attenzione, che richiede pochi gigabyte di memoria, dai pesi del modello, che possono essere gestiti su una macchina separata, potenzialmente meno potente come un sistema basato su CPU Xeon. Questo apre nuove possibilità per deployment on-premise, riducendo i requisiti hardware complessivi e migliorando l'accessibilità.

2026-05-06 📰 Fonte
VKD3D-Proton 3.0.1: Nuovi Miglioramenti per Direct3D 12 su Vulkan
📁 Frameworks AI generated ✅ Phoronix

VKD3D-Proton 3.0.1: Nuovi Miglioramenti per Direct3D 12 su Vulkan

Valve ha rilasciato VKD3D-Proton 3.0.1, una nuova versione del suo strumento che abilita le applicazioni Direct3D 12 a funzionare sull'API Vulkan in ambiente Linux. Questo aggiornamento, curato dal team di driver grafici Linux di Valve, introduce ulteriori ottimizzazioni, cruciali per chi gestisce infrastrutture self-hosted e cerca di massimizzare la compatibilità e le performance dei carichi di lavoro su sistemi operativi aperti.

2026-05-06 📰 Fonte
Qwen3-27B e MTP: un boost di throughput del 250% per l'inference LLM on-premise
📁 LLM AI generated ℹ️ LocalLLaMA

Qwen3-27B e MTP: un boost di throughput del 250% per l'inference LLM on-premise

Un recente sviluppo ha dimostrato come l'implementazione della Multi-Token Prediction (MTP) per il modello Qwen3-27B, tramite una versione modificata di `llama.cpp`, possa incrementare il throughput dei token di circa 2,5 volte. Questa tecnica, che combina la Quantization Q8_0 per i layer MTP con una base a bassa precisione, riduce al minimo l'overhead di VRAM, rendendo l'inference di Large Language Models più efficiente e accessibile per i deployment self-hosted.

2026-05-06 📰 Fonte
AMD estende il supporto ROCm su WSL a più hardware Ryzen
📁 Hardware AI generated ✅ Phoronix

AMD estende il supporto ROCm su WSL a più hardware Ryzen

AMD ha rilasciato un nuovo aggiornamento per la libreria open source ROCDXG, migliorando la compatibilità di ROCm all'interno del Windows Subsystem for Linux (WSL). Questa espansione mira a estendere il supporto ROCm su WSL2 a un numero maggiore di processori Ryzen, offrendo agli sviluppatori una piattaforma più robusta per lo sviluppo di applicazioni AI e HPC in ambienti locali.

2026-05-06 📰 Fonte
Apple riduce la memoria del Mac Studio a 96GB: impatto sull'AI locale
📁 Hardware AI generated ℹ️ Tom's Hardware

Apple riduce la memoria del Mac Studio a 96GB: impatto sull'AI locale

Apple ha silenziosamente rimosso la configurazione da 128GB di memoria unificata dal Mac Studio, portando la capacità massima a 96GB. Questa decisione, che riguarda anche il modello Early 2025, è attribuita a vincoli di fornitura e alla crescente domanda di capacità di elaborazione AI locali. La riduzione della memoria massima disponibile solleva interrogativi per gli sviluppatori e le aziende che puntano a deployment di Large Language Models on-premise, evidenziando i trade-off nell'adozione di soluzioni self-hosted.

2026-05-06 📰 Fonte
OpenAI presenta MRC: un nuovo protocollo di rete per l'AI su larga scala
📁 Altro AI generated 🏆 OpenAI Blog

OpenAI presenta MRC: un nuovo protocollo di rete per l'AI su larga scala

OpenAI ha introdotto MRC (Multipath Reliable Connection), un nuovo protocollo di rete per supercomputer. Rilasciato tramite OCP, mira a migliorare la resilienza e le prestazioni nei cluster di training AI su larga scala, offrendo soluzioni cruciali per le infrastrutture on-premise e per chi cerca maggiore controllo e affidabilità.

2026-05-06 📰 Fonte
NVIDIA Spectrum-X MRC: Il Protocollo RDMA per l'AI su Larga Scala
📁 Altro AI generated ✅ ServeTheHome

NVIDIA Spectrum-X MRC: Il Protocollo RDMA per l'AI su Larga Scala

NVIDIA ha introdotto Spectrum-X MRC, un protocollo di trasporto RDMA personalizzato progettato per alimentare i deployment di intelligenza artificiale su scala gigascale. Questa tecnicia sottolinea l'importanza di soluzioni di rete ad alte prestazioni per le infrastrutture AI moderne, offrendo vantaggi cruciali per le organizzazioni che mirano a costruire ambienti self-hosted o ibridi con elevato throughput e bassa latenza, mantenendo controllo e sovranità dei dati.

2026-05-06 📰 Fonte
La Thailandia si afferma come hub AI regionale con investimenti da 29 miliardi di dollari
📁 Altro AI generated ℹ️ The Next Web

La Thailandia si afferma come hub AI regionale con investimenti da 29 miliardi di dollari

Il Consiglio per gli Investimenti della Thailandia ha approvato sei importanti progetti per un valore complessivo di 29 miliardi di dollari, tre dei quali sono data center. L'espansione del data center di TikTok, da sola, ammonta a 25 miliardi di dollari, segnalando un'accelerazione del Paese verso il posizionamento come snodo chiave per l'infrastruttura AI nella regione. Questa mossa evidenzia l'importanza crescente delle capacità di calcolo locali per i carichi di lavoro di intelligenza artificiale.

2026-05-06 📰 Fonte
Apple, accordo da 250 milioni di dollari per le funzionalità AI di Siri
📁 Market AI generated ✅ Wired AI

Apple, accordo da 250 milioni di dollari per le funzionalità AI di Siri

Apple ha raggiunto un accordo da 250 milioni di dollari per risolvere una class action relativa alle funzionalità di intelligenza artificiale di Siri. La transazione potrebbe portare a risarcimenti fino a 95 dollari per dispositivo per i possessori di iPhone 15 o 16 negli Stati Uniti, evidenziando le crescenti implicazioni legali e di privacy legate all'integrazione dell'AI nei prodotti di consumo.

2026-05-06 📰 Fonte
Intel aggiorna i driver grafici kernel Linux: arriva il Panel Replay Tunneling
📁 Hardware AI generated ✅ Phoronix

Intel aggiorna i driver grafici kernel Linux: arriva il Panel Replay Tunneling

Gli ingegneri Intel stanno preparando un aggiornamento significativo per i driver grafici kernel Linux, destinato alla versione 7.2 del kernel. La novità principale è l'introduzione del "Panel Replay Tunneling", una funzionalità che mira a migliorare la gestione grafica e l'efficienza energetica. Questo sviluppo sottolinea l'importanza di un'infrastruttura software robusta e aggiornata per i deployment on-premise, garantendo stabilità e massimizzando le performance hardware.

2026-05-06 📰 Fonte
Qutwo, la startup AI finlandese di Peter Sarlin, raggiunge una valutazione di 325 milioni di euro
📁 Market AI generated ℹ️ Tech.eu

Qutwo, la startup AI finlandese di Peter Sarlin, raggiunge una valutazione di 325 milioni di euro

Qutwo, una startup finlandese di intelligenza artificiale co-fondata da Peter Sarlin (già fondatore di Silo AI, acquisita da AMD), ha raccolto 25 milioni di euro in un round angel. L'operazione porta la sua valutazione a 325 milioni di euro a pochi mesi dal lancio. L'azienda mira a diventare il principale laboratorio AI europeo per l'era quantistica, sviluppando la piattaforma software Qutwo OS per le imprese.

2026-05-06 📰 Fonte
L'Inference AI ridefinisce il mercato dei chip: nuove opportunità per le startup
📁 Hardware AI generated ✅ The Register AI

L'Inference AI ridefinisce il mercato dei chip: nuove opportunità per le startup

Il panorama dell'intelligenza artificiale si sposta dalla fase di training a quella di serving, aprendo nuove vie per le startup di chip. L'eterogeneità dei carichi di lavoro di inference, che richiedono un mix variabile di capacità di calcolo, memoria e banda, permette a nuovi attori di specializzarsi. Alcune aziende puntano su architetture disaggregate per prefill e decode, mentre altre propongono soluzioni integrate o innovative come gli acceleratori ottici.

2026-05-06 📰 Fonte
Anthropic estende Claude al settore finanziario con nuovi agenti AI
📁 LLM AI generated ✅ The Register AI

Anthropic estende Claude al settore finanziario con nuovi agenti AI

Anthropic ha introdotto una serie di template di agenti finanziari per il suo servizio Claude AI. Questi agenti sono progettati per assistere in compiti complessi come la verifica KYC e l'analisi di mercato, integrando istruzioni, accesso ai dati e sotto-agenti specializzati. L'azienda enfatizza la necessità di supervisione umana, nonostante i benchmark, per garantire accuratezza e responsabilità nelle operazioni finanziarie.

2026-05-06 📰 Fonte
6G: I dieci abilitatori tecnicici che plasmeranno il futuro delle reti wireless
📁 Altro AI generated 🏆 IEEE Spectrum

6G: I dieci abilitatori tecnicici che plasmeranno il futuro delle reti wireless

Il 6G si preannuncia come una rivoluzione nelle comunicazioni wireless, integrando tecnicie avanzate per superare i limiti attuali. Questo articolo esplora i dieci pilastri tecnicici che definiranno le reti di sesta generazione, dalle nuove bande di frequenza all'intelligenza artificiale, dalle superfici intelligenti riconfigurabili alle architetture di rete innovative. Un'analisi essenziale per comprendere le fondamenta delle future infrastrutture digitali e le loro implicazioni per i deployment on-premise.

2026-05-06 📰 Fonte
Il dibattito sull'IA: tra percezioni pubbliche e complessità di deployment
📁 Altro AI generated ✅ Wired AI

Il dibattito sull'IA: tra percezioni pubbliche e complessità di deployment

Mentre il dibattito pubblico sull'impatto dell'intelligenza artificiale si intensifica, con voci che ne criticano gli effetti sulla società, i decision-maker IT affrontano sfide concrete legate al deployment di Large Language Models. L'analisi si sposta sulla necessità di valutare attentamente i trade-off tra soluzioni cloud e on-premise, considerando aspetti come la sovranità dei dati, il TCO e le specifiche hardware.

2026-05-06 📰 Fonte
CIO e l'era degli agenti AI: da gestori tech a garanti dell'ordine
📁 Market AI generated ✅ The Register AI

CIO e l'era degli agenti AI: da gestori tech a garanti dell'ordine

Forrester prevede un profondo cambiamento nel ruolo dei CIO entro il 2030. L'adozione caotica degli agenti AI, integrati in software e infrastrutture cloud, richiederà ai CIO di evolvere da gestori della tecnicia a garanti del "sistema operativo aziendale basato sull'AI". Sarà essenziale affrontare frammentazione, basi dati deboli e processi incompleti per prevenire fallimenti sistemici. La governance degli esiti e la gestione del rischio diventeranno priorità assolute per i leader IT.

2026-05-06 📰 Fonte
L'impatto dell'AI di Microsoft sui servizi: GitHub tra instabilità e risorse deviate
📁 Market AI generated ✅ The Register AI

L'impatto dell'AI di Microsoft sui servizi: GitHub tra instabilità e risorse deviate

Recenti osservazioni sollevano interrogativi sulla qualità dei servizi Microsoft, con critiche rivolte a Windows 11 e Remote Desktop. GitHub, in particolare, mostra segni di instabilità con interruzioni giornaliere, compromettendo il suo ruolo di piattaforma cruciale per lo sviluppo Open Source e la collaborazione. Si ipotizza che una focalizzazione eccessiva sull'AI stia dirottando risorse e talenti, influenzando negativamente l'affidabilità dei servizi fondamentali.

2026-05-06 📰 Fonte
← Precedente Page 36 / 119 Successiva →
Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

AI-RADAR badge LaunchTry LAUNCHING SOON ON LaunchTry Fazier badge