AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il radar quotidiano su modelli, framework e hardware per far girare l'AI in locale. LLM, LangChain, Chroma, mini-PC e tutto ciò che serve per un cervello distribuito "in-house".

⚙️ Stack: LLM locali · LangChain · Transformers · ChromaDB · MiniPC · AI boxes

🛰️ Ask Observatory (Q&A + RAG) già collegato all'archivio articoli.

👥 160+ membri · Iscriviti gratis →

📡

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

Un nuovo paper introduce la quantization “statisticamente senza perdita” (SLQ), che garantisce la qualità dell’output in termini probabilistici senza ...

📡 Segnale AI 2026-07-25

⚡ In Tendenza

View All →

📊 Statistiche

Archivio Totale

Articoli indicizzati nel sistema RAG

Categorie

📡 RSS Feed

🛠️ Guide & Osservatorio On-Premise

🚀 Esegui i modelli in locale → Tutte le guide →

Riferimenti evergreen e pratici per far girare l'AI in locale — hardware, costi, privacy e stack completo.

🖥️ Osservatorio LLM On-Premise Hardware, stack, governance e architetture di riferimento per l'AI in locale. →

⚡ Le migliori GPU per LLM locali 💰 Quanto costa un LLM in locale 🧩 Ollama vs LM Studio 🔒 ChatGPT privato per aziende 📉 Quantizzazione LLM spiegata 📊 Quanta VRAM per Llama 70B 🚀 Esegui i modelli in locale (Qwen, Llama, R1…)

Ultime analisi & news dal radar

Articoli generati dall'AI sulla base dei feed, con spazio per layer editoriale umano sopra il contenuto grezzo.

📁 LLM AI generated ℹ️ LocalLLaMA

Mellum2: JetBrains rende Open Source il modello rapido per i workflow AI

JetBrains ha annunciato il rilascio di Mellum2 come modello Open Source. Progettato per accelerare i workflow di intelligenza artificiale, questo modello si propone come una soluzione efficiente per gli sviluppatori e le aziende che cercano alternative flessibili per le proprie infrastrutture AI, specialmente in contesti on-premise dove il controllo e la velocità sono prioritari. La sua natura Open Source facilita l'adozione e la personalizzazione.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

L'impatto dell'AI sulle valutazioni delle startup: un mercato a due velocità

L'avvento dell'intelligenza artificiale generativa ha creato un divario significativo nel panorama delle startup. Mentre le aziende focalizzate sull'AI generativa attraggono capitali con valutazioni record, quelle che hanno raccolto fondi prima del lancio di ChatGPT, nel novembre 2022, stanno assistendo a un crollo del proprio valore. Oltre 220 ex "unicorni" hanno perso lo status di miliardo di dollari, secondo PitchBook.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Gradient Labs: 13 milioni per agenti AI che trasformano le operazioni finanziarie

Gradient Labs, startup londinese specializzata in agenti AI per il settore finanziario, ha annunciato un'estensione di 13 milioni di dollari per il suo round Series A, portando il totale a 26 milioni e il capitale complessivo a circa 30 milioni. L'azienda sviluppa soluzioni per automatizzare customer service, lending e KYC, gestendo centinaia di migliaia di chiamate mensili. I nuovi fondi supporteranno l'espansione negli Stati Uniti e il miglioramento tecnicico, con un focus sull'integrazione con i sistemi esistenti delle fintech.

2026-06-01 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Mellum 2: JetBrains presenta un MoE compatto per lo sviluppo codice

JetBrains ha rilasciato Mellum 2, un Large Language Model basato su architettura Mixture-of-Experts (MoE) progettato specificamente per compiti di programmazione. Nonostante le dimensioni contenute, il modello mira a offrire prestazioni di ragionamento sul codice paragonabili a quelle di modelli più grandi, pur mostrando limiti in ambiti generici. La sua specializzazione lo rende interessante per deployment on-premise.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ Ars Technica AI

Intel punta all'Inference AI con 'Crescent Island': costi e raffreddamento ottimizzati

Intel si prepara a lanciare entro fine anno il chip AI 'Crescent Island', una GPU progettata per le attività di inference. L'azienda mira a competere con Nvidia e AMD offrendo soluzioni con memoria e sistemi di raffreddamento più economici, puntando a ridurre il Total Cost of Ownership per i deployment AI, in particolare per i carichi di lavoro on-premise.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Computex 2026: L'Anteprima di Taipei e le Implicazioni per l'AI On-Premise

Mentre il Computex 2026 si prepara a Taipei, l'attenzione si sposta sulle innovazioni hardware che definiranno il futuro dei deployment AI on-premise. L'evento rappresenta un punto di riferimento cruciale per CTO e architetti infrastrutturali, offrendo uno sguardo sulle tecnicie che influenzeranno la sovranità dei dati, il TCO e le capacità di inference locale per i Large Language Models.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Controlli export USA spingono la Cina verso chip AI custom, lontano dalle GPU

L'industria cinese dei chip per l'IA sta abbandonando l'obiettivo di replicare le GPU general-purpose di Nvidia. A causa dei continui controlli sulle esportazioni statunitensi, che limitano l'accesso ai processori grafici più potenti, le principali aziende tecniciche cinesi si stanno orientando verso lo sviluppo di circuiti integrati specifici per applicazioni (ASIC). Questa strategia mira a creare chip personalizzati, ottimizzati per eseguire compiti specifici con elevata efficienza, piuttosto che gestire carichi di lavoro generici.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Nvidia RTX Spark: supporto nativo per anti-cheat su Windows on Arm

Nvidia ha annunciato il chip RTX Spark, progettato per garantire la compatibilità nativa con le principali tecnicie anti-cheat e DRM, inclusi titoli come Fortnite e Valorant, nell'ecosistema Windows on Arm. Questa mossa, presentata dal CEO Jensen Huang, segna un passo significativo per l'integrazione hardware-software in un ambiente sempre più rilevante per lo sviluppo di soluzioni locali e edge.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ ServeTheHome

NVIDIA svela RTX Spark: il SoC Arm con GPU Blackwell per PC Windows

NVIDIA ha presentato RTX Spark, un System-on-Chip (SoC) basato su architettura Arm, specificamente progettato per i PC Windows di fascia alta. Il chip integra 20 core CPU e una potente GPU basata sull'architettura Blackwell. Questa mossa segna l'ingresso di NVIDIA nel mercato dei PC Windows premium con una soluzione hardware che punta a offrire prestazioni elevate e efficienza energetica.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Nvidia a Computex 2026: Vera Rubin in Produzione e il Debutto di RTX Spark

Nvidia ha annunciato la disponibilità della sua prossima piattaforma, Vera Rubin, e ha presentato RTX Spark, una macchina Windows basata su architettura Arm, durante il keynote di Computex 2026 a Taipei. L'intervento del CEO Jensen Huang ha delineato le prossime mosse dell'azienda nel settore dell'AI e dei PC, con implicazioni dirette per l'hardware dedicato all'inference e al training on-premise e per le strategie di deployment.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

LG Electronics: impennata azionaria sull'onda dell'AI fisica e la partnership con Nvidia

Le azioni di LG Electronics hanno registrato un'impennata quest'anno, con un picco del 30% per due sessioni consecutive. Il catalizzatore è l'annuncio di un incontro tra il presidente di LG Group e il CEO di Nvidia, Jensen Huang, previsto per il 5 giugno. L'obiettivo è esplorare una maggiore collaborazione nel campo dell'AI fisica, un settore che sta attirando l'attenzione per le sue implicazioni sui deployment on-premise e sull'hardware dedicato.

2026-06-01 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

L'IA ridefinisce le minacce globali: focus sulla velocità decisionale nei conflitti

Al recente Shangri-La Dialogue di Singapore, l'intelligenza artificiale è emersa come la principale preoccupazione per la stabilità strategica, superando le armi nucleari. Alti ufficiali militari hanno evidenziato come i sistemi basati sull'IA riducano drasticamente i tempi di decisione umani in scenari di conflitto, sollevando interrogativi cruciali sulla gestione della sicurezza globale e sulla necessità di infrastrutture robuste e controllate per applicazioni critiche.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ Wired AI

Servizio Clienti 'Tech-First': Le Insidie dell'Automazione e il Caso Norse Atlantic

Il caso di Norse Atlantic Airways, con numerose lamentele alla Federal Trade Commission per il suo approccio "tech-first" al servizio clienti e perdite economiche per gli utenti, evidenzia i rischi di un'automazione mal gestita. L'episodio solleva interrogativi cruciali sulla necessità di controllo, trasparenza e robustezza nelle soluzioni AI per interazioni critiche, spingendo le aziende a valutare deployment on-premise per garantire sovranità dei dati e affidabilità.

2026-06-01 📰 Fonte

📁 LLM AI generated ✅ Ars Technica AI

OpenAI e la Congettura di Erdős: un Traguardo per l'AI in Matematica

OpenAI ha annunciato che un suo modello di intelligenza artificiale ha risolto la Congettura di Erdős sulla distanza unitaria, un problema di geometria discreta che ha eluso i matematici per 80 anni. L'evento, definito una "pietra miliare" da esperti come il medaglia Fields Tim Gowers, segna un progresso significativo nelle capacità autonome dell'AI nella ricerca scientifica.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Phoronix celebra 22 anni: l'importanza dell'hardware Linux per l'AI on-premise

Phoronix.com festeggia il 5 giugno i suoi 22 anni di attività, un traguardo significativo nella copertura dell'hardware Linux e delle notizie open source. Questa ricorrenza sottolinea la crescente rilevanza di piattaforme e soluzioni aperte per le infrastrutture AI, specialmente per le aziende che privilegiano deployment on-premise. L'analisi approfondita di Phoronix ha fornito per anni un riferimento cruciale per decisioni infrastrutturali che bilanciano controllo, sovranità dei dati e TCO.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ Phoronix

Linux: AF_ALG verso la deprecazione per rischi sicurezza e strumenti IA

Il kernel Linux si appresta a rimuovere l'interfaccia AF_ALG, che permette alle applicazioni di accedere al motore crittografico integrato. Questa rapida deprecazione è motivata da una "superficie di attacco massiva" e da un aumento delle vulnerabilità, messe in luce anche dall'impiego di strumenti basati su intelligenza artificiale e Large Language Models (LLM). La decisione evidenzia l'evoluzione del panorama della sicurezza informatica.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Computex 2026: L'Hardware AI al Centro dell'Innovazione On-Premise

Il Computex 2026 di Taipei si conferma un appuntamento cruciale per l'innovazione hardware. Sebbene i dettagli specifici degli annunci del primo giorno siano ancora in fase di emersione, l'evento è un barometro fondamentale per le tendenze che influenzeranno i deployment di Large Language Models (LLM) on-premise, la sovranità dei dati e l'ottimizzazione del Total Cost of Ownership (TCO) per le infrastrutture AI.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ Tom's Hardware

Intel e l'ingresso di Nvidia nel mercato PC: tra 'paranoia' e l'elogio di x86

Intel ha espresso una "sana dose di paranoia" riguardo all'ingresso di Nvidia nel mercato dei PC, pur riconoscendo che RTX Spark è "ottimo per il mercato". L'azienda ha ribadito il valore dell'architettura x86, sottolineando la crescente competizione nel settore e le implicazioni per le strategie di deployment on-premise, dove la scelta dell'hardware è cruciale per il TCO e la sovranità dei dati.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

Return Helper: 4 milioni di dollari per l'AI che trasforma i resi e-commerce in profitto

Return Helper ha concluso un round di finanziamento Series A da 4 milioni di dollari. L'azienda, specializzata nella gestione dei resi e-commerce transfrontalieri, intende utilizzare i fondi per espandere la propria presenza internazionale, in particolare in Europa, e potenziare le sue capacità di intelligenza artificiale. L'AI è stata fondamentale per la crescita del 60% nel 2025 e il raggiungimento della redditività, trasformando i resi da costo a opportunità di valore per i commercianti.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ LocalLLaMA

La Corsa alle GPU: Tra Domanda Globale e la Centralità di NVIDIA

Il mercato delle GPU è in fermento, con una domanda globale che supera l'offerta, spinta dall'espansione dell'intelligenza artificiale. NVIDIA, guidata da Jensen Huang, si trova al centro di questa dinamica, fornendo l'hardware essenziale per lo sviluppo e il deployment di Large Language Models. Questa situazione evidenzia le sfide per le aziende che pianificano infrastrutture AI on-premise.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ Phoronix

NBD-VRAM: Swap Space on NVIDIA GeForce VRAM for On-Premise LLMs (Updated)

An Open Source developer has released NBD-VRAM, a tool that enables the creation of swap space on the VRAM of consumer NVIDIA GeForce GPUs under Linux. This solution aims to extend available memory capacity for intensive workloads, such as Large Language Models, offering new possibilities for on-premise deployments with existing hardware and contributing to data sovereignty.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ Phoronix

NVIDIA presenta RTX Spark: un nuovo superchip per desktop compatti e laptop

Durante il keynote di Computex, Jensen Huang di NVIDIA ha annunciato ufficialmente RTX Spark, un nuovo "superchip" progettato per equipaggiare PC desktop compatti e laptop. Questa mossa mira a portare capacità di calcolo avanzate direttamente sui dispositivi locali, aprendo nuove prospettive per l'esecuzione di carichi di lavoro AI e LLM in ambienti on-premise e edge.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Le aziende taiwanesi avviano la validazione del Wi-Fi 8 in anticipo sulla finalizzazione

Le aziende taiwanesi di networking hanno iniziato la validazione del futuro standard Wi-Fi 8, anticipando la sua finalizzazione ufficiale. Questa mossa strategica mira a garantire compatibilità ed efficienza per la prossima generazione di connettività wireless ad alte prestazioni. Per i decision-maker tech, un'infrastruttura di rete robusta è cruciale per i deployment on-premise di LLM, migliorando throughput e latenza per carichi di lavoro AI intensivi.

2026-06-01 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

Un LLM da 1 miliardo di parametri sfida i rilevatori AI con testo 'umano'

Un nuovo Large Language Model da 1 miliardo di parametri è stato presentato, dimostrando la capacità di generare testo indistinguibile dalla scrittura umana per i rilevatori di intelligenza artificiale. Questo sviluppo solleva interrogativi sulla validità degli strumenti di rilevamento e sulle implicazioni per la creazione di contenuti, la verifica dell'autenticità e le strategie di deployment on-premise per modelli di dimensioni contenute ma efficaci.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

DLSS 4.5 Ray Reconstruction: a fondo sull'architettura transformer di seconda generazione

L'aggiornamento DLSS 4.5 Ray Reconstruction, previsto per agosto, promette di elevare la qualità visiva del ray tracing. Questa evoluzione si basa su un set di dati di training più ampio e su un'architettura transformer di seconda generazione, fattori chiave per migliorare la fedeltà delle immagini. Per i professionisti IT, queste innovazioni sottolineano la crescente complessità dell'inference AI e la necessità di hardware dedicato, con implicazioni dirette sui deployment on-premise.

2026-06-01 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

PLD Space rafforza l'investimento nel complesso di lancio di Kourou

PLD Space, azienda spagnola specializzata in lanci spaziali, ha annunciato un aumento dell'investimento a 35 milioni di euro per il suo complesso di lancio presso il Centro Spaziale della Guyana a Kourou. L'azienda si posiziona come il primo operatore privato a destinare un capitale di tale portata a questo storico spazioporto, in vista del primo volo del MIURA 5 previsto per il 2026.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Foxconn accelera in Francia: nuovi investimenti in packaging chip e progetti AI

Foxconn sta espandendo le sue operazioni in Francia con due iniziative chiave: una venture per il packaging di chip, denominata Tessalia, e un progetto dedicato all'intelligenza artificiale in collaborazione con Bull. Questa mossa sottolinea l'interesse crescente per la localizzazione della produzione hardware e lo sviluppo di capacità AI, temi centrali per la sovranità tecnicica e i deployment on-premise.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Formosa Plastics Group: nuova rotta su AI, semiconduttori e infrastrutture energetiche

Formosa Plastics Group, tramite il presidente di Nanya Plastics Chia-Chau Wu, sta riorientando le proprie strategie. L'attenzione si sposta verso settori chiave come l'intelligenza artificiale, i semiconduttori e le opportunità legate alle reti energetiche. Questa mossa riflette una tendenza più ampia di diversificazione e investimento in tecnicie abilitanti, cruciale per le aziende che valutano l'evoluzione delle proprie infrastrutture IT e i deployment on-premise di carichi di lavoro AI.

2026-06-01 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

MiniMax: un nuovo LLM in arrivo e le sfide per il deployment on-premise

Un nuovo Large Language Model, MiniMax, è atteso sul mercato tra circa dieci giorni. L'annuncio, diffuso tramite l'account X di MiniMax_AI, solleva interrogativi sui requisiti hardware. La preoccupazione espressa da un utente riguardo alla dimensione del modello rispetto al proprio setup evidenzia le costanti sfide che le aziende affrontano nel gestire LLM sempre più grandi in ambienti self-hosted.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

LianDe Holdings avvia la produzione di massa per il raffreddamento a liquido dei chip USA

LianDe Holdings ha annunciato l'avvio della produzione di massa per i suoi raccordi flottanti a raffreddamento liquido, destinati alla supply chain dei produttori di chip statunitensi. Questa iniziativa evidenzia la crescente importanza delle soluzioni termiche avanzate per gestire la densità di potenza e le prestazioni richieste dai processori di nuova generazione, in particolare per i carichi di lavoro intensivi come i Large Language Models (LLM) in ambienti on-premise.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ DigiTimes

GTC Taipei 2026: L'automazione AI ridefinisce il ruolo del giudizio umano

Al GTC Taipei 2026, NVIDIA ha evidenziato come l'intelligenza artificiale stia automatizzando il proprio sviluppo. Questo cambiamento sposta la domanda verso il giudizio umano, enfatizzando decisioni strategiche su deployment, sovranità dei dati e TCO, specialmente per le architetture on-premise. Le aziende devono ora concentrarsi sulla gestione dell'infrastruttura e sulla governance etica, piuttosto che sulla mera programmazione.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Nvidia Vera Rubin: produzione a pieno regime con 150 fornitori taiwanesi

Nvidia ha confermato che la sua piattaforma Vera Rubin è entrata in piena produzione, supportata da una vasta rete di 150 fornitori taiwanesi. Questo annuncio sottolinea l'impegno dell'azienda nel rafforzare la propria catena di approvvigionamento per le future generazioni di hardware AI, un fattore cruciale per i deployment on-premise e le infrastrutture locali che richiedono controllo e sovranità dei dati.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

NVIDIA Vera: Anthropic, OpenAI e altri tra i primi ad adottare il nuovo processore

NVIDIA ha annunciato a Computex che il suo nuovo processore "Vera", sviluppato internamente, è già in uso presso importanti realtà del settore tech. Tra i primi ad adottarlo figurano Anthropic, OpenAI, SpaceX e Oracle. Questa mossa segna un'espansione strategica per NVIDIA, tradizionalmente leader nelle GPU, verso soluzioni di calcolo più integrate, con implicazioni significative per le infrastrutture AI e i deployment on-premise.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ Tech.eu

hephaistos.bio: 161mila euro per enzimi su misura e manifattura chimica sostenibile

La startup svizzera hephaistos.bio ha ottenuto 161.000 euro da Venture Kick per accelerare lo sviluppo di soluzioni enzimatiche personalizzate. L'azienda sfrutta biologia computazionale e machine learning per creare biocatalizzatori su misura, mirando a rendere la produzione chimica e farmaceutica più efficiente, sostenibile e resiliente. L'obiettivo è supportare il rientro della produzione in Europa, riducendo la dipendenza da catene di approvvigionamento fragili e l'impatto ambientale.

2026-06-01 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

AI-native SaaS: il dibattito tra cloud e on-premise per l'innovazione aziendale

Un recente evento ad Amsterdam ha messo in luce le strategie per il successo nel panorama del SaaS basato sull'AI. Mentre il modello AI-native SaaS offre agilità e scalabilità, le aziende devono valutare attentamente i trade-off rispetto alle soluzioni on-premise. Questioni come la sovranità dei dati, il Total Cost of Ownership e la personalizzazione dell'infrastruttura emergono come fattori critici per CTO e architetti IT che gestiscono carichi di lavoro LLM.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

L'AI ridefinisce il ruolo dei PCB: Zhen Ding osserva un'accelerazione della domanda

Zhen Ding, attore chiave nella produzione di circuiti stampati (PCB), evidenzia come l'intelligenza artificiale stia trasformando il ruolo di questi componenti. L'azienda rileva una crescente domanda, suggerendo un impatto significativo sulla supply chain e sull'infrastruttura hardware necessaria per supportare i carichi di lavoro AI, in particolare per i deployment on-premise.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Compeq prevede una crescita robusta per l'infrastruttura AI tra il 2027 e il 2028

Compeq, attore chiave nella catena di fornitura elettronica, anticipa un'accelerazione significativa dei ricavi e dei profitti tra il 2027 e il 2028. Questa previsione è trainata dalla crescente domanda di infrastrutture dedicate all'intelligenza artificiale, segnalando un periodo di espansione per il settore. Le aziende si preparano a investire in soluzioni hardware e software per supportare carichi di lavoro AI sempre più complessi, con implicazioni dirette per le strategie di deployment on-premise.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Deployment di LLM on-premise: tra sovranità dei dati e ottimizzazione dei costi

La scelta di implementare Large Language Models (LLM) on-premise presenta un equilibrio delicato tra il controllo sui dati e l'ottimizzazione del Total Cost of Ownership (TCO). Le aziende devono valutare attentamente le implicazioni hardware, i requisiti infrastrutturali e le strategie di deployment per garantire sovranità, compliance e performance, bilanciando investimenti iniziali e costi operativi a lungo termine.

2026-06-01 📰 Fonte

📁 Altro AI generated ℹ️ Tech.eu

Revolut, Mistral e Wayve lanciano la campagna 'Built in Europe' per il tech locale

Revolut, Mistral, Wayve ed ElevenLabs, con il supporto di Balderton e oltre 100 leader europei, hanno avviato la campagna 'Built in Europe'. L'iniziativa, dal costo di centinaia di migliaia di sterline, mira a sfidare la percezione che le aziende tecniciche debbano trasferirsi nella Silicon Valley per scalare. Promuove lo sviluppo di startup in Europa, evidenziando il talento, i capitali e l'ecosistema disponibili, anche grazie a fondi come l'EU Scaleup Europe Fund e il UK Sovereign AI fund.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

MiniMax punta a Shanghai dopo il successo a Hong Kong: implicazioni per il mercato AI

La startup cinese MiniMax, attiva nel settore dell'intelligenza artificiale, sta valutando una quotazione sul mercato STAR di Shanghai. Questa mossa segue un notevole incremento del 400% del valore delle sue azioni a Hong Kong in meno di cinque mesi. La decisione riflette una strategia di consolidamento nel mercato interno e sottolinea l'attrattiva degli investimenti nelle aziende AI, con potenziali ripercussioni sulle capacità di sviluppo e deployment di soluzioni LLM.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ The Next Web

Invisix, spin-out di ASML, ottiene 20 milioni per l'ispezione avanzata dei chip

Invisix, una startup nata da ASML, ha raccolto 20 milioni di euro per sviluppare nuove tecnicie di ispezione dei chip. L'obiettivo è superare i limiti degli strumenti ottici tradizionali, incapaci di analizzare le strutture interne dei semiconduttori moderni, sempre più complessi e miniaturizzati. Questa innovazione è cruciale per la produzione di hardware avanzato, fondamentale per i deployment on-premise di carichi di lavoro AI, garantendo qualità e affidabilità del silicio.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ DigiTimes

Delta Electronics: L'AI ridefinisce energia e produzione nei data center

Delta Electronics individua due fattori chiave per la futura competizione nel settore dell'intelligenza artificiale: la trasformazione delle infrastrutture energetiche dei data center e la revisione dei processi produttivi hardware. Questi cambiamenti, guidati dalle crescenti esigenze dei carichi di lavoro AI, avranno un impatto significativo sulle strategie di deployment e sui costi operativi per le aziende che adottano soluzioni di Large Language Models.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tech.eu

Metrologia dei chip: Invisix chiude un round seed da 20 milioni di euro

Invisix, azienda specializzata in metrologia per semiconduttori, ha raccolto 20 milioni di euro in un round seed oversubscribed. L'azienda sviluppa piattaforme di metrologia a raggi X "soft" per misurazioni non distruttive e ad alto volume di strutture complesse nei chip avanzati. Questa tecnicia è cruciale per migliorare la produzione di semiconduttori destinati all'AI e all'High-Performance Computing, affrontando le crescenti sfide poste dalla miniaturizzazione e dalla complessità dei dispositivi.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Nvidia svela la roadmap DGX Spark per PC e laptop: tre generazioni, da Rubin a Rosa Feynman

Nvidia ha presentato a Computex 2026 la roadmap per le sue soluzioni DGX Spark, destinate a laptop e PC desktop. Il piano delinea tre generazioni future, tra cui la piattaforma Rubin, che integrerà memoria LPDDR6, e la successiva Rosa Feynman. Questa iniziativa estende le capacità di calcolo AI di Nvidia a dispositivi client, con un focus sulle prestazioni e l'efficienza per carichi di lavoro locali, includendo la linea RTX Spark.

2026-06-01 📰 Fonte

📁 Altro AI generated ✅ ServeTheHome

Qualcomm al Computex 2026: L'IA Agente e il Futuro dei PC Consumer

Al Computex 2026, Cristiano Amon, CEO di Qualcomm, ha tenuto il suo keynote concentrandosi sull'intelligenza artificiale agente e sull'evoluzione dei PC consumer. L'evento ha offerto uno sguardo sulle direzioni strategiche dell'azienda, con implicazioni significative per l'elaborazione AI distribuita e le architetture on-premise, evidenziando il potenziale per carichi di lavoro AI eseguiti direttamente sui dispositivi.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

USA: Stretta sulle esportazioni di chip Nvidia per le aziende AI cinesi all'estero

Il Dipartimento del Commercio degli Stati Uniti ha introdotto nuove direttive che collegano le regole per le licenze di esportazione alla sede legale di un'azienda, non alla sua posizione fisica. Questa mossa mira a chiudere una falla che per circa un anno ha permesso alle unità estere di aziende AI cinesi di accedere ai processori Nvidia più avanzati, aggirando i controlli statunitensi sulle esportazioni di chip. La misura rafforza le restrizioni esistenti.

2026-06-01 📰 Fonte

📁 Altro AI generated ℹ️ The Next Web

Cina: nuove regole per gli investimenti esteri complicano le acquisizioni AI

La Cina ha formalizzato un nuovo framework normativo per la revisione degli investimenti esteri, rendendo più complesse le acquisizioni transfrontaliere nel settore dell'intelligenza artificiale. Questa mossa codifica l'approccio già adottato dalla Commissione Nazionale per lo Sviluppo e la Riforma (NDRC) per bloccare l'acquisizione di Manus da parte di Meta, evidenziando una crescente attenzione alla tracciabilità tecnicica e alla sovranità.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Computex: CPU e ASIC ridefiniscono l'hardware per l'AI on-premise

Il Computex ha messo in luce l'espansione dell'influenza dell'AI, portando CPU e ASIC al centro della scena hardware accanto alle GPU. Questa evoluzione offre nuove opportunità e sfide per le strategie di deployment on-premise, spingendo CTO e architetti a valutare attentamente i trade-off tra flessibilità, efficienza e TCO per i carichi di lavoro AI, dalla gestione dei Large Language Models (LLM) all'inference su scala.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Meta punta sull'hardware AI: in arrivo pendente e occhiali smart

Meta starebbe pianificando un'espansione significativa nel settore dell'hardware AI, con l'introduzione di un pendente e una roadmap per occhiali smart. Questa mossa suggerisce un'accelerazione verso dispositivi AI edge, potenzialmente in grado di elaborare carichi di lavoro complessi direttamente sul dispositivo. L'iniziativa potrebbe ridefinire l'interazione utente con l'intelligenza artificiale, portando capacità avanzate al di fuori dei tradizionali data center e aprendo nuove frontiere per la sovranità dei dati.

2026-06-01 📰 Fonte

📁 Market AI generated ✅ DigiTimes

Nvidia: la domanda di AI manterrà la fornitura di chip critica oltre il 2027

Nvidia prevede che l'elevata domanda di hardware per l'intelligenza artificiale persisterà, mantenendo la fornitura di chip specializzati estremamente limitata ben oltre il 2027. Questa prospettiva a lungo termine impone ai decision-maker tecnici di riconsiderare le strategie di acquisizione, i piani di deployment on-premise e la gestione del Total Cost of Ownership (TCO) per le infrastrutture AI.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Memoria e AI: i leader del settore si preparano a Computex 2026

I vertici dei principali produttori di memoria si sono riuniti a Taiwan in vista di Computex 2026. L'incontro sottolinea l'importanza crescente della memoria ad alte prestazioni per l'evoluzione dei Large Language Models e le strategie di deployment on-premise. Le decisioni su VRAM e bandwidth influenzeranno direttamente il TCO e la sovranità dei dati per le aziende che sviluppano stack AI locali.

2026-06-01 📰 Fonte

📁 Hardware AI generated ✅ DigiTimes

Otto brand PC adottano Nvidia-MediaTek RTX Spark per i laptop AI di nuova generazione

Otto importanti produttori di PC si sono impegnati a integrare la piattaforma Nvidia-MediaTek RTX Spark nei loro prossimi laptop. Questa mossa segna un passo significativo verso l'adozione diffusa di "AI agent laptops" entro l'autunno, spostando le capacità di intelligenza artificiale direttamente sui dispositivi client e aprendo nuove prospettive per l'elaborazione AI all'edge.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

SoftBank supera Toyota: l'onda dell'AI ridefinisce il mercato giapponese

SoftBank Group ha superato Toyota Motor, diventando l'azienda quotata di maggior valore in Giappone. Questo storico sorpasso, il primo in 23 anni, è stato trainato dalla sua significativa partecipazione in OpenAI e da un Nikkei che ha superato la soglia dei 67.000 punti, evidenziando l'impatto crescente dell'intelligenza artificiale sui mercati finanziari globali.

2026-06-01 📰 Fonte

📁 LLM AI generated ℹ️ LocalLLaMA

NVIDIA presenta Nemotron 3 Ultra: un nuovo orizzonte per i Large Language Models

NVIDIA ha annunciato Nemotron 3 Ultra, una novità che si inserisce nel panorama in rapida evoluzione dei Large Language Models. Questo sviluppo è particolarmente rilevante per le aziende che valutano strategie di deployment on-premise o ibride, ponendo l'accento sulla necessità di infrastrutture robuste e soluzioni che garantiscano sovranità dei dati e controllo sui carichi di lavoro AI.

2026-06-01 📰 Fonte

📁 Hardware AI generated ℹ️ Tom's Hardware

Nvidia svela RTX Spark: un Superchip per PC e laptop con 128GB di memoria unificata

Nvidia ha annunciato il Superchip RTX Spark a Computex 2026, una nuova piattaforma destinata a laptop e desktop. Integrando una CPU Arm e una GPU Blackwell con 128GB di memoria unificata, Nvidia mira a trasformare Windows in un sistema operativo "agentic AI". Questa soluzione promette di portare capacità avanzate di intelligenza artificiale direttamente sui dispositivi locali, offrendo nuove opportunità per l'elaborazione on-premise e la sovranità dei dati.

2026-06-01 📰 Fonte

📁 Market AI generated ℹ️ The Next Web

Balderton lancia "Built in Europe" per rafforzare la fiducia nel tech europeo

Balderton Capital ha avviato la campagna "Built in Europe", sostenuta da fondatori di aziende come Revolut, Mistral e Wayve. L'iniziativa mira a contrastare la percezione che il settore tecnicico europeo sia in ritardo rispetto alla Silicon Valley, nonostante i successi e le opportunità di crescita. L'obiettivo è promuovere una narrativa più positiva e valorizzare l'innovazione locale, evidenziando il potenziale del continente.

2026-06-01 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

Ingegneria dei Dati Autonoma: LLM come Agenti per la Specializzazione dei Modelli

Una nuova ricerca esplora il concetto di Ingegneria dei Dati Autonoma, dove i Large Language Models (LLM) agiscono come agenti per curare e ottimizzare i dati di training. L'obiettivo è superare le difficoltà degli LLM nell'adattarsi a domini specializzati. Gli esperimenti dimostrano che un LLM autonomo può migliorare significativamente le performance di un modello studente, con un incremento del 57,29% ottenuto tramite adattamento iterativo dei dati.

2026-06-01 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.CL

Valutazione di ChatGPT: un protocollo RAG con LLM open source contro le allucinazioni

Un nuovo protocollo propone un metodo rigoroso per valutare la capacità di ChatGPT di generare associazioni biomediche. Il processo include la validazione delle entità tramite ontologie e la verifica con la letteratura scientifica. Per migliorare l'affidabilità, il protocollo introduce una strategia di auto-consistenza e un workflow di verifica semantica basato su Retrieval-Augmented Generation (RAG). Quest'ultimo sfrutta Large Language Models (LLM) open source per stabilire la veridicità dei contenuti generati da altri LLM, offrendo uno strumento efficace per identificare le allucinazioni.

2026-06-01 📰 Fonte

📁 Frameworks AI generated 🏆 ArXiv cs.LG

Gait2Hip-60: Deep Learning per la Previsione delle Dinamiche dell'Anca nella Deambulazione

Uno studio ha sviluppato un framework di deep learning per prevedere le forze muscolari e i momenti articolari dell'anca direttamente dalla cinematica della deambulazione. Confrontando modelli come LSTM, Transformer e Mamba, il Transformer ha dimostrato la migliore performance su soggetti sani e una moderata capacità predittiva in validazione esterna su pazienti. I risultati aprono nuove prospettive per l'applicazione clinica, sottolineando l'importanza di un'ulteriore validazione e generalizzazione.

2026-06-01 📰 Fonte

📁 LLM AI generated 🏆 ArXiv cs.LG

QASM-Eval: Addestrare LLM per la programmazione quantistica hardware-oriented

Il dataset QASM-Eval mira a colmare una lacuna nell'addestramento degli LLM per la programmazione quantistica. Si concentra sulle funzionalità hardware-oriented di OpenQASM-3, cruciali nell'era NISQ. Con set di training e test verificati, QASM-Eval permette di migliorare significativamente le performance degli LLM nella generazione di codice per il controllo preciso dei sistemi quantistici, offrendo una base per assistenti affidabili in questo campo emergente.

2026-06-01 📰 Fonte

← Precedente Page 71 / 123 Successiva →

Vedi Archivio Completo 🗄️

AI-Radar is an independent observatory covering AI models, local LLMs, on-premise deployments, hardware, and emerging trends. We provide daily analysis and editorial coverage for developers, engineers, and organizations exploring local AI solutions.

LAUNCHING SOON ON LaunchTry

AI-Radar - Osservatorio su LLM locali, hardware AI e trend

AI-Radar per LLM on-prem & AI in casa

Il Segnale del Giorno

Quantization statisticamente lossless: il trade-off che cambia le regole dell’on-premise

⚡ In Tendenza

🛠️ Guide &amp; Osservatorio On-Premise

Ultime analisi & news dal radar

🛠️ Guide & Osservatorio On-Premise